## 문제 06. 실패율
### 문제
슈퍼 게임 개발자 오렐리는 큰 고민에 빠졌다. 그녀가 만든 프랜즈 오천성이 대성공을 거뒀지만, 요즘 신규 사용자의 수가 급감한 것이다. 원인은 신규 사용자와 기존 사용자 사이에 스테이지 차이가 너무 큰 것이 문제였다.

이 문제를 어떻게 할까 고민 한 그녀는 동적으로 게임 시간을 늘려서 난이도를 조절하기로 했다. 역시 슈퍼 개발자라 대부분의 로직은 쉽게 구현했지만, 실패율을 구하는 부분에서 위기에 빠지고 말았다. 오렐리를 위해 실패율을 구하는 코드를 완성하라.

실패율은 다음과 같이 정의한다.
- 스테이지에 도달했으나 아직 클리어하지 못한 플레이어의 수 / 스테이지에 도달한 플레이어 수

전체 스테이지의 개수 N, 게임을 이용하는 사용자가 현재 멈춰있는 스테이지의 번호가 담긴 배열 stages가 매개변수로 주어질 때, 실패율이 높은 스테이지부터 내림차순으로 스테이지의 번호가 담겨있는 배열을 return 하도록 solution 함수를 완성하라.

### 제한사항
- 스테이지의 개수 N은 1 이상 500 이하의 자연수이다.
- stages의 길이는 1 이상 200,000 이하이다.
- stages에는 1 이상 N + 1 이하의 자연수가 담겨있다.
    - 각 자연수는 사용자가 현재 도전 중인 스테이지의 번호를 나타낸다.
    - 단, N + 1 은 마지막 스테이지(N 번째 스테이지) 까지 클리어 한 사용자를 나타낸다.
- 만약 실패율이 같은 스테이지가 있다면 작은 번호의 스테이지가 먼저 오도록 하면 된다.
- 스테이지에 도달한 유저가 없는 경우 해당 스테이지의 실패율은 0 으로 정의한다.

In [17]:
## 나의 풀이 : 시간복잡도 O(N^2+2*NlogN)
from collections import Counter

def solution(N, stages):
    counts = Counter(stages)
    for i in range(1, N+1):
        # 클리어하지 못한 사람의 수 구하기 
        not_clear = counts[i]
        # 도전한 사람의 수 구하기 
        try_num = 0
        for j in range(i, max(counts)+1):
            try_num += counts[j]
        # 실패율 구하기
        try:
            counts[i] = not_clear/try_num
        except:
            counts[i] = 0
            
    counts[N+1] = -1
    ## 실패율이 높은 스테이지부터 N개 출력
    counts = sorted(counts.items(), key = lambda x : x)  # key 순으로 정렬 
    answer = sorted(dict(counts).items(), key = lambda x: x[1], reverse = True)
    answer = list(dict(answer).keys())[:N]
    
    return answer

In [18]:
## test 1 
N = 5
stages = [2, 1, 2, 6, 2, 4, 3, 3]

solution(N, stages)

[3, 4, 2, 1, 5]

In [19]:
## test 2
N = 4
stages = [4,4,4,4,4]

solution(N, stages)

[4, 1, 2, 3]

## 책 풀이법
- stages가 20만까지 입력될 수 있으므로 시간 초과를 방지하기 위해서 시간 복잡도는 O(NlogN)이여야 한다. 시간 복잡도가 O(N^2)이면 시간 초과가 발생할 수 있다. 
- 정렮 문제는 정렬 구현을 시간들여 고민하는 대신 파있너 제공 함수를 바로 사용해보는 것도 좋다
- N(스테이지의 개수), M(stages의 길이)라고 할 때, 최종 시간 복잡도는 O(M+NlogN)
    - 도전자 수를 계산할 때의 시간 복잡도 : O(N+M)
    - 스테이지별 실패율 계산할 때의 시간 복잡도 : O(N)
    - 실패율을 기준으로 스테이지를 정렬할때의 복잡도 : O(2*N+M+NlogN)

In [7]:
def solution(N, stages):
    # 스테이지별 현재 도전중인 도전자 수를 구함
    challenger = [0] * (N+2)
    for stage in stages:
        challenger[stage] += 1
        
    # 스테이지별 실패한 사용자 수 계산
    fails = {}
    total = len(stages)
    
    # 각 스테이지를 순회하며, 실패율 계산
    for i in range(1, N+1):
        if challenge[i] == 0:  # 도전한 사람이 없는 경우 실패율은 0
            fails[i] = 0
        else:
            fail[i] = challenger[i] / total  # 실패율 구함
            total -= challenger[i]  # 다음 스테이지 실패율을 구하기 위해 현재 스테이지의 인원을 뺌
    
    # 실패율이 높은 스테이지부터 내림차순으로 정렬
    result = sorted(fails, key=lambda x:fails[x], reverse=True)
    
    return result

In [20]:
## test 1 
N = 5
stages = [2, 1, 2, 6, 2, 4, 3, 3]

solution(N, stages)

[3, 4, 2, 1, 5]

In [21]:
## test 2
N = 4
stages = [4,4,4,4,4]

solution(N, stages)

[4, 1, 2, 3]