### 완주하지 못한 선수

- 알고리즘 문제의 "데이터 표현", "알고리즘 선택"이 관건
- 문제의 크기 지배, 제약 조건 등을 파악하는 것이 중요

#### 1. 지문 이해

- 제한사항
 1) participant : 1 이상 100,000명 이하 => n이라고 할때 n or nlogn 시간 복잡도를 선택
 2) completion : participant-1
 3) 참가자의 이름은 1개 이상 20개 이하의 알파벳 소문자
 4) 참가자 중 동명이인 존재 

- 제한사항 기반으로 고려해야 하는 점  
1) 완주하지 못한 선수가 동명이인이 존재하지 않는 경우 => 차집합  
2) 완주하지 못한 선수가 동명이인인 경우 => 동명이인의 사람 수 차이(participant:3명 -> completion:2명)  

- 즉, 사람 이름(문자열)을 다루어 문제 해결 : Hash

#### 2. 자료구조의 선택
- 적용할 알고리즘에 따라 자료구조를 선택
- 만약 이름 대신 번호(Index)가 주어졌다면?   
  : 선형배열 저장가능 BUT 문자의 가능한 모든 조합의 배열을 두면, 시간 복잡도↑
- 번호 말고 다른 것으로 접근할 수 있는 자료구조?

##### Hash(해쉬)

- mapping : 문자열(키:key) - 해시테이블(hash table) 
- hash function : mapping을 위한 도구
- hash bucket : hash table의 각 요소 (버킷의 수가 많을수록 서로 다른 키가 다른 버킷에 저장 가능)


![image.png](attachment:image.png)

- 충돌(collision) : 서로 다른 key가 같은 hash bucket에 저장된는 경우
- 해결 방법 : hash function 생성 시, 옆으로 저장함으로써 충돌 방지

#### 3. 문제 풀이

- dictionary(사전) 이용
- 사전은 사전의 원소들을 해시로 이용해 O(1) 시간에 접근 가능

- Try

In [None]:
# 기존 문제 풀이
def solution(participant, completion):
    
    for i in completion:
        participant.remove(i)
    
    answer = participant[0]
    return answer


# 강의 수강 후 Retry
def solution(participant, completion):
    
    dict = {}
    for i in participant:
        if i in dict:
            dict[i] += 1
        dict[i] = 1

    for j in completion:
        dict[j] -= 1
    
    answer = [i for i in dict if dict[i]==1]
    return answer

- 강사의 풀이

In [None]:
# 강사의 풀이
def solution(participant, completion):
    
    d = {}
    for x in participant:
        # get method를 통해 자료 입력 
        # get : dictionary에 x가 존재하면 x의 값을, 없다면 0을 반환
        d[x] = d.get(x, 0) + 1
    
    for x in completion:
        d[x] -= 1

    # dictionary.items() => key와 value를 반환
    dnf = [k for k,v in d.items() if v !=0]
    answer = dnf[0]
    return answer

- 복잡도 문제   
: participant 원소 길이 + competion 원소 길이 + dictionary 저장된 원소 길이  
: 3*participant 원소길이 (O(n) 시간 복잡도)

- 또 다른 문제 풀이   
: 문자열 정렬을 이용하여, 차이가 날때 완주하지 못한 선수 발견

In [None]:
def solution(participant, completion):
    # 정렬 => nlogn 시간 복잡도 
    participant.sort()
    completion.sort()

    for i in range(len(completion)):
        if participant[i]!=completion[i]:
            return participant[i]