# 2. 해시 

- 해시는 해시함수를 통해 인덱스를 구성하고 이 인덱스로 직접 검색할 수 있는 방식
- 파이쎤은 기본 자료구조로 dict를 제공

##  2.1 dict 자료구조
- 키와 값을 가지고 처리하는 클래스
- 검색은 대괄호를 사용
- 내부의 원소들을 키, 값, 키와 값으로 조회가 가능

In [1]:
wintable = {
    '가위' : '보',
    '바위' : '가위',
    '보' : '바위',
}

print('### 딕셔너리의 키를 가지고 값을 선택 ###')
print(wintable['가위'])


print('### 딕셔너리의 키 ###') 
for key in wintable.keys(): # keys() 생략 가능
    print(key)
    
print('### 딕셔너리의 값 ###') 
for value in wintable.values():
    print(value)
    
print('### 딕셔너리의 키와 값 ###')
for key, value in wintable.items():
    print(f'{key}은 {value} 이다')

### 딕셔너리의 키를 가지고 값을 선택 ###
보
### 딕셔너리의 키 ###
가위
바위
보
### 딕셔너리의 값 ###
보
가위
바위
### 딕셔너리의 키와 값 ###
가위은 보 이다
바위은 가위 이다
보은 바위 이다


## 2.2 딕셔너리 검색

In [2]:
dd = dict([('김성철',30),('고성철',40)])

In [3]:
dd

{'김성철': 30, '고성철': 40}

In [4]:
try :
    dd['최성철']
except Exception as e :
    print(" 검색 오류 ")
    print(e)

 검색 오류 
'최성철'


### 해시의 충돌
- 동일한 키일 경우 값만 변경 처리

In [5]:
dd['김성철'] = 100

In [6]:
dd

{'김성철': 100, '고성철': 40}

### 키가 없는 경우 디폴드값 처리

-  내부 값은 변경되지 않음

In [7]:
dd.get('홍성철', 50)

50

In [8]:
dd

{'김성철': 100, '고성철': 40}

### 키가 없는 경우 내부 키와 값을 처리

- 기존에 있으면 변경하지 않음 

In [9]:
dd.setdefault('홍성철', 50)

50

In [10]:
dd.setdefault('홍성철', 99)

50

In [11]:
dd

{'김성철': 100, '고성철': 40, '홍성철': 50}

### 검색결과 에러를 방지하는 클래스 사용

In [12]:
from collections import defaultdict

In [13]:
a = defaultdict(int)

In [14]:
a['김성철']

0

## 2.3 특정 참가자 중에 완주하지 못한 사람을 찾기 

- 참가자와 완주자를 지정
- 함수의 매개변수에는 참가자, 완주자, 미완주자에 대한 출력명수

In [15]:
participant = ['김철수', '홍길동','임종문']
completion = ['임종문']

In [16]:
def solution(participant,completion, n):
    d  = {} # 빈 사전을 만들고
    for x in participant :
        d.setdefault(x,0)
        d[x] +=  1
        # 처음 등장하면 1로 만들고, 처음 등장한게 아니면, 원래 있던 value에 1을 더해줌
    for x in completion:
        d[x] -=1
    # 완주하지 못한 사람 추출
    dnf = [k for k, v in d.items() if v >0]
    answer = dnf[:n]
    return answer

In [17]:
%timeit solution(participant, completion, 2)

1.17 µs ± 28.5 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [18]:
solution(participant, completion, 2)

['김철수', '홍길동']

### in 사용 

- 센치미터(cm:10-2m), 밀리미터(mm: 10-3m), 마이크로미터(μm: 10-6m),
- 나노미터(nm:10-9m), 옹스트롬(Å: 10-10m), 피코미터(pm: 10-12m)

In [19]:
def solution1(participant, completion,n):
    dnf =[]
    for i in range(len(participant)):
        if participant[i] not in completion :
            dnf.append(participant[i])
    return dnf[:n]

In [20]:
%timeit solution1(participant, completion, 2)

672 ns ± 9.72 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [21]:
solution1(participant, completion,2)

['김철수', '홍길동']

### Counter 클래스를 사용해서 간단하게 구하기

- Counter 클래스는 키의 개수를 값으로 가짐
- 키를 기반으로 산술연산이 가능

In [22]:
from collections import Counter

In [23]:
def solution_(participant,completion, n):
    par = Counter(participant)
    com = Counter(completion)
    par -= com 
    # 단 한명만 완주하지 못했으므로, 그리고 그게 1명이라고 했으므로
    dnf = [k for k, v in par.items() if v >0]
    answer = dnf[:n]
    return answer

In [24]:
%timeit solution_(participant, completion, 2)

5.31 µs ± 190 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


In [25]:
solution_(participant, completion, 2)

['김철수', '홍길동']