## 해시 테이블의 기본 원리


키(key)	값(value)
"a"	"apple"
"b"	"banana"
"c"	"cherry"

* 해시 함수는 키의 아스키 코드를 테이블의 크기(3)로 나눈 나머지를 구하는 함수라고 하자

* “a” → 해시 함수(97 % 3) → 1(인덱스)
* “b” → 해시 함수(98 % 3) → 2
* “c” → 해시 함수(99 % 3) → 0

#### 특징

키가 달라도 해시 값이 같을 때가 있는데 이걸 충돌이라고 한다.
* 분리 연결법:충돌한 키의 자료를 연결 리스트로 저장
* 개방 주소법:충돌할 때 다음 빈자리를 찾아 자료를 저장

* 장점 : 검색 읽기 저장이 빠르다, 중복 되는지 확인하기가 쉽다
* 단점 : 저장공간이 더 필요하다. 충돌을 해결할 방법이 필요하다.

In [6]:
class Hash_table:
    def __init__(self, length = 5):
        self.max_len = length
        self.table = [[] for _ in range(self.max_len)]
        
    def hash(self, key):
        res = sum([ord(s) for s in key])
        return res % self.max_len
    
    def set(self, key, value):
        index = self.hash(key)
        self.table[index].append((key,value))
        
    def get(self,key):
        index = self.hash(key)
        value = self.table[index]
        if not value:
            return None
        for v in value:
            if v[0] == key:
                return v[1]

In [8]:
if __name__ == "__main__":
    capital = Hash_table()
    country = ["Korea", "America", "China", "England", "Türkiye"]
    city = ["Seoul", "Washington", "Beijing", "London", "Ankara"]
    for co, ci in zip(country, city):
        capital.set(co, ci)

    print("해시 테이블의 상태")
    print("===============")
    for i, v in enumerate(capital.table):
        print(i, v)
    print()
    print("해시 테이블의 검색 결과")
    print("====================")
    print(f"Captial of America = {capital.get('America')}")
    print(f"Captial of Korea = {capital.get('Korea')}")
    print(f"Captial of England = {capital.get('England')}")
    print(f"Captial of China = {capital.get('China')}")
    print(f"Captial of Japan = {capital.get('Japan')}")
    print(f"Captial of Türkiye = {capital.get('Türkiye')}")

해시 테이블의 상태
0 [('America', 'Washington')]
1 []
2 [('England', 'London')]
3 [('Korea', 'Seoul'), ('China', 'Beijing')]
4 [('Türkiye', 'Ankara')]

해시 테이블의 검색 결과
Captial of America = Washington
Captial of Korea = Seoul
Captial of England = London
Captial of China = Beijing
Captial of Japan = None
Captial of Türkiye = Ankara


In [11]:
class Hash_table2(Hash_table):
    def __init__(self, length = 5):
        self.max_len = length
        self.table = [[] for _ in range(self.max_len)]
        
    def hash(self,key):
        return hash(key) % self.max_len
    
if __name__ == "__main__":
    capital = Hash_table2()
    country = ["Korea", "America", "China", "England", "Türkiye"]
    city = ["Seoul", "Washington", "Beijing", "London", "Ankara"]
    for co, ci in zip(country, city):
        capital.set(co, ci)

    print("해시 테이블의 상태")
    print("===============")
    for i, v in enumerate(capital.table):
        print(i, v)
    print()
    print("해시 테이블의 검색 결과")
    print("====================")
    print(f"Captial of America = {capital.get('America')}")
    print(f"Captial of Korea = {capital.get('Korea')}")
    print(f"Captial of England = {capital.get('England')}")
    print(f"Captial of China = {capital.get('China')}")
    print(f"Captial of Japan = {capital.get('Japan')}")
    print(f"Captial of Türkiye = {capital.get('Türkiye')}")

해시 테이블의 상태
0 [('England', 'London')]
1 []
2 [('America', 'Washington'), ('Türkiye', 'Ankara')]
3 [('Korea', 'Seoul')]
4 [('China', 'Beijing')]

해시 테이블의 검색 결과
Captial of America = Washington
Captial of Korea = Seoul
Captial of England = London
Captial of China = Beijing
Captial of Japan = None
Captial of Türkiye = Ankara


### 문자열의 가장 먼저 나오는 유일한 문자 찾기

주어진 문자열에서 반복되지 않는 문자 중 가장 먼저 나오는 문자의 인덱스를 출력하라. 모든 문자가 중복되면, -1을 출력하라.

예시

* 입력: leetcode, 출력: 0
* 입력: loveleetcode, 출력: 2
* 입력: aabb, 출력 -1

In [None]:
def first_unique_char(s):
    n = len(s)
    check = [0] * n
    for i, ch in enumerate(s):
        if check[i]:
            continue
        check[i] = 1
        is_unique = True
        for j in range(i+1, n):
            if ch == s[j]:
                check[j] = 1
                is_unique = False
                break
        if is_unique:
            return i
    return -1

In [14]:
 def first_unique_char_dic(s):
    count = {}
    for ch in s:
        if ch not in count:
            count[ch] = 1
        else:
            count[ch] += 1
    for i, c in enumerate(s):
        if count[c] == 1:
            return i
    return -1

In [15]:
from collections import Counter

def first_unique_char_dic2(s):
    count = Counter(s)
    for i, ch in enumerate(s):
        if count[ch] == 1:
            return i
    return -1