<a href="https://colab.research.google.com/github/choi-yh/Algorithm/blob/master/5_1_Hash_Table.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

* $O(1)$ 의 자료구조. 자료구조이자 알고리즘이다.  
* 파이썬에서의 key와 value로 구성된 딕셔너리 자료구조이다.  

* 해시 테이블의 활용: 탬색시 동일한 시간의 응답이 필요한 경우  
    * url : address
    * 바코드 : {상품번호, 상품명, 가격}  
    * 캐시메모리  

* 해시 테이블의 ***충돌*** : 두 개의 서로 다른 key가 같은 값을 반환하는 경우  
    * 연결리스트를 사용한다.  
        * 노드의 추가나 삭제가 유용하다. (노드에 key와 value 저장 + link)  
        * 연결 리스트가 길어지게 되면 탐색시간이 증가한다.  
        * key에 해당된 연결리스트의 길이차이가 많이 나게 되면 탐색시간의 표준편차가 증가한다. (안정된 성능 보장이 힘들다.)  
    
    1. 테이블을 연결리스트가 n개인 리스트로 만든다.  
    2. 키를 숫자로 바꿔 n으로 나눈 나머지 값 위치에 key와 value를 가진 노드를 삽입한다.  
    
* 좋은 해시함수란? : 충돌을 최소화 하면서 탐색시간의 표준편차를 줄이는 함수  
    * **사용률(load factor)** = 항목의 수 / 해시 테이블의 공간 수 (좋은 해시함수의 척도)
    
* 보통 Array의 크기를 데이터 수의 3배 정도로 한다.

* 많이 사용되는 해시함수

    * $H = h(M)$ (h: 해시함수, M: 입력, H: 출력)  
    * 임의의 길이의 입력에 대해 고정된 길이의 출력을 내보낸다.  
    * 동일한 입력에 대해 동일한 출력을 보장한다.  
    * 다른 입력이지만 같은 출력이 가능할 수 있는데 이러한 가능성이 작아야 한다.  
    * 원본 데이터에 아주 작은 변화만 있어도 완전히 다른 해시값을 출력한다. (파일 위변조 비교)  
    * 암호화에 쓰이는 해시함수는 H로부터 M을 복호화가 불가능  
    * 응용분야 : 패스워드 암호화, 원본 인증, 블록체인 정보 비교 등  

### Linked List를 통한 해시테이블 구현

In [1]:
# Linked List 작성

class Node:
    def __init__(self, key=None, value=None):
        self.key = key
        self.value = value
        self.link = None
        
class LinkedList:
    def __init__(self):
        self.root = Node()
        
    def append(self, key, value):
        newNode = Node(key, value)
        curNode = self.root
        cnt = 0
        if self.root.key == None:
            self.root = newNode
        else:
            curNode = self.root
            while curNode.link != None:
                cnt += 1
                curNode = curNode.link
            curNode.link = newNode
        return cnt
            
    def delete(self, key):
        curNode = self.root
        if self.root.key == key:
            self.root = self.root.link
        else:
            while curNode.link != None:
                preNode = curNode
                curNode = curNode.link
                if curNode.key == key:
                    preNode.link = curNode.link
                
    def get(self, key):
        curNode = self.root
        cnt = 0
        while curNode.key != key:
            cnt += 1
            curNode.link = curNode
        if curNode.key == key:
            return curNode.value, cnt
        else:
            return None
        
    def print(self):
        curNode = self.root
        while curNode.link != None:
            print([curNode.key, curNode.value], end='-')
            curNode = curNode.link
        print([curNode.key, curNode.value])
        
a = LinkedList()
a.append('love','사랑')
a.append('hate','미움')
a.append('man','남자')
a.append('woman','여자')
#a.delete('woman')
a.print()

['love', '사랑']-['hate', '미움']-['man', '남자']-['woman', '여자']


In [0]:
class Dic:
    def __init__(self, n):
        self.n = n
        self.table = [LinkedList() for _ in range(n)]
        
    def _str2int(self, a):
        num = 0
        for i in range(len(a)):
            num += ord(a[i])
        return num
    
    def add(self, key, value):
        _tmp = self._str2int(key) % self.n
        return self.table[_tmp].append(key, value)  # 여기서 return은 왜? - cnt가 나오는거 같은데...
    
    def getValue(self, key):
        _tmp = self._str2int(key) % self.n
        return self.table[_tmp].get(key)
    
    def delete(self, key):
        _tmp = self._str2int(key) % self.n
        self.table[_tmp].delete(key)

In [3]:
from google.colab import drive
drive.mount('/gdrive')

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3Aietf%3Awg%3Aoauth%3A2.0%3Aoob&scope=email%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdocs.test%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive.photos.readonly%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fpeopleapi.readonly&response_type=code

Enter your authorization code:
··········
Mounted at /gdrive


In [4]:
import csv

f = open('/gdrive/My Drive/Python/알고리즘/data/price.csv', 'r')
csvReader = csv.reader(f)

priceTable = Dic(58)
for row in csvReader:
    priceTable.add(row[0], row[1])
    
print(priceTable.getValue('참이슬 병소주(360㎖)-참이슬'))
print(priceTable.getValue('버섯감치미(300g)-버섯감치미'))

(' 1190 ', 0)
(' 4600 ', 0)
