## Hash

해시란 **'임의의 길이를 갖는 데이터를 고정 길이를 갖는 데이터(값)으로 매핑하는 것'** 을 의미한다.

## Hash Function

해시 함수는 **'임의의 길이를 갖는 데이터를 고정 길이를 갖는 데이터(값)으로 매핑하는 함수'** 라고 할 수 있다.

이때, 매핑 전 원래 데이터의 값을 **키(Key)**, 매핑 후 데이터의 값을 **해시 값(Hash value)**, 매핑하는 과정 자체는 **해싱(Hashing)** 이라고 한다.

## Hash Table

해시 함수를 사용해 키를 해시 값으로 매핑하고, 이 해시 값을 색인(index) 혹은 주소 삼아 데이터의 값(value)을 키와 함께 저장하는 자료구조를 해시 테이블이라고 한다.

![image.png](attachment:image.png) 
https://commons.wikimedia.org/wiki/File:Hash_table_3_1_1_0_1_0_0_SP.svg

16명의 사람들의 이름을 key로 사용하여 전화번호를 value로 저장하는 해시 테이블 구조를 만든다고 생각해보자. 

John Smith(key)의 전화번호(value) 저장할 때, **hash_function("John Smith") % 16** 을 통해서 색인(index) 혹은 주소 값을 구해내고,

buckets[index]에는 John Smith의 전화번호인 "521-8976"을 저장한다.



이러한 형식으로 데이터를 저장하면, key에 대한 value/data를 찾을 때(search), 

hash_function을 한 번만 수행하면 array(bucktes)내에 저장된 value의 index를 찾아낼 수 있기 때문에 

**탐색(search), 삽입(insert) 그리고 삭제(delete)연산** 이 매우 빠르다. -> **O(1)**

이는 선형 자료구조가 갖는 연산 O(n)보다 훨씬 빠르다고 볼 수 있다.

탐색(search) : 해시 함수를 사용, 인덱스로 값을 탐색 -> O(1)

삽입(insert) : 해시 함수를 통해 인덱스(주소/위치)가 정해짐 -> O(1)

삭제(delete) : 인덱스와 인덱스에 해당하는 값만 지우면 됨 (순서 정리 필요 x) -> O(1)

## Pros.

1. 적은 자원으로 많은 데이터를 효율적으로 관리할 수 있다.
2. 검색, 삽입, 삭제 연산이 빠르다.
3. 보안성이 좋다.
4. 중복 제거에 용이하다.

## Cons.
1. 해시 충돌 가능성이 있다.
2. 공간 복잡도가 증가한다.
3. 해시 함수에 대한 의존도가 증가한다.

## Dictionary

Python의 Dictionary가 Hash Table을 활용한 예이다. 

Dictionary는 키(key)와 값(value)이 하나의 쌍으로서 대응 관계를 가지는 자료형이다.

이러한 특징으로, 저장된 순서와 상관없이 key를 이용해서 바로 value에 접근이 가능하다.

### Dictionary 선언

In [1]:
# Empty Dictionary

# 중괄호 이용
_dict = {}

# dict() 함수 이용 : 생성자
_dict = dict()

In [2]:
# Dictionary with element

# _dict = { key : value } 
fruits = {'apple':'red', 'banana':'yellow', 'grape':'purple'}

print(type(fruits))
print(fruits)

print()

# _dict = dict({key : value, ...})
fruits2 = dict({'apple':'red', 'banana':'yellow', 'grape':'purple'})

print(type(fruits2))
print(fruits2)


<class 'dict'>
{'apple': 'red', 'banana': 'yellow', 'grape': 'purple'}

<class 'dict'>
{'apple': 'red', 'banana': 'yellow', 'grape': 'purple'}


In [3]:
# dict.fromkeys(sequence, val)
# -> 사전에 정의된 일련의 요소(list)를 인자로 전달 받고, 이를 key로 사용하는 dict를 반환
# -> val 인자를 통해 모든 key에 대한 value를 설정할 수 있으며, default는 None이다.

coffee = ['espresso','americano','latte','flatwhite']
cafe = dict.fromkeys(coffee) 

print(type(cafe))
print(cafe)

print()

coffee = ['espresso','americano','latte','flatwhite']
cafe2 = dict.fromkeys(coffee, 5000) # 모든 key에 동일한 값(5000) 적용

print(type(cafe2))
print(cafe2)

<class 'dict'>
{'espresso': None, 'americano': None, 'latte': None, 'flatwhite': None}

<class 'dict'>
{'espresso': 5000, 'americano': 5000, 'latte': 5000, 'flatwhite': 5000}


In [4]:
# List as element
# list를 value로 저장 가능.

lst1 = [0,1,2,3]
lst2 = ['a','b','c','d']
lst3 = ['A','B','C','D']

char = {
    'digit':lst1,
    'lowercase' : lst2,
    'uppercase' : lst3
}

print(type(char))
print(char)

<class 'dict'>
{'digit': [0, 1, 2, 3], 'lowercase': ['a', 'b', 'c', 'd'], 'uppercase': ['A', 'B', 'C', 'D']}


### Methods and Keyword

#### in 
Dictionary에 해당 키가 있는지 

In [5]:
fruits = {'apple':'red', 'banana':'yellow', 'grape':'purple'}

if 'apple' in fruits:
    print('apple is in fruits')
else :
    print('apple is not in fruits')

if 'pencil' in fruits:
    print('pencis is in fruits')
else : 
    print('pencil is not in fruits')

apple is in fruits
pencil is not in fruits


#### keys()
Dictionary의 key 반환

In [6]:
fruits = {'apple':'red', 'banana':'yellow', 'grape':'purple'}

print(fruits.keys())

for key in fruits.keys():
    print(key)

dict_keys(['apple', 'banana', 'grape'])
apple
banana
grape


#### values()
Dictionary의 value 반환

In [7]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}

print(coffee.values())

for value in coffee.values():
    print(value)

dict_values([4000, 4500, 5000, 5000])
4000
4500
5000
5000


#### items()
Dictionary의 (key,value) 반환 : tuple로 반환

In [8]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}

print(coffee.items())

for item in coffee.items():
    print(item)

dict_items([('espresso', 4000), ('americano', 4500), ('latte', 5000), ('flatwhite', 5000)])
('espresso', 4000)
('americano', 4500)
('latte', 5000)
('flatwhite', 5000)


#### get()
Dictionary의 key로 value 가져오기

해당 key가 존재하지 않는 경우 None 반환

In [9]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}

print(coffee.get('americano'))

print(coffee.get('cappuccino'))

4500
None


#### del
Dictionary에서 (key,value) 한 쌍 지우기

del은 함수가 아닌 **키워드**

In [10]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}

print(coffee)

del coffee['espresso']
print(coffee)

# del coffee['cappuccino'] # KeyError : 존재하지 않는 키

{'espresso': 4000, 'americano': 4500, 'latte': 5000, 'flatwhite': 5000}
{'americano': 4500, 'latte': 5000, 'flatwhite': 5000}


#### pop()
Dictionary에서 key에 대응되는 value를 반환 후, 해당 (key, value) 쌍 삭제

In [11]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}
print(coffee)

print(coffee.pop('flatwhite'))
print(coffee)

{'espresso': 4000, 'americano': 4500, 'latte': 5000, 'flatwhite': 5000}
5000
{'espresso': 4000, 'americano': 4500, 'latte': 5000}


#### clear()
Dictionary내 모든 (key, value) 쌍 지우기, 초기화

In [12]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}
print(coffee)

coffee.clear()
print(coffee)

{'espresso': 4000, 'americano': 4500, 'latte': 5000, 'flatwhite': 5000}
{}


#### sorted() -> list
Dictionary 정렬

In [4]:
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}
print(coffee)

print()

# key값만 정렬
print(sorted(coffee))

{'espresso': 4000, 'americano': 4500, 'latte': 5000, 'flatwhite': 5000}

['americano', 'espresso', 'flatwhite', 'latte']


In [8]:
# key를 기준으로 (key:value) 쌍이 정렬 
print(type(sorted(coffee.items())))
print(sorted(coffee.items()))
print()
# sorted()함수의 경우 return type이 list이므로 dict로 사용하고 싶다면 dict()로 묶어주어야 한다.
print(type((dict(sorted(coffee.items())))))
print(dict(sorted(coffee.items())))

<class 'list'>
[('americano', 4500), ('espresso', 4000), ('flatwhite', 5000), ('latte', 5000)]

<class 'dict'>
{'americano': 4500, 'espresso': 4000, 'flatwhite': 5000, 'latte': 5000}


In [11]:
# value 기준 정렬
coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}

# 오름차순
sorted_coffee = dict(sorted(coffee.items(), key=lambda x:x[1], reverse=False))
print(sorted_coffee)

# 내림차순
sorted_coffee = dict(sorted(coffee.items(), key=lambda x:x[1], reverse=True))
print(sorted_coffee)

{'espresso': 4000, 'americano': 4500, 'latte': 5000, 'flatwhite': 5000}
{'latte': 5000, 'flatwhite': 5000, 'americano': 4500, 'espresso': 4000}


In [3]:
# 다중조건 정렬
# 참고 문항 TableHashFunction #147354

coffee = {'espresso':4000, 'americano':4500, 'latte':5000, 'flatwhite':5000}

# value(가격)를 기준으로 오름차순 정렬, 가격이 같다면 key(메뉴)를 기준으로 오름차순 정렬
multi_cond_sort = dict(sorted(coffee.items(), key=lambda x: (x[1], x[0])))
print(f"Before sorting: {coffee}")
print(f"After sorting: {multi_cond_sort}")

Before sorting: {'espresso': 4000, 'americano': 4500, 'latte': 5000, 'flatwhite': 5000}
After sorting: {'espresso': 4000, 'americano': 4500, 'flatwhite': 5000, 'latte': 5000}
