## 키와 값의 쌍, Dictionary
- 사전(dictionary)은 키와 값의 쌍을 저장하는 대용량의 자료구조
- 해시 알고리즘을 사용하여 일대일로 대응되는 특성이 있어 **맵**이라고도 부르고 관련된 키와 값의 쌍이라고 해서 **연관배열**이라고도 부름
- 키는 값을 찾는 기준이기 때문에 중복되지 않는 고유의 값을 가져야 하지만 값은 중복되어도 상관 없음
- **키는 읽기 전용이어서 변경할 수 없으며 그래서 튜플은 키로 쓸 수 있지만 리스트는 불가**
- 사전은 빠른 검색을 위해 키로부터 저장하는 위치를 결정하며 최대한 찾기 쉬운 위치에 저장하기 때문에 순서를 유지하지 않음

In [2]:
dic = {'boy':'소년', 'school':'학교', 'book':'책', 'friend':'친구'}
print(dic['boy'])
print(dic['book'])

소년
책


In [3]:
print(dic['student'])

KeyError: 'student'

- 위의 경우처럼 찾는 키가 없으면 키가 없다는 예외가 발생하게 됨 > 예외 처리 구문 사용해야 함
- 예외 처리 구문으로 감싸는 게 불편한 경우, **get 메서드**로 값을 찾는다!

#### get 메서드
- 키가 없을 때 에러를 발생시키는 대신 **None**을 리턴
- 두 번째 인수로 대신 돌려줄 디폴트값 지정 가능

In [7]:
help(dic.get)

Help on built-in function get:

get(key, default=None, /) method of builtins.dict instance
    Return the value for key if key is in the dictionary, else default.



In [8]:
dic = {'boy':'소년', 'school':'학교', 'book':'책', 'friend':'친구'}
print(dic.get('student'))
print(dic.get('student', '사전에 없는 단어입니다.'))

None
사전에 없는 단어입니다.


In [9]:
dic = {'boy':'소년', 'school':'학교', 'book':'책', 'friend':'친구'}
if 'student' in dic:
    print('사전에 있는 단어입니다.')
else:
    print('사전에 없는 단어입니다.')

사전에 없는 단어입니다.


## 사전 관리
- 사전은 **변경 가능한 자료형**이어서 실행 중에 삽입, 삭제, 수정 등의 편집 자유롭게 가능
- [] 괄호와 대입문 주로 사용

In [10]:
dic = {'boy':'소년', 'school':'학교', 'book':'책', 'friend':'친구'}
dic['boy'] = '남자애'  # key 이미 존재: 값 대치(변경)
dic['girl'] = '소녀'   # key 존재 X : 새로운 요소 추가
del dic['book']        
print(dic)

{'boy': '남자애', 'school': '학교', 'friend': '친구', 'girl': '소녀'}


사전의 모든 요소를 삭제하여 완전히 비울 때는 clear 메서드 사용

In [12]:
dic.clear()
print(dic)

{}


### 사전의 키, 값 목록
- dict_keys, dict_values, dict_items 라는 리스트 객체 리턴
- dict_* 객체: 리스트처럼 순회 기능하여 값을 순서대로 읽을 수 있음

In [15]:
dic = {'boy':'소년', 'school':'학교', 'book':'책', 'friend':'친구'}
print(dic.keys())
print(dic.values())
print(dic.items())

dict_keys(['boy', 'school', 'book', 'friend'])
dict_values(['소년', '학교', '책', '친구'])
dict_items([('boy', '소년'), ('school', '학교'), ('book', '책'), ('friend', '친구')])


In [16]:
dic = {'boy':'소년', 'school':'학교', 'book':'책', 'friend':'친구'}
keylist = dic.keys()
for key in keylist:
    print(key)

boy
school
book
friend


- dict_* 객체의 경우, 진자 리스트가 아니어서 append, insert 등의 편집 함수를 호출할 수 없음
- 리스트로 만들고 싶은 경우에는 list() 함수 사용

### 사전 병합, update
- 중복된 키가 있으면 **병합되는 키 값이 적용**

In [17]:
dic = {'boy':'소년', 'school':'학교', 'book':'책'}
dic2 = {'student':'학생', 'teacher':'선생님', 'book':'서적'}
dic.update(dic2)
print(dic)

{'boy': '소년', 'school': '학교', 'book': '서적', 'student': '학생', 'teacher': '선생님'}


### 2차원 리스트 > 사전 변환
- 리스트에 중복되는 키가 있으면 **뒤쪽에 있는 키의 값이 적용**

In [18]:
li = [['boy','소년'],['school','학교'], ['book', '책']]
dic = dict(li)
print(dic)

{'boy': '소년', 'school': '학교', 'book': '책'}


### 사전 활용) 노래 가사에 등장하는 알파벳 출현 횟수 구하기

In [20]:
song = """by the rivers of babylon, there we sat down
yeah we wept, when we remember zion.
when the wicked carried us away in captivity
required from us a song
now how shall we sing the lord's song in a strange land"""

alphabet = dict()
for c in song:
    if c.isalpha() == False:
        continue
    c = c.lower()
    if c not in alphabet:
        alphabet[c] = 1
    else:
        alphabet[c] += 1

print(alphabet)

{'b': 4, 'y': 5, 't': 9, 'h': 9, 'e': 22, 'r': 12, 'i': 10, 'v': 2, 's': 10, 'o': 10, 'f': 2, 'a': 12, 'l': 5, 'n': 13, 'w': 12, 'd': 6, 'p': 2, 'm': 3, 'z': 1, 'c': 3, 'k': 1, 'u': 3, 'q': 1, 'g': 4}


사전은 검색하기 편한 위치에 저장하기 때문에 순서가 없는 컬렉션이어서 보기가 어렵다..!  

알파벳순으로 정렬해서 출력하려면 별도의 출력코드가 필요!

In [21]:
key = list(alphabet.keys())
key.sort()
for c in key:
    num = alphabet[c]
    print(c, "=>", num)

a => 12
b => 4
c => 3
d => 6
e => 22
f => 2
g => 4
h => 9
i => 10
k => 1
l => 5
m => 3
n => 13
o => 10
p => 2
q => 1
r => 12
s => 10
t => 9
u => 3
v => 2
w => 12
y => 5
z => 1


위의 경우, j와 x는 문자열에 없어서 결과 목록에 아예 나타나지 않음..

a~z 까지 순회하며 각 알파벳의 등장 횟수 조사 (안 쓰인 것까지!)

In [22]:
for code in range(ord('a'), ord('z') +1):
    c = chr(code)
    num = alphabet.get(c, 0)
    print(c, '=>', num)

a => 12
b => 4
c => 3
d => 6
e => 22
f => 2
g => 4
h => 9
i => 10
j => 0
k => 1
l => 5
m => 3
n => 13
o => 10
p => 2
q => 1
r => 12
s => 10
t => 9
u => 3
v => 2
w => 12
x => 0
y => 5
z => 1
