# 자료구조: dict

리스트, 튜플, **문자열**은 여러 개의 값을 순서대로 저장하는 자료구조이다.
(문자열에 대해서는 뒤에 설명할 예정이다.)
따라서 인덱스를 이용해서 저장된 값에 접근한다.

이와 달리 dict(dictionary)과 셋(set)은 값이 저장된 순서에 아무런 의미를 두지 않는다.
값만 저장하는 셋과 달리 dict는 값을 저장할 때 이 **값에 접근하기 위해 인덱스 대신 사용할 또 다른 값**을 같이 저장하는 자료구조이다.
값에 접근하기 위해 사용할 또 다른 값을 **키**(key)라고 한다.
따라서 **dict는 인덱스 대신 키로 값에 접근하는 자료구조**라고 할 수 있다.
따라서 `[]` 연산자를 이용해서 값에 지원하지만 `[]`에 인덱스 대신 키를 사용한다.

## dict의 생성

dict 객체를 생성할 때는 쉼표로 구분한 **`키:값`**의 목록을 `{}`로 감싸면 된다.

In [0]:
heam = {'name': 'Joongyang Park', 'height':185, 'weight':77}
print(type(heam))
print(heam)

<class 'dict'>
{'name': 'Joongyang Park', 'height': 185, 'weight': 77}


## 값에 접근하기

dict 객체에 저장된 값을 이용하기 위해서는 `[]` 연산자에 키를 준다.

In [0]:
print(heam['name'])
print(heam['height'])

Joongyang Park
185


키를 이용하여 값을 변경할 수도 있다.

In [0]:
print(heam)
heam['height'] = 184.5
heam['weight'] = 77.5
print(heam)

{'name': 'Joongyang Park', 'height': 185, 'weight': 77}
{'name': 'Joongyang Park', 'height': 184.5, 'weight': 77.5}


따라서 dict 객체에 저장된 값을 이용하기 위해서는 어떤 키가 있는지 알아야 한다.
이를 위해 dict 자료구조는 **`keys()`** 메소드를 제공한다.

In [0]:
heam.keys()

dict_keys(['name', 'height', 'weight'])

In [0]:
print(type(heam.keys()))

<class 'dict_keys'>


## 새로운 키와 값 추가하기

`[]` 연산자에 dict 객체에 없는 새로운 키를 주면 새로운 키와 값 쌍을 추가할 수 있다.

In [0]:
heam['hair'] = 'grey'
print(heam)

{'name': 'Joongyang Park', 'height': 184.5, 'weight': 77.5, 'hair': 'grey'}


다른 자료구조와 마찬가지로 자료구조를 값으로 저장할 수도 있다.
특히 통계 분석을 위한 자료를 아래 예와 같이 dict를 이용하여 저장하면 편리하다.
이때 변수 이름을 키로 하고 각 변수를 측정한 값이 저장된 자료구조를 값으로 저장한다.

In [0]:
gender = ['M']*2 + ['F']*4 + ['M'] + ['F']*2 + ['M'] + \
        ['F']*2 + ['M'] + ['F']*4 + ['M']*2
weight = [62.0, 62.9, 36.1, 54.6, 48.5, 42.0, 47.4, \
          50.6, 42.0, 48.7, 40.3, 33.1, 51.9, 42.4, \
          34.5, 51.1, 41.2, 51.9, 46.9]
metabolic_rate = [1792, 1666, 995, 1425, 1396, 1418, 1362, 1502,\
        1256, 1614, 1189, 913, 1460, 1124, 1052, 1347,\
        1204, 1867, 1439]
meta = {'gender':gender, 'weight':weight, 'rate':metabolic_rate}
print(meta)

{'gender': ['M', 'M', 'F', 'F', 'F', 'F', 'M', 'F', 'F', 'M', 'F', 'F', 'M', 'F', 'F', 'F', 'F', 'M', 'M'], 'weight': [62.0, 62.9, 36.1, 54.6, 48.5, 42.0, 47.4, 50.6, 42.0, 48.7, 40.3, 33.1, 51.9, 42.4, 34.5, 51.1, 41.2, 51.9, 46.9], 'rate': [1792, 1666, 995, 1425, 1396, 1418, 1362, 1502, 1256, 1614, 1189, 913, 1460, 1124, 1052, 1347, 1204, 1867, 1439]}


In [0]:
print(meta['rate'][:5])

[1792, 1666, 995, 1425, 1396]


## dict의 메소드

반복문에서 유용하게 사용되는 메소드로 `keys()`, `values()`, `items()`가 있다.
앞에서 소개한 바와 같이 `keys()`는 키의 목록을 주는 메소드이고, `values()`는 값의 목록을 주는 메소드이며, `items()`는 (키, 값) 튜플의 목록을 주는 메소드이다.

In [0]:
print(heam.keys())
print(heam.values())
print(heam.items())

dict_keys(['name', 'height', 'weight', 'hair'])
dict_values(['Joongyang Park', 184.5, 77.5, 'grey'])
dict_items([('name', 'Joongyang Park'), ('height', 184.5), ('weight', 77.5), ('hair', 'grey')])


In [0]:
for key in heam.keys():
    print(key)

name
height
weight
hair


In [0]:
for value in heam.values():
    print(value)

Joongyang Park
184.5
77.5
grey


In [0]:
for key, value in heam.items():
    print(key, ': ', value)

name :  Joongyang Park
height :  184.5
weight :  77.5
hair :  grey


In [0]:
new_key = "blood type"
if new_key not in heam.keys():
    heam[new_key] = 'O'

print(heam)

{'name': 'Joongyang Park', 'height': 184.5, 'weight': 77.5, 'blood type': 'O'}


## `zip()` 함수

2개 이상의 자료구조 객체를 결합할 때 유용한 함수가 `zip()` 내장함수이다.
2개 이상의 자료구조 객체를 `zip()` 함수의 인자로 주고 호출하면 각 자료구조 객체에 저장된 값을 순서대로 하나씩 결합한 튜플이 저장된 자료구조에 대한 반복자(iterator)를 얻을 수 있다.

In [0]:
keys = ['name', 'height', 'weigt', 'hair']
values = ['Joongyang Park', 184.5, 77.5, 'grey']

In [21]:
for s in zip(keys, values):
    print(s)

('name', 'Joongyang Park')
('height', 184.5)
('weigt', 77.5)
('hair', 'grey')


In [22]:
t = zip(keys, values)
for t0 in t:
    print(t0)

('name', 'Joongyang Park')
('height', 184.5)
('weigt', 77.5)
('hair', 'grey')


`zip()`가 반환한 반복자는 리스트 또는 튜플 등으로 변환할 수 있다.
반복자를 이용해서 자료구조에 저장된 자료를 한 번 순환하고 나면 더 이상 자료에 접근할 수 없다.

In [0]:
for t0 in t:
    print(t0)

`zip()` 함수가 반환한 결과를 반복해서 사용하려면 리스트와 같은 다른 자료구조로 변환하면 된다.

In [25]:
rst = zip(keys, values)
rstset = set(rst)
print(rstset)

{('name', 'Joongyang Park'), ('height', 184.5), ('hair', 'grey'), ('weigt', 77.5)}


In [26]:
new_dict = {}                     # new_dict = dict()
for k, v in zip(keys, values):
    new_dict[k] = v
    
print(new_dict)

{'name': 'Joongyang Park', 'height': 184.5, 'weigt': 77.5, 'hair': 'grey'}


## Comprehension의 활용

dict 자료구조에 대해서도 comprehension을 사용할 수 있다.

In [0]:
heam = {key:value for key, value in zip(keys, values)}
print(heam)

{'name': 'Joongyang Park', 'height': 184.5, 'weigt': 77.5, 'hair': 'grey'}


dict 객체의 키와 값이 바뀐 dict 객체도 comprehension을 이용하면 간단히 만들 수 있다.

In [0]:
heam_inv = {v:k for k, v in heam.items()}
print(heam_inv)

{'Joongyang Park': 'name', 184.5: 'height', 77.5: 'weigt', 'grey': 'hair'}


## 연습문제

1. 다음 `if` 문장을 대신할 수 있는 코드를 dict 자료구조를 이용해서 작성해보시오.
```python
if choice == 'ramyon`:
    price = 3000
elif choice == 'gimbab':
    price = 2500
elif choice = 'soondae':
    price = 5000
else:
    price = 0
```

2. 음식 이름이 키이고 가격이 값이 dict 객체를 만들면 식당의 메뉴를 표현할 수 있다. 이와 유사하게 고객의 주문도 음식 이름을 키로 하고 주문량을 값으로 하는 dict 객체로 표현할 수 있다. 이 두 dict 객체를 이용하면 결제시에 필요한 청구금액을 계산할 수 있다. 예제 코드를 작성하시오.

3. 아래와 같이 변수별로 별도의 리스트에 저장한 **심장병자료**를 dict 자료구조를 이용하여 한 객체에 저장한 다음 각 자료에서 각 변수의 기본적인 통계치(자료의 수, 합, 평균, 표준편차 등)를 계산하시오.


In [0]:
# 심장병 자료
cntry = ["Australia", "Austria", "Belgium/Luxembourg", "Canada", "Denmark", 
           "Finland", "France", "Iceland", "Ireland", "Italy",
           "Netherlands", "New Zealand", "Norway", "Spain", "Sweden",
           "Switzerland", "United Kingdom", "United States", "West Germany"]
wn = [2.5, 3.9, 2.9, 2.4, 2.9, 0.8, 9.1, 0.8, 0.7, 7.9, 1.8, 1.9, 0.8, 6.5, 1.6, 5.8, 1.3, 1.2, 2.7]
dth = [211, 167, 131, 191, 220, 297, 71, 211, 300, 107, 167, 266, 227, 86, 207, 115, 285, 199, 172]

4. 앞 문제에서 제시한 리스트 cntry, wn, dth로부터 다음과 같은 형식의 dict 객체를 만들어보시오.

{국가이름: (포도주소비량, 심장병사망률),  국가이름: (포도주소비량, 심장병사망률), ... }

5. 행정구역 단위인 동의 이름이 키이고 동의 우편번호가 값인 dict 객체를 만들고, 이로부터 우편번호가 키이고 동 이름이 값인 dict 객체를 만드는 예제 프로그램을 작성하시오.