# 데이터 구조(Data Structure) II

- 알고리즘에 빈번히 활용되는 순서가 없는(unordered) 데이터 구조 
    - 세트(Set)
    - 딕셔너리(Dictionary)

# 세트(Set)

> 변경 가능하고(mutable), 순서가 없고(unordered), 순회 가능한(iterable)

데이터 구조로서의 세트(set)와 조작법(method)

## 추가 및 삭제

### `.add(elem)`
elem을 세트에 추가합니다. 

In [None]:
# add를 사용해봅시다.
a = {'사과', '바나나', '수박'}

In [None]:
# 집합처럼 생각하면 된다.
a.add('사과')
print(a)

### `.update(*others)`

여러가지의 값을 추가합니다.

인자로는 반드시 iterable 데이터 구조를 전달해야합니다.

In [None]:
# update를 사용해봅시다.
a = {'사과', '바나나', '수박'}
a.update({'토마토', '토마토', '딸기'}, {'포도', '레몬'})
print(a)

### `.remove(elem)`

elem을 세트에서 삭제하고, 없으면 KeyError가 발생합니다. 

In [None]:
# remove를 사용해봅시다.
a = {'사과', '바나나', '수박'}
a.remove('애플')
a.remove('사과')
print(a)

### `.discard(elem)`
elem을 세트에서 삭제하고 없어도 에러가 발생하지 않습니다.

In [None]:
# discard를 사용해봅시다.
# 프로그램이 error로 인해 절대 꺼지면 안되는 경우 discard를 사용
# 보통 .remove를 쓰자!! error를 감추기 위한 용도로 discard사용하지 말기!!
a = {'사과', '바나나', '수박'}

In [None]:
#
a.discard('포도')
a.discard('수박')
print(a)

### `.pop()`

**임의의 원소**를 제거해 반환합니다.

In [None]:
# pop을 사용해봅시다.
a = {'사과', '바나나', '수박', '아보카도'}

In [None]:
#
print(a.pop())
print(a)

# 딕셔너리(Dictionary)

> 변경 가능하고(mutable), 순서가 없고(unordered), 순회 가능한(iterable)
>
> `Key: Value` 페어(pair)의 자료구조

데이터 구조로서의 딕셔너리(dictionary)와 조작법(method)

## 조회

### `.get(key[, default])`

key를 통해 value를 가져옵니다. 

절대로 KeyError가 발생하지 않습니다. default는 기본적으로 None입니다.

In [1]:
# get을 사용해봅시다.
my_dict = {'apple': '사과', 'banana': '바나나', 'melon': '멜론'}
my_dict['pineapple']

KeyError: 'pineapple'

In [2]:
#
print(my_dict.get('pineapple'))
print(my_dict.get('apple'))
print(my_dict.get('pineapple', 1))

None
사과
1


## 추가 및 삭제

### `.pop(key[, default])`

key가 딕셔너리에 있으면 제거하고 그 값을 돌려줍니다. 그렇지 않으면 default를 반환합니다.

default가 없는 상태에서 딕셔너리에 없으면 KeyError가 발생합니다.

In [9]:
# pop을 사용해봅시다.
my_dict = {'apple': '사과', 'banana': '바나나'}
my_dict.pop('apple')
print(my_dict)

my_dict.pop('melon', 0)

{'banana': '바나나'}


0

In [4]:
# 딕셔너리에 없으면 에러가 발생합니다.
my_dict.pop('melon')

KeyError: 'melon'

In [5]:
my_dict.pop()

TypeError: pop expected at least 1 arguments, got 0

### `.update()`

값을 제공하는 key, value로 덮어씁니다. 

In [10]:
# update를 사용해봅시다.
my_dict = {'apple': '사과', 'banana': '바나나', 'melon': '멜론'}

In [11]:
# 있으면 덮어쓰기
my_dict.update(apple='애플')
print(my_dict)

{'apple': '애플', 'banana': '바나나', 'melon': '멜론'}


In [12]:
# 없음면 추가
my_dict.update(pineapple = '파인애플')
print(my_dict)

{'apple': '애플', 'banana': '바나나', 'melon': '멜론', 'pineapple': '파인애플'}


## 딕셔너리 순회(반복문 활용)

딕셔너리에 `for` 문을 실행하면 기본적으로 다음과 같이 동작합니다.

In [13]:
grades = {'john':  80, 'eric': 90, 'justin': 90}
for student in grades:
    print(student)

john
eric
justin


딕셔너리의 **key**를 접근할 수 있으면 **value**에도 접근할 수 있기 때문입니다.

따라서 딕셔너리의 value를 출력하기 위해서는 아래와 같이 작성합니다.

In [None]:
# 학생 이름(key)을 활용하여 점수(value)를 출력해봅시다.

In [14]:
#
for student in grades:
    print(grades[student])

80
90
90


* dictionary에서 `for`를 활용하는 4가지 방법

```python
# 0. dictionary 순회 (key 활용)
for key in dict:
    print(key)
    print(dict[key])


# 1. `.keys()` 활용
for key in dict.keys():
    print(key)
    print(dict[key])
    
    
# 2. `.values()` 활용    
for val in dict.values():
    print(val)

    
# 3. `.items()` 활용
for key, val in dict.items():
    print(key, val)

```

### [연습] 딕셔너리 순회

> 혈액형 검사한 결과가 담긴 `blood_types`이 주어졌을때, 해당 딕셔너리를 순회하며, `key`와 `value`를 출력해보세요.

---

**[출력 예시]**
```
A형은 40명입니다.
B형은 11명입니다.
AB형은 4명입니다.
O형은 45명입니다.
```

In [15]:
blood_types = {'A': 40, 'B': 11, 'AB': 4, 'O': 45}

In [16]:
# key로 반복하는 코드를 작성해봅시다.
for type in blood_types:
    print(f'{type}은, {blood_types[type]}명입니다.')

A은, 40명입니다.
B은, 11명입니다.
AB은, 4명입니다.
O은, 45명입니다.


In [17]:
# .keys()를 활용하여 반복하는 코드를 작성해봅시다
for type in blood_types.keys():
    print(f'{type}은, {blood_types[type]}명입니다.')

A은, 40명입니다.
B은, 11명입니다.
AB은, 4명입니다.
O은, 45명입니다.


In [18]:
# .items()를 활용하여 반복하는 코드를 작성해봅시다.
for type, number in blood_types.items():
    print(f'{type}은, {number}명입니다.')

A은, 40명입니다.
B은, 11명입니다.
AB은, 4명입니다.
O은, 45명입니다.


### [실습] 딕셔너리 순회

> 혈액형 검사한 결과가 담긴 `blood_types`이 주어졌을때, 해당 검사에 참가한 사람들의 총합을 구해보세요.

---

**[출력 예시]**
```
검사에 참가한 사람은 총 100명입니다.
```

In [None]:
# key로 반복하는 코드를 작성해봅시다.

In [19]:
total = 0
for type in blood_types:
    total += blood_types[type]
print(f'검사에 참가한 사람은 총 {total}명입니다.')

검사에 참가한 사람은 총 100명입니다.


In [None]:
# .values()를 활용하여 작성해봅시다.

In [20]:
total = 0
for value in blood_types.values():
    total += value
print(f'검사에 참가한 사람은 총 {total}명입니다.')

검사에 참가한 사람은 총 100명입니다.


In [None]:
# 더 간단하게 구할 수도 있습니다. list는 sum을 사용한다.

In [21]:
print(f'검사에 참가한 사람은 총 {sum(blood_types.values())}명입니다.')

검사에 참가한 사람은 총 100명입니다.


### [응용] 딕셔너리 구축하기(counter)
> 리스트가 주어질 때, 각각의 요소의 개수를 value 값으로 갖는 딕셔너리를 만드세요.

---

**[출력 예시]**

{'great': 2, 'expectations': 1, 'the': 2, 'adventures': 2, 'of': 2, 'sherlock': 1, 'holmes': 1, 'gasby': 1, 'hamlet': 1, 'huckleberry': 1, 'fin': 1}


In [22]:
book_title =  ['great', 'expectations', 'the', 'adventures', 'of', 'sherlock', 'holmes', 'the', 'great', 'gasby', 'hamlet', 'adventures', 'of', 'huckleberry', 'fin']
    

In [23]:
title_counter = {}

for title in book_title:
    #같은 key를 만났을 때
    if title in title_counter:
        title_counter[title] += 1
    #처음 key를 만났을 때
    else:
        title_counter[title] =1

print(title_counter)

{'great': 2, 'expectations': 1, 'the': 2, 'adventures': 2, 'of': 2, 'sherlock': 1, 'holmes': 1, 'gasby': 1, 'hamlet': 1, 'huckleberry': 1, 'fin': 1}


In [24]:
book_title.count('great')

2

In [25]:
title_counter = {}
for title in book_title:
    title_counter[title] = book_title.count(title)
    
print(title_counter)    

{'great': 2, 'expectations': 1, 'the': 2, 'adventures': 2, 'of': 2, 'sherlock': 1, 'holmes': 1, 'gasby': 1, 'hamlet': 1, 'huckleberry': 1, 'fin': 1}


> `get(key[, default])`
* key 가 딕셔너리에 있는 경우 key 에 대응하는 값을 돌려주고, 그렇지 않으면 default 를 돌려준다. 

In [26]:
title_counter = {}
for title in book_title:
    # key를 찾으면 카운트 증가 
    # key를 못찾으면 카운트를 1로 초기화
    title_counter[title] = title_counter.get(title , 0) + 1
print(title_counter)    

{'great': 2, 'expectations': 1, 'the': 2, 'adventures': 2, 'of': 2, 'sherlock': 1, 'holmes': 1, 'gasby': 1, 'hamlet': 1, 'huckleberry': 1, 'fin': 1}


## Dictionary comprehension

dictionary도 comprehension을 활용하여 만들 수 있습니다. 

---

### 활용법
`iterable`에서 `dict`를 생성할 수 있습니다.

```python
{키: 값 for 요소 in iterable}

dict({키: 값 for 요소 in iterable})
```

In [None]:
dict_a = {}
print(type(dict_a))

set_a = set()
print(type(set_a))

list_a = [값 for in if]
set_a = {값 for in}
dict_b = {키: 값 for in}

In [27]:
blood_types = {'A': 40, 'B': 11, 'AB': 4, 'O': 45}
negative_blood_types = {'-' + types: num for types, num in blood_types.items()}
print(negative_blood_types)

{'-A': 40, '-B': 11, '-AB': 4, '-O': 45}


## Dictionary comprehension + 조건

List comprehension과 유사하게, 조건문에 참인 식으로 딕셔너리를 생성합니다.


### 활용법

```py
{키: 값 for 요소 in iterable if 조건식}

{키: 값 if 조건식 else 값 for 요소 in iterable}

# elif 는 다음과 같이 사용해야 합니다. (if else 열거)
{키: 값 if 조건식 else 식 if 조건식 else 식 if ... else ... for 변수 in iterable}
```

### Dictionary comprehension 사용해보기

In [28]:
dusts = {'서울': 72, '대전': 82, '구미': 29, '광주': 45, '중국': 200}

In [29]:
# 미세먼지 농도가 80 초과 지역만 뽑아주세요.
result = {region: rate for region, rate in dusts.items() if rate> 80}

In [30]:
print(result)

{'대전': 82, '중국': 200}


In [31]:
# 미세먼지 농도가 80초과는 나쁨 80이하는 보통으로 하는 value를 가지도록 바꾸세요.
result = {region: '나쁨' if rate> 80 else '보통' for region, rate in dusts.items()}

In [32]:
print(result)

{'서울': '보통', '대전': '나쁨', '구미': '보통', '광주': '보통', '중국': '나쁨'}
