# 넷플릭스 시청 데이터로 알아보는 데이터형 변환

- **dic["a"].append(2)**
- dic["a"] = dic["a"].append(2)
  - append()는 반환값이 없어 None값이 들어간다.

## 1. 딕셔너리

`{key: value}`

- key : 값을 찾기 위해 넣어주는 데이터
- value : 찾고자 하는 데이터

### 딕셔너리의 키

```python
accounts = {
    "kdhong": 'kildong Hong',
}
print("kdhong" in accounts)
print("elice" in accounts)
```

- 딕셔너리 순회하기

```python
accounts = {
    "kdhong": 'kildong Hong',
}
for username, name in accounts.items():
    print(username + " - " + name)
```

### 데이터의 변환: JSON

{key: value}
- "JavaScript Object Notation"
  - 웹 환경에서 데이터를 주고 받는 가장 표준적인 방식
  - 키를 이요하여 우너하는 데이터만 빠르게 추출 가능
  - 데이터가 쉽게 오염되지 않음
  - 다른 포맷에 비해 용량이 조금 큰 편

JSON -> loads() -> 딕셔너리 (로드 스트링)
딕셔너리 -> dumps() -> JSON 

```python
def create_dict(filename):
  with open(filename) as file:
    json_string = file.read()
    dict_string = json.loads(json_string)
    # 함수를 완성하세요.
    return dict_string
```

```python
def create_json(dictionary, filename):
  with open(filename, 'w') as file:
    # 함수를 완성하세요.
    json_string = json.dumps(dictionary)
    file.write(json_string)
```

## 2. 집합

- 집합
  - 중복이 없다
  - 순서가 없다

- 집합 만들기

```python
set1 = {1, 2, 3}
set2 = set([1, 2, 3])
set3 = {3, 2, 3, 1}
```

- 원소 추가/삭제

```python
num_set = {1, 3, 5, 7}
num_set.add(9)
num_set.update([3, 15, 4])
num_set.remove(7)
num_set.discard(13)
```

- 집합 다루기

```python
num_set = {1, 3, 5, 7}
print(6 in num_set)
print(len(num_set))
```

### 집합 연산

```python
set1 = {1, 3, 5, 7}
set2 = {1, 3, 9, 27}

union = set1 | set2
intersection = set1 & set2
diff = set1 - set2
xor = set1 ^ set2
```

## 3. 그래프 다루기


In [None]:
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm

# 날짜 별 온도 데이터를 세팅합니다.
dates = ["1월 {}일".format(day) for day in range(1, 32)]
temperatures = list(range(1, 32))
# 막대 그래프의 막대 위치를 결정하는 pos를 선언합니다.
pos = range(len(dates))
# 한국어를 보기 좋게 표시할 수 있도록 폰트를 설정합니다.
font = fm.FontProperties(fname='./NanumBarunGothic.ttf')
# 막대의 높이가 빈도의 값이 되도록 설정합니다.
plt.bar(pos, temperatures, align='center')
# 각 막대에 해당되는 단어를 입력합니다.
plt.xticks(pos, dates, rotation='vertical', fontproperties=font)
# 그래프의 제목을 설정합니다.
plt.title('1월 중 기온 변화', fontproperties=font)
# Y축에 설명을 추가합니다.
plt.ylabel('온도', fontproperties=font)
# 단어가 잘리지 않도록 여백을 조정합니다.
plt.tight_layout()
# 그래프를 표시합니다.
plt.savefig('graph.png')

# 테드 강연으로 다뤄보는 복잡한 형태의 데이터

## csv

- Comma Separated Value
  - 각 열이 특정한 의미를 가짐

- 특징
  - 같은 데이터를 저장하는데 용량을 적게 소모함
  - 데이터 오염에 취약함

```python
import csv

with open('movies.csv') as file:
    reader = csv.reader(file, delimiter=',')
    for now in reader:
        print(row[0])
```

## 2. 고급파이썬

### lambda

```python
sorted(movies, key=lambda row: row.split(',')[1])
```

### assert()

- 두 값이 같으면 통과, 아니면 에러

```python
assert(square1(3) == square2(3))
```

### map()

```python
def get_eng_title(row):
  split = row.split(',')
  return split[1]

eng_titles = map(get_eng_title, movies)
```

```python
eng_titles = map(lambda row: row.split(',')[1], movies)
```

- 리스트가 아닌 map이라는 타입을 가짐

### filter()

```python
words = ['real', 'man', 'rhythm', ...]
r_words = [word for word in words if word.startswith('r')]
```

```python
def starts_with_r(word): return word.startswith('r')

words = ['real', 'man', 'rhythm', ...]
r_words = filter(starts_with_r, words)
```
