# 리스트, 튜플, 사전 활용

## 주요 내용

파이썬에 내장되어 있는 컬렉션 자료형을 살펴본다. 
특히, 리스트, 튜플, 사전에 대해 알아 본다.

* **리스트(lists)**: 파이썬에서 사용할 수 있는 **임의의** 값들을 모아서 
    하나의 값으로 취급하는 자료형

    * 사용 형태: 대괄호 사용
    ```
    even_numbers_list = [2, 4, 6, 8, 10]
    todays_datatypes_list = ['list', 'tuple', 'dictionary']
    ```
    
    * 특징: 임의의 자료형 값들을 섞어서 항목으로 사용 가능
    ```
    mixed_list = [1, 'abs', [2.1, 4.5]]
    ```

    * 인덱스(index)를 이용하여 각각의 항목 접근 및 활용 가능
    
    * 리스트는 수정 가능하다. 즉, 가변 자료형이다. 
    
    * 리스트와 관련되어 많이 사용되는 메소드는 다음과 같다.
        * `append()`: 기존의 리스트 끝에 항목 추가
        * `extend()`: 두 개의 리스트 이어붙이기
        * `insert()`: 기존의 리스트 중간에 항목 삽입
        * `pop()`, `remove()`, `del`: 항목 삭제
    
    
* **튜플(tuples)**: 리스트와 비슷. 하지만 수정 불가능(immutable).
    * 사용 형태: 소괄호 사용
    ```
    even_numbers_tuple = (2, 4, 6, 8, 10)
    todays_datatypes_tuple = ('list', 'tuple', 'dictionary')
    ```
    
    * 특징: 임의의 자료형 값들을 섞어서 항목으로 사용 가능
    ```
    mixed_tuple = (1, 'abs', [2.1, 4.5])
    ```

    * 인덱스(index)를 이용하여 각각의 항목 접근 및 활용 가능
    
    * 튜플은 수정 불가능하다. 즉, 불변 자료형이다. 
    
    * 튜플 자료형은 불변 자료형이라서 메소드가 별로 없다. 
        많이 사용되는 두 개이다.
        * `count()`: 튜플에 포함된 특정 항목이 몇 번 나타나는지 세어 줌.
        * `index()`: 특정 항목의 인덱스가 몇 번인지 확인해 줌.


* **사전(dictionaries)**: 키(keys)와 값(values)으로 이루어진 쌍(pairs)들의 집합
    * 사용 형태: 집합기호 사용
    ```
    eng_math = {'year': 2017, 'semester' : 2, 'subject': 'Data Science'}
    ```

    * 특징
        * 키로 사용될 수 있는 자료형: 문자열 등 불변 자료형 값
        * 값으로 사용될 수 있는 자료형: 임의의 값

    * 사전은 가변 자료형이다. 
        * `사전명[키명] = 값` 을 이용해 특정 항목의 키에 해당하는 값을 변경할 수 있다.

        * `update()` 메소드: 항목 추가
        * `del` 함수 또는 `pop()` 메소드: 특정 항목 삭제

    * `items`, `keys`, `values` 등의 메소드를 이용하여 사전의 항목 확인 가능


## 오늘의 주요 예제

`record_list.txt` 파일은 여덟 명의 수영 선수의 50m 기록을 담고 있다.

```txt
player1 21.09 
player2 20.32 
player3 21.81 
player4 22.97 
player5 23.29 
player6 22.09 
player7 21.20 
player8 22.16
```

목표: 위 파일로부터 1~3등 선수의 이름과 기록을 아래와 같이 확인하기
```txt
1등 player2 20.32 
2등 player1 21.09 
3등 player7 21.20 
```

**참조:** Head First Programming(한빛미디어) 4장~5장




## 리스트 활용

저장된 파일에서 데이터를 불러와서 한 줄씩 확인하는 방법은 다음과 같다.

In [54]:
record_f = open("record_list.txt")
record = record_f.read().decode('utf-8').split('\n')
record_f.close()

for line in record:
    print(line)

player1 21.09
player2 20.32
player3 21.81
player4 22.97
player5 23.29
player6 22.09
player7 21.20
player8 22.16


위 코드에서 `record`에 저장된 값이 바로 리스트이다. 

In [55]:
print(record)

[u'player1 21.09', u'player2 20.32', u'player3 21.81', u'player4 22.97', u'player5 23.29', u'player6 22.09', u'player7 21.20', u'player8 22.16']


각각의 항목은 각 줄에 위치한 선수의 이름과 기록이다.
예를 들어, 첫째 줄 선수의 이름과 기록은 다음과 같다.

확인하는 방법은 인덱스를 이용한다.

In [56]:
print(record[0])

player1 21.09


각 인덱스 값의 자료형은 문자열이다.

In [62]:
print(type(record[0]))

<type 'unicode'>


인덱스를 활용하여 모든 선수의 기록을 다음과 확인할 수 있다.
인덱스 활용은 앞서 문자열의 경우와 동일하다.

**주의:** 아래 코드에서 `len(record) = 8`임에 주의하라.

In [63]:
for i in range(len(record)):
    print('---')
    print(record[i])

---
player1 21.09
---
player2 20.32
---
player3 21.81
---
player4 22.97
---
player5 23.29
---
player6 22.09
---
player7 21.20
---
player8 22.16


### 연습

위 코드를 응용하여 가장 빠른 50m 기록을 확인해 보자.

힌트: 각 선수의 정보를 담은 문자열을 스페이스 기준으로 쪼갠 후, 
둘 째 항목(1번 인덱스 값)의 값들 중에서 최소값을 구해야 한다.

견본답안: 

In [67]:
record_f = open("record_list.txt", 'r')
record = record_f.read().decode('utf8').split('\n')

lowest_record = 30

for line in record:
    if float(line.split()[1]) < lowest_record: 
        lowest_record = float(line.split()[1])
record_f.close()

print(lowest_record)

20.32


위 코드의 5번 줄에 사용된 `line.split()`이 선수이름과 기록을 쪼개는 과정이다.

아래 코드는 위 코드를 좀 더 세련되게 구현한 것이다. 
아래 코드의 5번 줄 내용은 `split()` 메소드를 이용하여 선수 이름과 기록으로 쪼개진
각각의 값을 갖는 변수를 동시에 선언하고 있다.
(**주의:** `splie()`의 결과로 길이가 2인 리스트를 얻는다는 것을 미리 예상하였음에 주의하라.)
```
(player, p_record) = line.split()
```
위와 같이 하면 다음 처럼 한 것과 동일한 일을 하게 된다.
```python
player = line.split()[0]
p_record = line.split()[1]
```

In [68]:
record_f = open("record_list.txt", 'r')
record = record_f.read().decode('utf8').split('\n')

lowest_record = 30

for line in record:
    (player, p_record) = line.split()
    if float(p_record) < lowest_record: 
        lowest_record = float(p_record)
record_f.close()

print(lowest_record)

20.32


### 연습

지금까지 1등 선수의 기록을 확인하였다.
그렇다면 2등 선수의 기록은 어떻게 확인하는가?

단순하게 생각해서 아래와 같이 2등 선수의 기록도 기억하는 방식으로 처리할 수 있다.

In [69]:
record_f = open("record_list.txt", 'r')
record = record_f.read().decode('utf8').split('\n')

lowest_record = 30
second_lowest_record = 31

for line in record:
    (player, p_record) = line.split()
    if float(p_record) < lowest_record: 
        lowest_record = float(p_record)
    elif float(p_record) < second_lowest_record:
        second_lowest_record = float(p_record)
record_f.close()

print(lowest_record)
print(second_lowest_record)

20.32
21.2


### 연습: `append()` 메소드 활용

3등, 4등, ... 의 기록을 위와같이 계속해서 `if... else...`문을 반복해서 구해야 하는가?
그렇게 할 경우 코드가 얼마나 길어져야 하는가?
하지만 이와 같이 하는 일에 따라 코드의 모양과 길이가 심하게 변하는 코드는 피해야 한다.

**질문:** 그렇다면 점수만 뽑아서 모은 다음에 점수들을 순서대로 나열하는 방법이 있으면 좋지 않을까?

**답:** 매우 그렇다.

**방법:** `split()`, `append()` 메소드를 아래와 같이 `for` 문과 함께 활용하면 됨.

In [71]:
record_f = open("record_list.txt", 'r')
record = record_f.read().decode('utf8').split('\n')

time_only = []

for line in record:
    (player, p_record) = line.split()
    time_only.append(float(p_record))

record_f.close()

print(time_only)

[21.09, 20.32, 21.81, 22.97, 23.29, 22.09, 21.2, 22.16]


위 코드는 선수이름과 시간기록을 쪼갠 후 시간기록만 따로 새로운 리스트인 `time_only`에 
추가하는 방식으로 저장하는 내용이다.

**주의:** 추가하기 전에 `float()` 함수를 활용하는 것이 좋다.

이제 위 리스트를 크기 순으로 정렬할 수 있다.

In [74]:
time_only.sort()

그러면 순서가 오름차순으로 정렬된다.

In [75]:
print(time_only)

[20.32, 21.09, 21.2, 21.81, 22.09, 22.16, 22.97, 23.29]


이제 1, 2, 3등의 기록을 확인하기는 매우 쉽다.

In [76]:
from __future__ import print_function

print("1등 기록은", time_only[0], "입니다.")

1등 기록은 20.32 입니다.


In [77]:
print("2등 기록은", time_only[1], "입니다.")

2등 기록은 21.09 입니다.


In [78]:
print("3등 기록은", time_only[2], "입니다.")

3등 기록은 21.2 입니다.


1~3등의 기록을 한꺼번에 확인할 수 있다.

In [79]:
for i in range(3):
    print(i+1, "등 기록은", time_only[i], "입니다.")

1 등 기록은 20.32 입니다.
2 등 기록은 21.09 입니다.
3 등 기록은 21.2 입니다.


### 연습: 슬라이싱 활용

슬라이싱 기술은 문자열의 경우와 동일하다.

1~3등의 기록을 다음처럼 슬라이싱을 이용하여 구할 수도 있다.

In [81]:
first_3 = time_only[:3]

for item in first_3:
    print(item)

20.32
21.09
21.2
