# 자료구조 리스트의 이용

## 리스트를 이용한 자료 처리

자료를 분석하는 첫 단계는 자료를 입력하는 것인데, 파이썬으로 자료를 분석하는 한 가지 방법은 변수 별로 리스트를 만들고 이 리스트에 자료를 저장하는 것이다.

**Note**: 통계분석, 기계학습, 인공지능 분야에서 자료를 처리하기 위해 실제로 사용하는 자료구조는 리스트가 아니다. 리스트보다 더 발전된 자료구조를 사용한다. 현재 많이 사용하는 자료구조는 `numpy` 패키지에서 정의한 `array`와 `pandas` 패키지에서 정의한 `DataFrame`이다. `DataFrame` 자료구조는 `array` 자료구조를 기반으로 만들어졌기 때문에 `DataFrame` 자료구조만 익히면 되지만 `array` 자료구조에 대한 이해는 여전히 필요하다. 리스트 자료구조를 이용하는 방법을 익히면 `DataFrame` 자료구조를 이용하는 방법은 어렵지 않게 익힐 수 있다.

**Note**: 통계분석, 기계학습, 빅데이터 분석, 인공지능 분야를 위해 익혀야 하는 파이썬 패키지는 다음과 같다.

| 분야| 패키지 |
|:-----| :----|
| 수학, 과학 | numpy, scipy |
| 통계분석 | pandas, statsmodels |
| 기계학습 | scikit-learn |
| 심층학습 | keras |
| 시각화 | matplotlib, seaborn, bokeh |



다음은 성인들의 대사율(cal/hour)과 함께 성별, 체중(kg)을 측정한 **대사율 자료**이다.

| gender| weight | rate |
|:-----:| ------| ----:|
| M | 62.0 | 1792 |
| M | 62.9 | 1666 |
| F | 36.1 | 995 |
| F | 54.6| 1425 |
| F | 48.5 | 1396 |
| F | 42.0 | 1418 |
| M | 47.4 | 1362 |
| F | 50.6 | 1502 |
| F | 42.0 | 1256 |
| M | 48.7 | 1614 |
| F | 40.3 | 1189 |
| F | 33.1 | 913 |
| M | 51.9 | 1460 |
| F | 42.4 | 1124 |
| F | 34.5 | 1052 |
| F | 51.1 | 1347 |
| F | 41.2 | 1204 |
| M | 51.9 | 1867 |
| M | 46.9 | 1439 |

한 줄에 입력할 내용이 너무 길면 \\ (backslash)를 입력한 다음 엔터키를 치고 다음 줄에 계속해서 입력하면 된다.

In [0]:
gndr = ['M']*2 + ['F']*4 + ['M'] + ['F']*2 + ['M'] + \
        ['F']*2 + ['M'] + ['F']*4 + ['M']*2
wgt = [62.0, 62.9, 36.1, 54.6, 48.5, 42.0, 47.4,
          50.6, 42.0, 48.7, 40.3, 33.1, 51.9, 42.4,
          34.5, 51.1, 41.2, 51.9, 46.9]
rate = [1792, 1666, 995, 1425, 1396, 1418, 1362, 1502,
        1256, 1614, 1189, 913, 1460, 1124, 1052, 1347,
        1204, 1867, 1439]

**Note**: 프로그램에 직접 자료를 입력하는 것은 현실에서는 거의 일어나지 않는다. 현실에서는 대부분의 경우 자료가 데이터베이스에 저장되어 있거나 파일에 저장되어 있다. 따라서 데이터베이스에 접속하여 자료를 프로그램으로 가져오거나 파일에서 자료를  읽어들이는 방법을 익혀야 한다.

자료의 입력이 완료되면 자료가 제대로 입력되었는지 확인해야 한다.
적어도 입력한 값의 개수는 확인해야 한다.

In [0]:
print(len(gndr))
print(len(wgt))
print(len(rate))

19
19
19


## 리스트에 저장된 자료의 처리

파이썬은 **객체지향 프로그래밍**(object-oriented programming)을 지원하며 리스트 자료구조도 객체지향 프로그래밍으로 만들어졌다.
객체지향 프로그래밍에서는 변수라는 용어보다 **객체**(object)라는 용어를 더 자주 사용한다.
객체는 값을 저장할 뿐만 아니라 자신이 저장하고 있는 값을 처리하는 여러 가지 기능을 내장하고 있다.
프로그래밍에서는 자료를 처리하는 기능을 **함수**(function)로 구현하는데 객체가 가지고 있는 함수를 특별히 **메소드**(method)라고 한다.

객체의 메소드는 함수와 같은 방법으로 실행한다.
다른 점이 있다면 객체 이름 다음에 마침표를 찍고 메소드 이름을 기재하여 메소드가 객체에 부속된 것임을 나타낸다는 것이다.

### 특정 값의 도수 구하기: `count()` 메소드

리스트 객체에 저장된 값 중에서 특정한 값의 개수는 `count()` 메소드로 알아볼 수 있다.
`count()` 메소드를 호출할 때는 개수를 알아보고자 하는 값을 인자로 준다.
다음은 남자와 여자의 수를 알아보는 예이다.

In [0]:
nb_males = gndr.count('M')  # M의 도수, 남자의 수
nb_females = gndr.count('F') # F의 도수, 여자의 수
print(nb_males, nb_females)

7 12


### 특정 값의 위치 구하기: index() 메소드

특정한 값의 인덱스를 알고자 할 때는 특정한 값을 인자로 `index()` 메소드를 호출한다.
만약 인자로 지정한 특정한 값이 리스트에 없는 경우에는 `ValueError` 오류가 발생한다.
만약 특정한 값이 리스트에 여러 개 있으면 첫 번째 값의 위치를 알려 준다.

다음은 첫 번째 여성과 두 번째 여성의 체중을 구하는 예제 프로그램이다.

In [0]:
idx_1st_female = gndr.index('F')
print(idx_1st_female)
print(wgt[idx_1st_female], rate[idx_1st_female])

idx_2nd_female = (idx_1st_female + 1) + gndr[(idx_1st_female + 1):].index('F')
print(wgt[idx_2nd_female], rate[idx_2nd_female])

print(gndr.index('FF'))

2
36.1 995
54.6 1425


ValueError: ignored

### 연습 문제

1. 체중이 51.9kg인 사람의 성별과 대사율을 구하시오.
2. 대사율이 1867사람은 몇 번째 사람인가? 이 사람의 체중과 성별은 무엇인가?

## 값을 마지막에 추가하기: `append()` 메소드

리스트 자료구조의 `append()` 메소드를 이용해서 리스트 객체의 마지막에 새로운 값을 추가할 수 있다.
이때 새로 추가할 값을 `append()` 메소드의 인자로 주면 된다.

In [0]:
data = list(range(5))
print(data)
data.append(6)
data.append('park')
print(data)

[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4, 6, 'park']


In [0]:
seq = list(range(101))

x = []
for number in seq:
    x.append(number / 10) # x = x + [number/10]
    
print(x[:10])

import math

lamda = 2.0
fx = []
for x0 in x:
    fx.append(lamda * math.exp(-lamda * x0))
    
print(fx[:10])


[0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]
[2.0, 1.6374615061559636, 1.3406400920712787, 1.0976232721880528, 0.8986579282344431, 0.7357588823428847, 0.6023884238244043, 0.493193927883213, 0.40379303598931077, 0.33059777644317306]


### `==` 연산자와 `is` 연산자 이해하기

`==` 연산자는 두 객체(변수)가 같은 값을 가지는지를 판단하여 그 결과를 논리값으로 주는 연산자이고, `is` 연산자는 두 객체(변수)가 동일한 객체인지를 판단하여 그 결과를 논리값으로 주는 연산자이다.

다음 코드의 주석을 보고 모든 파이썬 변수는 주소를 저장하는 참조(reference)임과 `=` 연산자가 작동하는 원리를 이해하기 바란다.

In [0]:
data = list(range(10))  # 메모리에 0, 1, 2, ..., 9를 저장한 리스트를 만든다.(객체가 생성된다)
                        # data 변수를 만들고 리스트의 주소를 저장한다.
                        # 이런 상황을 data가 리스트를 가리킨다고 표현한다.
data_ref = data         # data_ref 변수를 만들고 data 변수에 저장된 값(리스트의 주소)을 저장한다. 
                        # 리스트가 복사되는 것이 아니다.
                        # data_ref와 data에는 동일한 리스트의 주소가 저장되어 있다.
                        # 즉, data_ref와 data는 동일한 리스트를 가리킨다.
data_cp = data[:]       # 슬라이싱은 새로운 리스트를 만든다는 것을 기억하기 바란다.
                        # data가 가리키는 리스트의 복사본을 메모리에 만들고 
                        # 그 주소를 data_cp 변수에 저장한다.
                        # data_cp와 data에는 서로 다른 리스트의 주소가 저장되어 있다.
                        # data_cp와 data는 서로 다른 리스트를 가리킨다.

print( data_ref == data)
print(data_cp == data)
print(data_ref is data)
print(data_cp is data)

True
True
True
False


어떻게 연산하느냐에 따라 연산 결과는 같지만 연산 속도가 달라진다는 것을 기억하기 바란다.
리스트에 대한 `+` 연산과 `append()` 메소드의 연산 과정을 비교해보자.

In [0]:
print(data)
print(data is data_ref)

data = data + [9999]    # + 연산은 새로운 리스트를 만든다.
                        # 새로운 리스트 [9999]를 만들고
                        # data가 가리키는 리스트와 [9999]를 결합한 새로운 리스트를 만들고
                        # 그 주소를 data에 저장한다.
                        # data는 이 새로운 리스트를 가리킨다.
print(data)
print(data_ref)
print(data is data_ref)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
True
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 9999]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
False


In [0]:
print(data)
data_ref = data
print(data is data_ref)
data_ref.append(33333)   # append() 메소드는 기존의 리스트에 값을 추가한다.
print(data, data_ref)
print(data is data_ref)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 9999]
True
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 9999, 33333] [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 9999, 33333]
True


In [0]:
x = 12345.7890  # 메모리에 12345.7890을 저장하고
                # 변수 x에 그 주소를 저장한다.
y = x           # x에 저장된 주소를 변수 y에 저장한다.
                # x와 y는 동일한 동일한 객체를 가리킨다.
print(x is y)
y = y + 5       # 변수 y가 가리키는 객체와 5를 더한 새로운 객체를 만든다
                # y에 이 새로운 객체의 주소를 저장한다.
                # x와 y는 다른 객체를 가리킨다.
print(x is y)

True
False


In [0]:
x = 12345.7890
y = x           
print(x is y)
x = 888888      
print(x, y)
print(x is y)

True
888888 12345.789
False


**Note**: 파이썬은 Garbage Collector를 가지고 있으며, Garbage Collector가 메모리를 관리한다. Garbage collector는 메모리에 생성된 객체지만 참조되지 않는 객체는 garbage로 간주하여 제거한다.

### 연습문제

다음 두 프로그램의 실행과정을 설명하고 어떤 프로그램이 더 효율적인지 설명하시오.

```python
seq = list(range(101))
x = []
for i in seq:
    x.append(i/10) 
```


```python
x = []
for number in seq:
    value = number / 10
    x = x + [value]
```

### 특정 값 제거하기: `remove()` 메소드

삭제하고자 하는 값을 인자로 주고 `remove()` 메소드를 실행하면 리스트 객체에서 특정한 값을 제거할 수 있다.
리스트에 삭제하고자 하는 값이 여러 개 저장되어 있으면 제일 먼저 나오는 값 한 개만 삭제한다.

In [0]:
data.append('park')
print(data)
data.remove('park')
print(data)

[0, 1, 2, 3, 4, 6, 'park', 'park']
[0, 1, 2, 3, 4, 6, 'park']


### 값을 임의의 위치에 추가하기: `insert()` 메소드

새로운 값을 리스트의 특정한 위치에 추가하려면 `insert()` 메소드를 사용한다.
`insert()` 메소드를 호출할 때는 추가할 위치의 인덱스와 추가할 값을 인자로 준다.

In [0]:
data.insert(2, 'Joongyang')
data.insert(5, 'GNU')
print(data)

[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park']


### 자료의 복사본 만들기: `copy()` 메소드

파이썬의 변수는 객체의 주소를 저장하고 있다.
따라서 `data2 = data`라는 문장은 `data`에 저장된 객체의 주소를 `data2`에 저장한다.
두 변수 `data`와 `data2`는 동일한 객체를 가리키게 된다.
만약 `data`가 가리키는 객체의 복사본을 새로 생성하고자 할 때는 리스트의 `copy()` 메소드를 실행한다.

변수가 가리키는 객체의 메모리 주소를 알고자 할 때는 `id()` 내장함수를 사용한다.
두 변수가 가리키는 객체의 메모리 주소가 같으면 두 변수는 동일한 객체를 가리키는 것이다.

In [0]:
data2 = data  
print(data)
print(data2)

[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park']
[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park']


In [0]:
data2.append('Jy')
print(data)
print(data2)

[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park', 'Jy']
[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park', 'Jy']


In [0]:
print(id(data))  
print(id(data2))

139841813232904
139841813232904


In [0]:
data is data2

True

In [0]:
id(data) == id(data2)

True

In [0]:
data == data2

True

In [0]:
s = "park joongyang"
ss = s
print(id(s) == id(ss))
print(s is ss)
print(s == ss)

True
True
True


In [0]:
sss = "park joongyang"
print(s is sss)
print(s == sss)

False
True


In [0]:
data_cp = data.copy()  # 복사본은 원본과 다른 객체이다.
print(data)
print(data_cp)
print(data is data_cp)
print(data == data_cp)

[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park', 'Jy']
[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park', 'Jy']
False
True


### 자료의 정렬: `sort()` 메소드

리스트 객체에 저장된 값을 크기순으로 정렬할 때는 `sort()` 메소드를 사용한다.
`sort()` 메소드는 정렬된 결과를 새로 만들어 주지 않고 원본 자체를 변화시키기 때문에 주의해서 사용해야 한다.
인자 없이 실행하면 오름차순으로 정렬하고 내림차순으로 정렬하고자 할 때는 `reverse=True`라는 인자를 주어야 한다.

`sort()` 메소드를 실행할 때는 리스트에 동일한 자료형의 값이 저장되어 있어야 한다.
그렇지 않으면 파이썬이 어떻게 정렬할지 알 수 없기 때문에 오류가 발생할 수 있다.
특히 정렬하기 위해서는 크기 비교를 할 수 있어야 하기 때문에 크기 비교를 할 수 없는 값이 저장된 경우에는 문제가 발생할 수 있다.

**Note**: `reverse=True`에서 `reverse`는 `sort()` 메소드의 `reverse` 매개변수에 `True` 인자를 전달하는 것이다.
메소드나 함수를 실행할 때 괄호 속에 기재하는 인자는 해당 메소드나 함수의 특정 매개변수에 전달되는 값이다.
메소드나 함수는 매개변수를 이용해서 작성된 프로그램이고, 이 프로그램은 인자를 매개변수에 대입한 다음 실행된다.

In [0]:
print(data_cp)

[0, 1, 'Joongyang', 2, 3, 'GNU', 4, 6, 'park', 'Jy']


In [0]:
data_cp.sort()

TypeError: ignored

In [0]:
data_cp.remove(0)
data_cp.remove(1)
data_cp.remove(2)
data_cp.remove(3)
data_cp.remove(4)
data_cp.remove(6)
print(data_cp)

['Joongyang', 'GNU', 'park', 'Jy']


In [0]:
data_cp.sort()
print(data_cp)

['GNU', 'Joongyang', 'Jy', 'park']


### 자료의 삭제: `clear()` 메소드

저장된 값을 전부 삭제한 빈 리스트로 만들고 싶을 때는 `clear()` 메소드를 사용한다.

In [0]:
data_cp.clear()
print(data_cp)

## 리스트 자료구조를 이용한 통계적 자료처리

리스트 자료구조는 자료를 저장하고 처리하는 메소드를 가지고 있지만 자료를 통계적으로 처리하는 메소드는 가지고 있지 않다.
왜냐하면 리스트가 통계적 처리라는 특별한 용도가 아니라 더 일반적인 목적을 위하여 만들어진 자료구조이기 때문이다.

**Note**: 리스트에 저장한 자료를 통계적으로 분석하려면 직접 프로그램해야 한다. 이보다 더 나은 방법은 `numpy`나 `pandas` 패키지(package)에 정의된 자료구조에 자료를 저장하고 이 자료구조가 가진 메소드를 이용하는 것이다.

자료가 $x_i, i=1, 2, \ldots, n$일 때 합과 평균은 $\sum_{i=1}^n x_i$, $\bar{x} = \sum_{i=1}^n x_i / n$로 구한다.
편차는 $\left( x_i - \bar{x} \right), i=1, 2, \ldots, n$, 편차의 제곱합은 $\sum_{i=1}^n \left( x_i - \bar{x} \right)^2$, 분산 $s^2 = \sum_{i=1}^n \left( x_i - \bar{x} \right)^2 / \left( n - 1 \right)$로 구한다.

**대사율자료**에서 체중의 합이나 평균은 다음과 같이 `for` 문장을 사용해서 구할 수 있다.

In [0]:
n = len(weight)

weight_sum = 0                    # 합을 저장할 변수를 만들고 0을 초기화한다.

for wgt in weight:
    weight_sum = weight_sum + wgt # 합을 저장할 변수에 자료를 누적한다.
    
weight_mean = weight_sum / n
print(weight_sum, weight_mean)

888.1 46.742105263157896


`sum()` 내장함수를 사용하면 반복문을 사용하지 않고도 합을 구할 수 있다.

In [0]:
weight_sum = sum(weight)
weight_mean = weight_sum / n
print(weight_sum, weight_mean)

888.1 46.742105263157896


리스트에 저장된 자료의 최소값과 최대값은 내장함수 ` min()`과 `max()`로 구할 수 있다.

In [0]:
weight_max = max(weight)
weight_min = min(weight)
print(weight_min, weight_max)

33.1 62.9


### 연습문제

1. `min()` 함수와 `max()` 함수를 사용하지 않고 최대값과 최소값을 구하는 프로그램을 작성하시오.

값과 평균의 차이인 **편차**(deviation)를 구해주는 내장함수는 없기 때문에 다음과 같이 `for` 문장으로 계산해야 한다.

In [0]:
weight_dev = []

for wgt in weight:
    weight_dev.append(wgt - weight_mean)
    
print(weight_dev)

[15.257894736842104, 16.157894736842103, -10.642105263157895, 7.8578947368421055, 1.757894736842104, -4.742105263157896, 0.6578947368421026, 3.8578947368421055, -4.742105263157896, 1.957894736842107, -6.442105263157899, -13.642105263157895, 5.157894736842103, -4.342105263157897, -12.242105263157896, 4.3578947368421055, -5.542105263157893, 5.157894736842103, 0.15789473684210265]


편차의 제곱합은 다음과 같이 계산할 수 있다.

In [0]:
weight_sse = 0
for wgt_dev in weight_dev:
    weight_sse = weight_sse + math.pow(wgt_dev, 2)
print(weight_sse)

## 간단한 통계분석: `statistics` 모듈

`statistics` 모듈에는 평균, 중앙값, 표준편차, 분산을 구해주는 `mean()`, `median()`, `stdev()`, `variance()` 함수가 정의되어 있다.

In [0]:
import statistics as stat
print(stat.mean(weight))
print(stat.stdev(weight))
print(stat.variance(weight))

46.742105263157896
8.284410780997288
68.63146198830408


### 연습문제

1. `statistics` 모듈에 정의된 함수 중에서 기하평균, 조화평균, 중위수를 구하는 함수를 알아보고 **대사율자료**의 체중과 대사율의 기하평균과 조화평균 그리고 중위수를 구하시오.

2. `statistics` 모듈에는 백분위수를 구하는 `quantiles()` 함수가 정의되어 있다. 이 함수의 사용법을 알아보시오.
매개변수 `n`에 4를 전달하면 전체 자료를 4등분하는 25, 50, 75,백분위수를, 10을 전달하면 10등분하는 10, 20, ..., 90 백분위수를 계산하여 결과를 리스트로 반환한다. **대사율자료**의 체중과 대사율의 20, 40, 60, 80 백분위수를 구하시오. 

## 임의 표집과 순열: `random` 모듈

앞에서 소개한 `random` 모듈에는 난수발생함수 뿐만 아니라 표본추출을 위한 함수도 정의되어 있다.
리스트 자료구조에 저장된 값을 모집단으로 간주하고 여기서 랜덤하게 하나를 표본으로 추출하는 `choice()` 함수, 지정된 크기의 임의 표본을 복원추출(sampling with replacement)하는 `choices()` 함수, 지정된 크기의 임의 표본을 비복원추출(sampling without replacement)하는 `sample()` 함수, 원소의 순서를 랜덤하게 섞어주는 `shuffle()` 함수 등이 있다.

In [0]:
import random
random.seed(12345)
population = ['park', 'kim', 'lee', 'choi', 'kang']
print(random.choice(population))    # random.choices(population, k=3)
sample = random.sample(population, 3)
print(sample)
print(population)
random.shuffle(population)
print(population)
random.shuffle(population)
print(population)

choi
['park', 'lee', 'kim']
['park', 'kim', 'lee', 'choi', 'kang']
['park', 'kang', 'choi', 'lee', 'kim']
['lee', 'kim', 'park', 'choi', 'kang']


### unpacking

리스트에 저장된 여러 개의 값을 한 번에 여러 개의 변수에 나누어 저장하는 것을 `unpacking`이라고 한다.
기본적으로 리스트에 저장된 값의 수만큼의 변수에 저장할 수 있다.

In [0]:
names = ['Kim', 'Lee', 'Park', 'Choi', 'Kang']

In [0]:
name1, name2, name3, name4, name5 = names
print(name1, name5)

Kim Kang


리스트에 저장된 값의 수보다 적은 개수의 변수에 나누어 저장할 수도 있다.
이때 변수마다 한 개의 값을 저장하고 남은 값을 저장할 자료구조 객체 이름 앞에는 `*`를 붙인다.

In [0]:
name1, *name2, name5 = names
print(name1)
print(name2)
print(name5)

Kim
['Lee', 'Park', 'Choi']
Kang


`unpacking`은 뒤에서 배울 튜플(tuple), 셋(set), 사전(dict) 자료구조에도 사용할 수 있다.

### 연습문제

1. 리스트를 비롯한 여러 가지 자료구조에 사용할 수 있는 내장 함수에는 `len()`, `sum()`, `min()`, `max()` 외에도  `all()`, `any()`, `sorted()`, `reversed()` 등이 있다. 이들 함수를 사용하는 예제 프로그램을 작성하시오.

2. 리스트 자료구조의 `reverse()` 메소드에 대해서 알아보시오.

3. 6/45 로또 번호를 자동적으로 생성하는 프로그램을 작성하시오.

4. 다음은 여러 국가의 일인당 연간 포도주 소비량과 심장병으로 인한 사망율을  측정한 **심장병자료**이다.

| country | wine | death_rate |
|:------ | ----:|----------:|
| Australia | 2.5 | 211 |
| Austria | 3.9 | 167 |
| Belgium/Luxembourg | 2.9 | 131 |
| Canada | 2.4 | 191 |
| Denmark | 2.9 | 220 |
| Finland | 0.8 | 297 |
| France | 9.1 | 71 |
| Iceland | 0.8 | 211 |
| Ireland | 0.7 | 300 |
| Italy | 7.9 |  107 |
| Netherlands | 1.8 | 167 |
| New Zealand | 1.9 | 266 |
| Norway | 0.8 | 227 |
| Spain | 6.5 | 86 |
| Sweden | 1.6 | 207 |
| Switzerland | 5.8 | 115 |
| United Kingdom | 1.3 | 285 |
| United States | 1.2 | 199 |
| West Germany | 2.7 | 172 |


다음은 **심장병자료**를 이름이 country, wine, death인 리스트에 저장하는 코드이다.

In [0]:
country = ["Australia", "Austria", "Belgium/Luxembourg", "Canada", "Denmark", 
           "Finland", "France", "Iceland", "Ireland", "Italy",
           "Netherlands", "New Zealand", "Norway", "Spain", "Sweden",
           "Switzerland", "United Kingdom", "United States", "West Germany"]
wine = [2.5, 3.9, 2.9, 2.4, 2.9, 0.8, 9.1, 0.8, 0.7, 7.9, 1.8, 1.9, 0.8, 6.5, 1.6, 5.8, 1.3, 1.2, 2.7]
death = [211, 167, 131, 191, 220, 297, 71, 211, 300, 107, 167, 266, 227, 86, 207, 115, 285, 199, 172]

19 19 19


* 각 list 객체에 저장된 값의 개수를 확인하시오.
* wine, death에 저장된 값의 합, 평균, 편차, 편차 제곱합, 표준편차를 함수를 사용하지 않고 계산하시오.
* wine, death에 저장된 값의 합, 평균, 분산, 표준편차를 함수를 사용하여 계산하시오.
* wine, death에서 구한 편차의 합과 평균을 구하시오.
* 서로 대응하는 wine과 death의 편차를 곱한 것의 합과 평균을 계산하시오.
* 포도주 소비량이 평균 포도주 소비량보다 많은 나라의 이름과 이들 나라의 포도주 소비량과 사망률을 구하시오.