# chapter 1. Python 언어 기본
먼저 **구조화된 또는 비구조화된 데이터를 다루기 위해 필요한** 파이썬 built-in 자료구조와 라이브러리의 기초 지식을 소개한다. 앞으로 이보다 더 많은 basis를 필요로 하겠지만, 대부분은 [파이썬 공식 튜토리얼](http://docs.python.org)을 참고하여 문제를 해결할 수 있다.

>선수 지식:
- 프로그래밍 언어, 주석, 인터프리터
- 쉘
- 객체모델
- main 함수와 인자
- python 2 / 3

>준비 사항:
- python 설치: 아나콘다

In [1]:
from __future__ import division
from numpy.random import randn
import numpy as np
import os
import matplotlib.pyplot as plt
np.random.seed(12345)
plt.rc('figure', figsize=(10, 6))
from pandas import *
import pandas
np.set_printoptions(precision=4)

## 1.1 Python interpreter
파이썬은 인터프리터 언어로서, 한 번에 하나의 명령어만 실행한다. 인터프리터를 실행하는 2가지 방법이 있다:
- python shell: 지금 작성하고 있는 jupyter notebook은 이러한 방법을 활용한 것이다.
- python script file의 실행

### 1.1.1 python shell의 실행
아래와 같이 prompt에서 python을 입력함으로써 파이썬을 실행할 수 있다.
>버전에 따른 환경설정으로 
- python 2.x(주로 2.7)은 python2로 실행할 수 있으며, 
- python 3.x(주로 3.5)는 python3로 실행할 수도 있다.

```
$ python
Python 2.7.2 (default, Oct  4 2011, 20:06:09)
[GCC 4.6.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> a = 5
>>> print (a)
5
```
- `>>>`는 python shell의 prompt이다.
- python shell에 파이썬 문장을 입력함으로써 python 객체를 생성하여 작업을 수행할 수 있다.
- 메모리에 생성된 python 객체는 python shell을 종료하면 모두 사라진다.
- 메모리에 생성된 python 객체를 영구화(disc에 저장)하기 위해 pickle로 저장한다.
- 종료하려면 `exit()` 또는 <kbd>Ctrl+d</kbd>를 누른다.

### 1.1.2 python 파일의 실행
파이썬 인터프리터에서 일련의 파이썬 문장을 한번에 처리하기 위해:
- 파이썬 문장이 들어있는 .py 파일을 인자로 지정하여 실행할 수 있다.
- 물론 .py의 main 함수의 인자를 추가로 지정할 수 있다.

아래와 같이 hello_world.py 파일을 작성하고

In [2]:
%%writefile hello_world.py
print ('Hello world')

Overwriting hello_world.py


다음과 같이 실행하면:
```bash
$ python hello_world.py
Hello world
```
프로그램이 실행되고 그 결과를 얻을 수 있다.

jupyter notebook에서는 아래와 같이 실행할 수 있다.

In [3]:
%run hello_world.py
# !python hello_world.py

Hello world


jupyter notebook은 코딩과 문서를 동시에 생성할 수 있는 인터랙티브한 프로그래밍 방식을 제공한다.
- jupyter notebook에 대한 설명은 나중에 진행하겠다.

---
## 1.2 Python Basics

### 1.2.1 파이썬 문법의 특징
파이썬은 가독성, 명료성을 강조한다. **실행 가능한 의사 코드**라고도 표현한다.

#### 1) Indentation, not braces
중괄호(`{}`) 대신 들여쓰기를 통해 코드를 구조화한다.

for 반복문을 살펴보자:

- 콜론(`:`)은 code block의 시작을 의미
- block이 끝나기까지 block 안의 코드는 모두 같은 들여쓰기(Indentation)를 사용.

다른 언어라면 아래와 같이 사용할 것이다.

위 두 코드는 모두 같은 block 방식을 사용하지만, 가독성이 떨어진다.

이에 반해 공백 문자로 block이 지정된 python 형식의 코드는 훨씬 더 가독성이 높다.
- 보통 들여쓰기에 사용되는 tab 간격은 4칸의 공백을 사용한다.

---
파이썬 문장은 세미콜론(`;`)으로 끝날 필요가 없지만, 아래와 같이 여러 문장을 한 line에 쓸 경우, 세미콜론으로 각 문장을 구분한다.

#### 2) 모든 것은 객체
객체 모델의 일관성은 파이썬의 중요한 특성이다. 

모든 숫자, 문자열, 자료구조, 함수, 클래스, 모듈 등은 파이썬 인터프리터에서 파이썬 객체로 저장된다.

각 객체는 연관된 데이터타입(class)와 데이터(value)를 갖는다.

In [4]:
a = 3
type(a)

int

이때 `a.`으로 타이핑하고 <kbd>[Tab]</kbd>을 누르면, int 객체로서의 메소드를 제공한다.

In [5]:
b = 'python'
type(b)

str

이때 `b.`으로 타이핑하고 <kbd>[Tab]</kbd>을 누르면, str 객체로서의 메소드를 제공한다.

#### 3) 주석
`#` 뒤의 모든 문자는 주석으로 처리된다:
- <kbd>[Ctrl + /]</kbd>로 주석 처리한다.

In [17]:
file_handle = """
foo
soo
woo
noo
doo
"""

results = []
for line in file_handle:
    # keep the empty lines for now
    # if len(line) == 0:
    #   continue
    results.append(line.replace('foo', 'bar'))

#### 4) 함수와 객체 메소드 호출
`def` 지시자로 함수를 생성할 수 있다.

In [18]:
def f(x):
    return x**2
type(f)

function

모든 객체는 멤버 함수로서 메소드를 가지며, 객체의 내부 데이터에 접근할 수 있다.

In [19]:
a.bit_length()

2

- a의 값이 3이므로, bit length는?

함수는 순서별(일반) 인자와 키워드 인자를 동시에 받을 수 있다.

#### 5) 변수와 참조에 의한 전달
파이썬은 변수에 값을 대입하면, 대입연산자의 오른쪽에 있는 객체에 대한 참조를 생성한다.

- 이는 변수를 하나의 객체로 연결한다는 개념이며, 이를 바인딩이라 부르고
- 이때 값이 할당된 변수를 명시적으로 bound variable이라고 부른다.

In [20]:
a = [1, 2, 3]

a를 b라는 변수에 대입한다고 하자. 이때, a와 b는 모두 [1,2,3]이라는 list 객체를 참조한다.

In [21]:
b = a

따라서, 아래와 같이:
- [1,2,3]값을 갖는 list 객체를 참조 a를 이용해 변형하면, 
- 같은 객체를 참조하는 b에 의해 변경된 list 객체에 접근할 수 있게 된다.

In [22]:
a.append(4)
b

[1, 2, 3, 4]

![](https://i.imgur.com/RTyhkxl.png)

함수에 인자로 객체를 넘기면 어떻게 될까?

- 값이 복사되지 않고, 값의 객체에 대한 참조가 전달된다.
- 따라서 python은 참조에 의한 전달을 제공한다.

참조에 의한 전달이 일어나면, 함수에서 전달된 객체를 변경할 수 있다는 의미이다.
>대부분의 언어는 값에 의한 전달(복사)과 참조에 의한 전달을 모두 제공한다.

In [3]:
def append_element(some_list, element):
    some_list.append(element)

참조에 의한 전달결과를 보자!!

In [4]:
origin = [1, 2, 3]
data = origin
append_element(data, 4)

print(origin, data)

[1, 2, 3, 4] [1, 2, 3, 4]


>그러나 실상 내부적으로 보면:
- a -------> list obj: [1, 2, 3]
- a -------> new list obj: [1,2,3,4]
>
>즉, 새로운 list 객체가 생성되고, a는 이 새로운 list 객체를 참조하는 방식으로 이뤄진다.

#### 6) 동적 참조와 strong types
다른 언어와 달리 객체의 참조는 type이 정해져 있지 않다.

반면 객체 그 자체는 type이 정해져 있으며, 다른 언어와 달리 묵시적 형변환에 저항력이 큰 **강한 type** 속성을 갖는다.

>보통의 언어에서는 변수 선언시 변수가 가져야할 data type을 선언한다. 
>
>c언어의 경우: `int a = 0;`
- 그러나 python에서는 변수의 초기화 값으로 변수의 type이 정해지며, 
- 이 때문에, 변수에 서로 다른 type을 갖는 값으로 초기화가 가능하다.

In [25]:
a = 5
type(a)

int

In [26]:
a = 'foo'
type(a)

str

변수는 특정 namespace에 존재하는 객체의 이름, 또는 참조일 뿐이다.

객체의 자료형(type)은 객체 그 자체에 저장되어 있다.

아래 예는 각각 str type 객체('5')와 int type 객체(5)를 + 함수(메소드)로 연결할 때 발생하는 에러를 나타낸다.

In [70]:
try:
    '5' + 5
except TypeError:
    print("문자열과 정수를 더할 수 없다.")

문자열과 정수를 더할 수 없다.


Visual Basic에서는 '5'가 묵시적으로 int 5로 변환되어 10이라는 결과가 나타나며,

java에서는 int 5가 문자열 '5'로 변환되어 '55'로 에러없이 출력될 것이다.

python은 가독성, 명료성을 지향한다고 앞서 이야기하였다. 

이는 아래와 같은 명백한 **연산 가능한 상황**에 대해서만 묵시적 형변환을 허용한다.

In [124]:
a = 4.5
b = 2
# String formatting, to be visited later
print ('a is %s, b is %s' % (type(a), type(b)))

a is <class 'float'>, b is <class 'int'>


In [125]:
a / b

2.25

객체의 자료형을 아는 것은 **매우 매우 매우** 중요하다.

>- 특히나 내가 작성하지 않은 코드를 이해하기 위해서는 자료형과 그 shape(numpy, tensorflow 등)을 이해하는 것이 핵심이다.
>- type이나 isinstance 함수는 이런 경우 매우 유용하다.
>- type은 정확한 class를 리턴하며,
>- isinstance로는 상속 관계를 갖는 여러 class와의 관계를 파악하는데 도움이 된다.

In [126]:
a = 5
isinstance(a, int)

True

In [127]:
type(a)

int

In [128]:
a = 5; b = 4.5
isinstance(a, (int, float))

True

In [129]:
[isinstance(b, int), isinstance(b, float)]

[False, True]

#### 7) Attributes and methods(속성과 메소드)
파이썬 객체는 내부의 값을 저장하는 속성과 그 값을 변경할 수 있는 메소드로 구성된다.

일반적으로 obj.attribute_name 으로 속성과 메소드에 접근할 수 있다.

#### 8) "Duck" typing
컴퓨터 프로그래밍 분야에서 덕 타이핑(duck typing)은 동적 타이핑의 한 종류로, 객체의 변수 및 메소드의 집합이 객체의 타입을 결정하는 것을 말한다. 클래스 상속이나 인터페이스 구현으로 타입을 구분하는 대신, 덕 타이핑은 객체가 어떤 타입에 걸맞은 변수와 메소드를 지니면 객체를 해당 타입에 속하는 것으로 간주한다. “덕 타이핑”이라는 용어는 다음과 같이 표현될 수 있는 덕 테스트에서 유래했다. (덕은 영어로 오리를 의미한다.)
>만약 어떤 새가 오리처럼 걷고, 헤엄치고, 꽥꽥거리는 소리를 낸다면 나는 그 새를 오리라고 부를 것이다.

객체의 자료형 보다는 객체가 어떠한 기능을 갖고 있는 지가 관심있다면, 예를 들어, iterable 객체인지 관심있다면, iter 함수를 이용하여 검사할 수 있다.


In [73]:
def isiterable(obj):
    try:
        iter(obj)
        return True
    except TypeError: # not iterable
        return False

In [130]:
print (isiterable('a string'))
print (isiterable([1, 2, 3]))
print (isiterable(5))

True
True
False


여러개의 속성을 갖고 있어 iterable하지만, list가 아닌 경우 list로 처리하도록 할 수 있다.

#### 9) 모듈 임포트(Module Imports)
파이썬에서 모듈은 사전 정의된 함수와 클래스의 묶음인 .py 파일이다.

다음과 같은 변수와 함수를 같고 있는 모듈이 있다고 하자.

In [75]:
%%writefile some_module.py
# some_module.py
PI = 3.14159

def f(x):
    return x + 2

def g(a, b):
    return a + b

Overwriting some_module.py


같은 디렉토리에 있는 some_module.py 파일을 import하여 여기에 있는 함수를 다음과 같은 방법으로 사용할 수 있다.
- 모듈을 import 하는 순간 모듈에 있는 모든 함수와 객체들은 메모리로 올라온다.

In [76]:
import some_module
result = some_module.f(5)
pi = some_module.PI

메모리가 부담이라면 아래와 같이 필요로하는 함수만 가져올 수도 있다.

In [77]:
from some_module import f, g, PI
result = g(5, PI)

아래와 같이 name을 변경하여 사용할 수도 있다.

In [78]:
import some_module as sm
from some_module import PI as pi, g as gf

r1 = sm.f(pi)
r2 = gf(6, pi)

#### 10) Binary operators and comparisons
![](http://slideplayer.com/6506861/22/images/8/Python+Operators+Precedence.jpg)
![](http://slideplayer.com/6506861/22/images/5/Python+Bitwise+Operators%3A.jpg)

In [79]:
5 - 7

-2

In [80]:
12 + 21.5

33.5

In [81]:
5 <= 2

False

In [82]:
a = [1, 2, 3]
b = a
# Note, the list function always creates a new list
c = list(a)
a is b

True

In [83]:
a is not c

True

`is` 연산자는 객체의 비교이지만, `==` 연산자는 값의 비교이다.

In [84]:
a == c

True

In [85]:
a = None
a is None

True

#### 11) Strictness versus laziness
파이썬은 기본적으로 문장이 실행되면, 연산이 곧바로 이뤄진다.(Strictness)

반면, 많은 함수형 언어들(haskel, scala 등)은 연산 알고리즘만 기억되고, 추후 평가하기 위한 연산(save 등)이 제출될 때, 한꺼번에 늦게(lazy) 연산이 수행된다.
>일반적으로 대용량의 데이터를 다룰 때는 lazy 연산이 유리하다. python도 generator나 iterator를 이용하여 이러한 lazy 연산을 지원할 수 있다.

In [86]:
a = b = c = 5
d = a + b * c
d

30

#### 12) Mutable and immutable objects
python 대부분의 객체(list, dict, array, np.array, user-defined class 등)는 mutable(값을 수정할 수 있는) 객체이다. 특별히 lazy 연산을 지원하는 객체들은 대부분 immutalbe하다.

immutable type: 변경 불가능한 type:
1. 종류
    - Numeric types: int, float, complex
    - string
    - tuple
    - frozen set
    - bytes
2. 특징
    - copy() 메소드가 없다.
    - reference에서 값 변경시 완전히 새로운 객체가 생성된다.
    - item을 변경할 수 없으며, 객체를 새로 생성할 수 있을 뿐이다.

mutable type: 변경 가능한 type
1. 종류
    - list
    - dict
    - set
    - byte array
2. 특징
    - dict는 얕은 복사를 제공하는 copy() 메소드를 가진다.
    - List[:]와 List.copy()는 완전히 새로운 객체를 생성한다.
    - item을 추가/삭제할 수 있으며, 참조도 같이 변경된다.

In [87]:
a_list = ['foo', 2, [4, 5]]
a_list[2] = (3, 4)
a_list

['foo', 2, (3, 4)]

In [131]:
a_tuple = (3, 5, (4, 5))
try :
    a_tuple[1] = 'four'
except Exception as e: 
    print(e)

'tuple' object does not support item assignment


### 1.2.2 Scalar Types
파이썬은 숫자, 문자열, 조건값(참/거짓), 날짜와 시간을 다룰 수 있는 스칼라 내장 자료형을 갖는다.

![](https://media.licdn.com/mpr/mpr/AAEAAQAAAAAAAAqnAAAAJDhjYTZjZDA2LTUzMDQtNGUwMi04YjNjLTFhZWEwMjg1NzFkMw.png)

python built-in type에 대한 더 자세한 내용은 [python 공식 문서](https://docs.python.org/2/library/stdtypes.html)를 참조한다.

#### 1) Numeric types
수치형을 위한 기본적으로 int, float를 제공한다. 
- 플랫폼에 따라 int 형은 int32 또는 int64 형으로 변환되며, 매우 큰 수치를 위해 long으로 자동 변환된다.
- float는 내부적으로 float 64형으로 사용된다.

In [1]:
ival = 17239871
ival ** 6

26254519291092456596965462913230729701102721

In [2]:
fval = 7.243
fval2 = 6.78e-5
fval2

6.78e-05

python2에서는 정수간 연산은 정수를 반환하지만,

python3에서는 필요시 float를 반환한다.

In [4]:
3 / 2

1.5

python2에서 python3와 같이 동작하기 위해 아래와 같이 division 함수를 import할 수 있다.

In [5]:
from __future__ import division

In [6]:
3 / 2

1.5

보다 분명하게 명시적 변환을 통해 python3와 같이 동작시키도록 할 수 있다.

In [7]:
3 / float(2)

1.5

In [8]:
3 // 2

1

복소수의 허수부를 j로 표현하여 복소수 연산도 가능하다.

In [9]:
cval = 1 + 2j
cval * (1 - 2j)

(5+0j)

#### 2) Strings
python의 강력하고 유연한 문자열 처리방식 때문에 python을 많이 애용한다.

In [10]:
a = 'one way of writing a string'
b = "another way"

개행문자(줄넘김 \n)를 포함한 문자열은 """ """ 또는 ''' '''로 지정할 수 있다.

In [11]:
c = """
This is a longer string that
spans multiple lines
"""

주지하였듯이 string은 immutalbe하므로 아래와 같이 수정할 수 없다.

In [104]:
a = 'this is a string'
try: a[10] = 'f'
except Exception as e : print(e)

'str' object does not support item assignment


In [107]:
b = a.replace('string', 'longer string')
b

'this is a longer string'

명시적으로 문자열로 변경하기 위해 str 함수를 사용할 수 있다.

In [77]:
a = 5.6
s = str(a)
s

'5.6'

문자열을 list 함수로 list로 변경할 수 있다.

In [78]:
s = 'python'
list(s)
s[:3]

'pyt'

문자열 내 특수문자를 나타내기 위해서는 `\`를 prefix로 사용하여 표현할 수 있다.

In [103]:
s = '12\\34'
print (s)

12\34


특수문자를 특수문자 그대로 해석하기 위해 r'문자열' 형식을 제공한다. 여기서 r은 raw라는 의미를 갖는다.

In [210]:
s = r'this\has\no\%special\#characters'
s

'this\\has\\no\\%special\\#characters'

In [211]:
print(s)

this\has\no\%special\#characters


문자열간의 결합은 `+` 연산자로 쉽게 구현할 수 있다.

In [109]:
a = 'this is the first half '
b = 'and this is the second half'
a + b

'this is the first half and this is the second half'

문자열에 대한 formating이 가능한데, c언어의 printf 함수와 유사하다.

In [212]:
template = '%.2f %s are worth $%d'

- %로 대체할 변수의 type을 .2f(소수점 2자리 float) s(문자열), d(digit)으로 지정하고,
- 문자열 밖에서 %로 대체할 값을 tuple로 입력해준다.

In [213]:
template % (4.5560, 'Argentine Pesos', 1)

'4.56 Argentine Pesos are worth $1'

#### 3) Booleans
조건값(Boolean)은 True와 False로 지정한다.

In [112]:
True and True

True

In [113]:
False or True

True

대부분의 python 내장 자료형과 class는 `__nonzero__`라는 메소드를 제공하여 if 문에서 조건비교를 가능하게 해준다.

list나 tuple 등은 값이 비어 있으면, False로 간주되며, 값이 존재하면 True로 간주된다.

또한 0은 False로 0이 아닌 값은 True로 간주된다.

In [214]:
a = [1, 2, 3]
if a:
    print ('I found something!')

I found something!


In [215]:
b = []
if not b:
    print ('Empty!')

Empty!


In [216]:
bool([]), bool([1, 2, 3])

(False, True)

In [117]:
bool('Hello world!'), bool('')

(True, False)

In [118]:
bool(0), bool(1)

(False, True)

In [119]:
bool(0.), bool(-1.)

(False, True)

#### 4) Type casting
str, bool, int float는 형변환을 하는 함수로 사용된다.

In [120]:
s = '3.14159'
fval = float(s)
type(fval)

float

In [121]:
int(fval)

3

In [122]:
bool(fval)

True

In [123]:
bool(0)

False

#### 5) None
None은 python에서 사용하는 Null 값이다. 어떤 함수가 값을 반환하지 않으면 기본적으로 None을 반환한다.

In [124]:
a = None
a is None

True

In [125]:
b = 5
b is not None

True

함수 옵션의 기본 인자로 사용된다.

In [126]:
def add_and_maybe_multiply(a, b, c=None):
    result = a + b

    if c is not None:
        result = result * c

    return result

In [127]:
add_and_maybe_multiply(3, 5, 8)

64

#### 6) Dates and times
python 내장 datatime 모듈로 date와 time을 다룰 수 있다.

datatime 모듈을 다루는 자세한 내용은 10장을 참조하라.

In [317]:
from datetime import datetime, date, time
dt = datetime(2011, 10, 29, 20, 30, 21)
print (dt.day)
print (dt.minute)

29
30


In [318]:
try:
    dt1 = datetime(2011, 10, 32, 20, 30, 21)
    print (dt1.day)
    print (dt1.minute)
except Exception as e : print(e)

day is out of range for month


In [319]:
print (dt.date())
print (dt.time())

2011-10-29
20:30:21


In [130]:
type(dt)

datetime.datetime

strftime(str from time) 함수로 datatime 객체를 str으로 변경할 수 있다.

In [320]:
dt.strftime('%m/%d/%Y %H:%M')

'10/29/2011 20:30'

In [321]:
dt.strftime('%Y/%m/%d %H:%M')

'2011/10/29 20:30'

역으로 strptime(str parsed time) 함수로 str을 datetime 객체로 변환할 수 있다.

In [322]:
datetime.strptime('20091031', '%Y%m%d')

datetime.datetime(2009, 10, 31, 0, 0)

In [323]:
dt.replace(minute=0, second=0)

datetime.datetime(2011, 10, 29, 20, 0)

두 datetime 객체의 차는 datetime.timedelta 객체를 반환한다.

dt = '2011/10/29 20:30'

In [324]:
dt2 = datetime(2011, 11, 15, 22, 30)
delta = dt2 - dt
delta

datetime.timedelta(17, 7179)

In [135]:
type(delta)

datetime.timedelta

datetime.timedelta 객체를 통해 datatime 객체에 대한 연산을 수행할 수 있다.

In [136]:
dt
dt + delta

datetime.datetime(2011, 11, 15, 22, 30)

### 1.2.3 Control Flow

#### 1) If, elif, and else

In [137]:
x = -1.
if x < 0:
    print ('It\'s negative')

It's negative


In [138]:
if x < 0:
    print ('It\'s negative')
elif x == 0:
    print ('Equal to zero')
elif 0 < x < 5:
    print ('Positive but smaller than 5')
else:
    print ('Positive and larger than 5')

It's negative


In [326]:
a = 8; b = 7
c = 2; d = 4
if a < b or c > d:
    print ('Made it')

#### 2) For loops
여러 개의 값을 담고 있는 collection 객체의 각 성분에 대한 특정 연산을 아래와 같이 수행할 수 있다.
```
for value in collection:
    # do something with value
```

for 문 또는 while 등의 반복문에서 사용되는 특수 문장
- continue: 이하의 문장을 실행하지 않고, loop를 다시 돈다.
- break: 이하의 문장을 실행하지 않고, 바로 loop를 빠져나온다.

In [333]:
sequence = [1, 2, None, 4, None, 5]
sequence2 = [1, 2, 1234567890, 5]
total = 0
for a in sequence:
    if a is None:
        continue
    total += a
total

3

- a +=3 : a = a + 3
- a =+3 : a = 3

In [331]:
f = 0
g = 0
for a in range(4):
    f += a; g =+ a
    print(f,g)
print("=====")
print(f,g)

0 0
1 1
3 2
6 3
=====
6 3


In [141]:
sequence = [1, 2, 0, 4, 6, 5, 2, 1]
total_until_5 = 0
for value in sequence:
    if value == 5:
        break
    total_until_5 += value
total_until_5

13

collection의 원소가 scalar가 아닌 tuple이나 list 등인 경우, 아래와 같이 여러 변수로 꺼내어 연산을 처리할 수 있다.

In [337]:
l = [(1,2,3), (4,5,6), (7,8,9)]
for a, b, k in l:
    print(a, b)

1 2
4 5
7 8


#### 3) While loops

In [338]:
x = 256
total = 0
while x > 0:
    if total > 500:
        print ("x = ", x)
        break
    total += x
    x = x // 2
print ('total = ', total)

x =  4
total =  504


#### 4) pass
indent로 구분되는 block 내에서 아무 작업도 하지 않고, 나중에 작업할 내용을 남겨둘 때 사용한다.

In [143]:
x = 0.
if x < 0:
    print ('negative!')
elif x == 0:
    # TODO: put something smart here
    pass
else:
    print ('positive!')

In [144]:
def f(x, y, z):
    # TODO: implement this function!
    pass


#### 5) Exception handling

In [340]:
float('1.2345')

1.2345

In [341]:
int(float('1.2345'))

1

In [146]:
float('something')

ValueError: could not convert string to float: 'something'

예외처리는 다음과 같이 수행할 수 있다.

In [342]:
def attempt_float(x):
    try:
        return float(x)
    except:
        return x

In [343]:
attempt_float('1.2345')

1.2345

In [344]:
attempt_float('something')

'something'

In [345]:
float((1, 2))

TypeError: float() argument must be a string or a number, not 'tuple'

특정한 type의 error에 대해 예외 처리를 위에 error type을 명시할 수 있다.

In [346]:
def attempt_float(x):
    try:
        return float(x)
    except ValueError:
        return x

In [225]:
attempt_float("something")

'something'

In [347]:
attempt_float((1, 2))

TypeError: float() argument must be a string or a number, not 'tuple'

tuple을 이용하여 여러 에러를 동시에 처리할 수 있다.

In [349]:
def attempt_float(x):
    try:
        return float(x)
    except (TypeError, ValueError):
        return x

In [351]:
def attempt_float(x):
    try:
        return float(x)
    except Exception :
        return x

In [352]:
attempt_float((1, 2))

(1, 2)

예외와 관련없이 항상 수행시키고 싶은 코드는 finally: 블럭을 사용한다.

try 블록이 성공했을 때만 수행하고 싶은 코드는 else 블락에 둔다.

In [354]:
#-*- coding: utf-8 -*-
import codecs

# f = codecs.open('a.txt', 'w', "cp949")
f = codecs.open('a.txt', 'w', "utf-8")

try:
    for i in range(1, 11):
        data = u"%d번째 줄입니다.\n" % i
        f.write(data)
#         print ('Succeeded')
except:
    print ('Failed')
else:
    print ('Succeeded')
finally:
    f.close()

Succeeded


In [355]:
!type a.txt

1踰덉㎏ 以꾩엯�땲�떎.
2踰덉㎏ 以꾩엯�땲�떎.
3踰덉㎏ 以꾩엯�땲�떎.
4踰덉㎏ 以꾩엯�땲�떎.
5踰덉㎏ 以꾩엯�땲�떎.
6踰덉㎏ 以꾩엯�땲�떎.
7踰덉㎏ 以꾩엯�땲�떎.
8踰덉㎏ 以꾩엯�땲�떎.
9踰덉㎏ 以꾩엯�땲�떎.
10踰덉㎏ 以꾩엯�땲�떎.


In [356]:
%pycat a.txt

In [357]:
!del a.txt

#### 6) range and xrange
python2에서 list를 생성하는 range 함수는 마지막 index의 값은 포함하지 않는다.

xrange는 list를 생성하지 않고, iterator를 생성하므로:
- 전체 값을 한번에 생성하지 않고,
- for문을 돌며, 각 loop 마다 값을 생성하기 때문에 
- 매우 큰 수열 값에 대한 연산 처리에 유리하다.

python3에서의 range는 python2의 xrange와 동일하게 동작한다.

In [358]:
range(10)

range(0, 10)

In [359]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [236]:
range(0, 20, 2)

range(0, 20, 2)

In [238]:
seq = [1, 2, 3, 4]
val = []
for i in range(len(seq)):
    val.append(seq[i]*2)
val

[2, 4, 6, 8]

In [360]:
sum = 0
for i in range(10000):
    # % is the modulo operator
    if i % 3 == 0 or i % 5 == 0:
        sum += i
sum

23331668

#### 7) Ternary Expressions(삼단 표현식)
변수 = 참값 if 조건식 else 거짓값

In [241]:
x = 5
value = 'Non-negative' if x >= 0 else 'Negative'
value

'Non-negative'

In [None]:
x =5
if x >=0 :
    value = 'Non-negative'
else :
    value = 'Negative'

## 1.3 Data structures and sequences

### 1.3.1 Tuple

In [361]:
tup = 4, 5, 6
tup

(4, 5, 6)

In [362]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

In [363]:
tup2 = 4, True, "sample"
tup2

(4, True, 'sample')

모든 sequence data는 tuple로 변환될 수 있다.

In [364]:
tuple([4, 0, 2])

(4, 0, 2)

In [365]:
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

In [366]:
tup[0]

's'

tuple은 기본적으로 immutable하기 때문에, elemnet의 값 자체를 대체시킬 수 없다.

In [368]:
tup = tuple(['foo', [1, 2], True])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

그러나 아래와 같이 element 객체(이 객체가 list 등 mutable한 경우라면)의 변형은 가능하다.

In [370]:
# however
tup[1].append(3)
tup

('foo', [1, 2, 3, 3], True)

tuple의 각 객체를 더하여 다른 tuple 객체를 리턴할 수 있다.

In [281]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

In [282]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

#### 1) Unpacking tuples

In [371]:
tup = (4, 5, 6)
t2 = a, b, c = tup
print(b)
t2

5


(4, 5, 6)

In [375]:
tup = 4, 5, (6, 7)
a, b, (c, d) = tup
d

7

In [377]:
tup[2][1]

7

tuple로 생성한 변수의 값 치환하기

In [382]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
for a, b, c in seq:
    print (a+b+c, end=" : ")

6 : 15 : 24 : 

#### 2) Tuple methods

In [535]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

a.<kbd>Tab</kbd>

In [387]:
a.index(4, 1,4)

ValueError: tuple.index(x): x not in tuple

In [388]:
a[-1]

2

In [390]:
len(a)

7

In [536]:
a.index

4

In [538]:
a = (1,2)
any(a)

True

In [542]:
a = (1, 0)
any(a)

True

tuple의 주요한 메소드는 Collections 관련 내장 함수들 :

| Method | Description |
|-------------------------|----------------------------------------------------|
| Python Tuple count() | returns occurrences of element in a tuple |
| Python Tuple index() | returns smallest index of element in tuple |
| Python any() | Checks if any Element of an Iterable is True |
| Python all() | returns true when all elements in iterable is true |
| Python ascii() | Returns String Containing Printable Representation |
| Python bool() | Converts a Value to Boolean |
| Python enumerate() | Returns an Enumerate Object |
| Python filter() | constructs iterator from elements which are true |
| Python iter() | returns iterator for an object |
| Python len() | Returns Length of an Object |
| Python max() | returns largest element |
| Python min() | returns smallest element |
| Python map() | Applies Function and Returns a List |
| Python reversed() | returns reversed iterator of a sequence |
| Python slice() | creates a slice object specified by range() |
| Python sorted() | returns sorted list from a given iterable |
| Python sum() | Add items of an Iterable |
| Python tuple() Function | Creates a Tuple |
| Python zip() | Returns an Iterator of Tuples |

### 1.3.2 List
mutable 객체이므로 list 각 elements의 값을 바꿀 수 있다.

In [391]:
a_list = [2, 3, 7, None]

tup = ('foo', 'bar', 'baz')
b_list = list(tup)
b_list

['foo', 'bar', 'baz']

In [392]:
b_list[1] = 'peekaboo'
b_list

['foo', 'peekaboo', 'baz']

#### 1) Adding and removing elements

In [393]:
b_list.append('dwarf')
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

In [394]:
b_list.insert(1, 'red')
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

In [395]:
b_list.pop(2)
b_list

['foo', 'red', 'baz', 'dwarf']

In [297]:
b_list.pop()
b_list

['foo', 'red', 'baz']

In [298]:
b_list.pop

<function list.pop>

In [299]:
b_list.append('foo')
b_list

['foo', 'red', 'baz', 'foo']

In [300]:
b_list.remove('foo')
b_list

['red', 'baz', 'foo']

In [301]:
'dwarf' in b_list

False

#### 2) Concatenating and combining lists

In [396]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

In [397]:
x = [4, None, 'foo']
x.append([7, 8, (2, 3)])
x

[4, None, 'foo', [7, 8, (2, 3)]]

In [398]:
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])
x

[4, None, 'foo', 7, 8, (2, 3)]

list에서 extend 메소드와 `+` 연산자의 차이점
-  object를 맨 뒤에 추가한다.
- iterable 객체(리스트, 튜플, 딕셔너리 등)의 엘레멘트를 list에 appending시킨다.

In [399]:
# list_of_lists = [[1,2,3], list("abc"), (5,6)]
list_of_lists = [[1,2,3], "abc", (5,6)]
everything = []

for chunk in list_of_lists:
    everything.extend(chunk)
everything

[1, 2, 3, 'a', 'b', 'c', 5, 6]

In [None]:
everything = []
for chunk in list_of_lists:
    everything = everything + [chunk]

everything

In [403]:
everything = []
for chunk in list_of_lists:
    for el in chunk:
        everything = everything + [el]

everything

[1, 2, 3, 'a', 'b', 'c', 5, 6]

In [406]:
list_of_lists = [[1,2,3], list("abc"), list((5,6))]
everything = []

for chunk in list_of_lists:
    everything = everything + chunk
everything

[1, 2, 3, 'a', 'b', 'c', 5, 6]

#### 3) Sorting
List.<kbd>[Shift + Tab]</kbd>

In [407]:
a = [7, 2, 5, 1, 3]
a.sort()
a

[1, 2, 3, 5, 7]

In [420]:
b = ['small', 'six', 'saw', 'He', 'foxes']
b.sort(key=len)
b

['He', 'six', 'saw', 'small', 'foxes']

#### 4) Binary search and maintaining a sorted list
bisect 모듈은 정렬될 list에 대한 이진 탐색과 정렬을 유지한 상태에서 삽입 기능을 제공한다.

In [422]:
import bisect
c = [1, 4, 2, 7, 3, 2, 5]
c.sort()
c

[1, 2, 2, 3, 4, 5, 7]

값이 2인 다음 elemnet의 index를 반환한다.

In [425]:
bisect.bisect(c, 2)

3

In [426]:
bisect.bisect(c, 5)

6

정렬된 list에 insort 함수로 element를 삽입하면:
1. 정렬된 상태가 유지된 상태에서 적절한 위치에 삽입이 발생하고, 
2. 삽입된 list로 list 객체가 변환된다.

In [427]:
bisect.insort(c, 6)
c

[1, 2, 2, 3, 4, 5, 6, 7]

#### 5) Slicing
![](https://infohost.nmt.edu/tcc/help/pubs/python/web/fig/slicing.png)

In [428]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
seq[1:5]

[2, 3, 7, 5]

In [429]:
seq[3:4] = [6, 3]
seq

[7, 2, 3, 6, 3, 5, 6, 0, 1]

In [430]:
seq[:5]

[7, 2, 3, 6, 3]

In [431]:
seq[3:]

[6, 3, 5, 6, 0, 1]

In [443]:
seq[-4:]

[5, 6, 0, 1]

In [437]:
seq[-6:-2]

[6, 3, 5, 6]

In [444]:
seq[-6:-2][::-1]

[6, 5, 3, 6]

In [453]:
seq[-3:-7:-1]

[6, 5, 3, 6]

In [454]:
seq[::2]

[7, 3, 3, 6, 1]

In [455]:
seq[::-1]

[1, 0, 6, 5, 3, 6, 3, 2, 7]

### 1.3.3 Built-in Sequence Functions

#### 1) enumerate
iterator의 element와 loop의 index를 반환한다.

enumerate 함수가 없다면, 각 collection의 element와 index를 동시에 사용하려면 아래와 같이 코딩해야 한다.

enumerate 함수를 사용하면아래와 같이 간단하게 작업할 수 있다.

예제를 보자. 아직 학습하지 않았으나, dict는 key 순서대로 print가 이뤄진다.

In [461]:
some_list = ['foo', 'bar', 'baz']
mapping = dict((v, i) for i, v in enumerate(some_list))
mapping

{'foo': 0, 'bar': 1, 'baz': 2}

enumerate를 언제 쓰는가? 아래 예는 매우 유용한 enumerate 사용법이다.
![](https://www.w3resource.com/w3r_images/python-data-type-list-exercise-12.png)

#### 2) sorted
collection을 정렬된 list로 반환한다.

In [250]:
sorted([7, 1, 2, 6, 0, 3, 2])

[0, 1, 2, 2, 3, 6, 7]

In [458]:
l = [7, 1, 2, 6, 0, 3, 2]
sorted(l)
l.sort()
l

[0, 1, 2, 2, 3, 6, 7]

In [251]:
sorted((7, 1, 2, 6, 0, 3, 2))

[0, 1, 2, 2, 3, 6, 7]

In [467]:
sorted(mapping)

['bar', 'baz', 'foo']

In [468]:
list(mapping)

['foo', 'bar', 'baz']

In [466]:
mapping

{'foo': 0, 'bar': 1, 'baz': 2}

In [471]:
mapping['foo']

0

In [472]:
a = [
    (key, mapping[key])
    for key in mapping
]
sorted(a)

[('bar', 1), ('baz', 2), ('foo', 0)]

In [474]:
b = [['bar', 1], ('baz', 2), ('foo', 0)]
dict(b)

{'bar': 1, 'baz': 2, 'foo': 0}

In [473]:
dict(a)

{'foo': 0, 'bar': 1, 'baz': 2}

In [475]:
sorted(mapping.values())

[0, 1, 2]

In [481]:
list(mapping)

['foo', 'bar', 'baz']

In [482]:
sorted('horse race')

[' ', 'a', 'c', 'e', 'e', 'h', 'o', 'r', 'r', 's']

set은 중복된 element를 제거한다.

In [483]:
sorted(set('this is just some string'))

[' ', 'e', 'g', 'h', 'i', 'j', 'm', 'n', 'o', 'r', 's', 't', 'u']

#### 3) zip
2개 이상의 length가 같은 collection을 각 elements를 tuple로 묶은 하나의 list로 반환한다.
![](http://cfile5.uf.tistory.com/image/9980C43359C3A44C40A01F)

In [486]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
list(zip(seq1, seq2))

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

length가 다른 경우에는 작은 length size로 축약된다.

In [487]:
seq3 = (False, True)
list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

In [489]:
for i, (a, b) in enumerate(zip(seq1, seq2)):
    print('%d: %s, %s' % (i, a, b))

0: foo, one
1: bar, two
2: baz, three


`zip(*sequnece_obj)`는 sequnece_obj의 각 elements를 `(*args)`와 같이 tupled arg.로 처리하게 해준다.

In [490]:
pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'),
            ('Schilling', 'Curt')]
first_names, last_names = zip(*pitchers)
print (first_names)
print (last_names)

('Nolan', 'Roger', 'Schilling')
('Ryan', 'Clemens', 'Curt')


정리하면 `zip(seq1, seq2)`는 `zip(*list(seq1, seq2))`와 동일하다.

이를 아래와같이 일반화할 수 있다.

#### 4) reversed
순차 자료형을 역순으로 순회한 iterator를 반환한다.

In [491]:
print (reversed(range(10)))
list(reversed(range(10)))

<range_iterator object at 0x00000283AD2E7ED0>


[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [493]:
print (range(10)[::-1])
list(range(10))[::-1]

range(9, -1, -1)


[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [495]:
list(range(9, -1, -1))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

List의 주요한 메소드:

| Method | Description |
|-----------------------|-------------------------------------------|
| Python List append() | Add Single Element to The List |
| Python List extend() | Add Elements of a List to Another List |
| Python List insert() | Inserts Element to The List |
| Python List remove() | Removes Element from the List |
| Python List index() | returns smallest index of element in list |
| Python List count() | returns occurrences of element in a list |
| Python List pop() | Removes Element at Given Index |
| Python List reverse() | Reverses a List |
| Python List sort() | sorts elements of a list |
| Python List copy() | Returns Shallow Copy of a List |
| Python List clear() | Removes all Items from the List |

List 등의 Iterator에서 주요하게 사용하는 내장 함수 :

| Built-in function | Description |
|------------------------|----------------------------------------------------|
| Python any() | Checks if any Element of an Iterable is True |
| Python all() | returns true when all elements in iterable is true |
| Python ascii() | Returns String Containing Printable Representation |
| Python bool() | Converts a Value to Boolean |
| Python enumerate() | Returns an Enumerate Object |
| Python filter() | constructs iterator from elements which are true |
| Python iter() | returns iterator for an object |
| Python list() Function | creates list in Python |
| Python len() | Returns Length of an Object |
| Python max() | returns largest element |
| Python min() | returns smallest element |
| Python map() | Applies Function and Returns a List |
| Python reversed() | returns reversed iterator of a sequence |
| Python slice() | creates a slice object specified by range() |
| Python sorted() | returns sorted list from a given iterable |
| Python sum() | Add items of an Iterable |
| Python zip() | Returns an Iterator of Tuples |

### 1.3.4 Dict
해시맵 또는 사전이라고 부르며, key-value pairs data를 다룬다.

In [496]:
empty_dict = {}
d1 = {'a' : 'some value', 'b' : [1, 2, 3, 4]}
d1

{'a': 'some value', 'b': [1, 2, 3, 4]}

In [497]:
d1[7] = 'an integer'
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}

In [499]:
d1['b'] = [1,2,3,4,5]
d1['b']

[1, 2, 3, 4, 5]

In [500]:
'b' in d1

True

In [507]:
d1[5] = 'some value'
d1['dummy'] = 'another value'
d1['dummy'] = 'the another value'
d1

{'a': 'some value',
 'b': [1, 2, 3, 4, 5],
 7: 'an integer',
 'dummy': 'the another value',
 5: 'some value'}

In [508]:
del(d1[5])
del d1[7]
d1

{'a': 'some value', 'b': [1, 2, 3, 4, 5], 'dummy': 'the another value'}

print 문장을 사용할 때와 dict obj를 호출한 결과 key의 배열 순서가 약간 다르다.

In [509]:
ret = d1.pop('dummy')
print (ret)
print (d1)

the another value
{'a': 'some value', 'b': [1, 2, 3, 4, 5]}


In [510]:
print (d1.keys())
print (d1.values())

dict_keys(['a', 'b'])
dict_values(['some value', [1, 2, 3, 4, 5]])


>python3에서는 keys(), values() 메소드는 list가 아닌 iterator를 반환한다.

update 메소드를 통해 사전을 합칠 수 있다. 이때 동일한 키의 value는 업데이트된다.

In [511]:
d1.update({'b' : 'foo', 'c' : 12})
d1

{'a': 'some value', 'b': 'foo', 'c': 12}

dict에서 동일한 key를 갖는 2개의 element는 존재하지 않는다. key는 unique하다.

In [512]:
d2 ={'a':[4,5], 'b':"abc", 'a':2}
d2

{'a': 2, 'b': 'abc'}

#### 1) Creating dicts from sequences
zip을 이용하면 쉽게 dict 객체를 생성할 수 있다.

In [272]:
key_list = d1.keys(); value_list = d1.values()

mapping = {}
for key, value in zip(key_list, value_list):
    mapping[key] = value
    
mapping

{'a': 'some value', 'b': 'foo', 7: 'an integer', 'c': 12}

In [513]:
mapping = dict(zip(range(5), reversed(range(5))))
mapping

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

#### 2) Default values
아래는 매우 일반적인 로직이다.

이 로직을 간단히 get 메소드에 default_value를 제공하여 에러를 방지할 수 있다.

In [518]:
value = d1.get(7, "defualts")
print(value)

defualts


In [525]:
words = [123, 'apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}

for word in words:
    letter = str(word)[0]
    if letter not in by_letter:
        by_letter[letter] = [word]
    else:
        by_letter[letter].append(word)

by_letter

{'1': [123], 'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

dict의 setdefault 메소드를 이용하면, 위 if-else 문장을 아래와 같이 간단하게 작성할 수 있다.

In [526]:
words = [123, 'apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}

for word in words:
    letter = str(word)[0]
    by_letter.setdefault(letter, []).append(word)

by_letter

{'1': [123], 'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

내장 collections 모듈의 defaultdict 클래스는 좀 더 편리하게 default 값을 구현할 수 있다.

In [527]:
list

list

In [529]:
from collections import defaultdict
by_letter = defaultdict(list)
for word in words:
    word = str(word)
    by_letter[word[0]].append(word)
by_letter

defaultdict(list,
            {'1': ['123'],
             'a': ['apple', 'atom'],
             'b': ['bat', 'bar', 'book']})

In [530]:
dict(by_letter)

{'1': ['123'], 'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

defaultdict의 default 값으로 list와 같은 자료형이 아닌, 특정 값을 반환한는 함수를 넣을 수도 있다.

#### 3) Valid dict key types
dict에서 key는 unique해야 하므로, key는 immutable한 python 객체이어야 한다. 이는 기술적으로는 hash가 가능해야 한다는 것인데, 이는 hash 함수를 통해 확인할 수 있다.

In [277]:
hash('string')

-210454731917584037

In [278]:
hash((1, 2, (2, 3)))

1097636502276347782

In [543]:
hash((1, 2, [2, 3])) # fails because lists are mutable

TypeError: unhashable type: 'list'

In [544]:
{[1,2]:3, 5:2}

TypeError: unhashable type: 'list'

hash()함수는 python2.7에서 `id(ob)//16`으로 수행되며, 내부적으로 `__eq()__` 메소드가 포함되어 구현된다. 여기서 id는 obj의 메모리 주소를 나타낸다.

이때 eq() 메소드의 역할은 immutable을 검증하는 용도로 사용된다.

자세한 내용은 관련 [공식 문서](https://www.programiz.com/python-programming/methods/built-in/hash)를 참조한다.

In [545]:
id(int)/hash(int)

16.0

In [546]:
d = {}
d[tuple([1, 2, 3])] = 5
d

{(1, 2, 3): 5}

dict에서 주요하게 사용하는 메소드 :
    
| Method | Description |
|--------------------------------|------------------------------------------------|
| Python Dictionary clear() | Removes all Items |
| Python Dictionary copy() | Returns Shallow Copy of a Dictionary |
| Python Dictionary fromkeys() | creates dictionary from given sequence |
| Python Dictionary get() | Returns Value of The Key |
| Python Dictionary items() | returns view of dictionary's (key, value) pair |
| Python Dictionary keys() | Returns View Object of All Keys |
| Python Dictionary popitem() | Returns & Removes Element From Dictionary |
| Python Dictionary setdefault() | Inserts Key With a Value if Key is not Present |
| Python Dictionary pop() | removes and returns element having given key |
| Python Dictionary values() | returns view of all values in dictionary |
| Python Dictionary update() | Updates the Dictionary |

In [549]:
d.update

5

### 1.3.5 Set
유일한 원소만을 담는 정렬되지 않은 자료형이다. 사전과 유사하지만, 값은 없고 키만 있는 자료형으로 생각해볼 수 있다.

set을 생성하기 위해서는 set 함수를 사용하거나 중괄호`{}`를 사용한다.

상위 클래스인 Sets에는 각각 mutable한 Set과 immutable한 ImmutableSet 클래스가 있는데, 각기 set과 frozenset으로 명칭이 바뀌었다.

set과 frozenset이 모두 사용가능한 메소드:

| Operation | Equivalent | Result |
|---------------------------|------------|----------------------------------------------------|
| len(s) |   | number of elements in set s (cardinality) |
| x in s |   | test x for membership in s |
| x not in s |   | test x for non-membership in s |
| s.issubset(t) | s <= t | test whether every element in s is in t |
| s.issuperset(t) | s >= t | test whether every element in t is in s |
| s.union(t) | s &#124; t | new set with elements from both s and t |
| s.intersection(t) | s & t | new set with elements common to s and t |
| s.difference(t) | s - t | new set with elements in s but not in t |
| s.symmetric_difference(t) | s ^ t | new set with elements in either s or tbut not both |
| s.copy() |   | new set with a shallow copy of s |

set만 사용가능한 메소드:

| Operation | Equivalent | Result |
|----------------------------------|------------|-------------------------------------------------------------------------|
| s.update(t) | s &#124;= t | return set s with elements added from t |
| s.intersection_update(t) | s &= t | return set s keeping only elements also found in t |
| s.difference_update(t) | s -= t | return set s after removing elements found in t |
| s.symmetric_difference_update(t) | s ^= t | return set s with elements from s or tbut not both |
| s.add(x) |   | add element x to set s |
| s.remove(x) |   | remove x from set s; raises KeyError if not present |
| s.discard(x) |   | removes x from set s if present |
| s.pop() |   | remove and return an arbitrary element from s; raises KeyError if empty |
| s.clear() |   | remove all elements from set s |

In [550]:
s = set([2, 2, 2, 1, 3, 3])
s == {2, 2, 2, 1, 3, 3}

True

In [553]:
s[2:]

TypeError: 'set' object is not subscriptable

아래와 같이 집합연산이 가능하다.

In [554]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}
print (a | b)  # union (or)
print (a & b)  # intersection (and)
print (a - b)  # difference
print (a ^ b)  # symmetric difference (xor)

{1, 2, 3, 4, 5, 6, 7, 8}
{3, 4, 5}
{1, 2}
{1, 2, 6, 7, 8}


a.isubset(b) : $a \subset b$?

In [555]:
a_set = {1, 2, 3, 4, 5}
print ({1, 2, 3}.issubset(a_set))
print (a_set.issuperset({1, 2, 3}))

True
True


In [556]:
{1, 2, 3} == {3, 2, 1}

True

In [562]:
s={2,3,1}
set(sorted(s))

{1, 2, 3}

In [557]:
[1,2,3] == [3,1,2]

False

uiqueness key를 다루는 dict와 set은 순서에 의한 색인을 사용할 수 없다.

### 1.3.6 List, set, and dict comprehensions

In [None]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
[x.upper() for x in strings if len(x) > 2]

- 길이가 2보다 작은 성분은 그대로 유지하도록 수정하려면 ?

In [574]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
[x.upper() if len(x) > 2 else x for x in strings]

['a', 'as', 'BAT', 'CAR', 'DOVE', 'PYTHON']

In [575]:
unique_lengths = {len(x) for x in strings}
unique_lengths

{1, 2, 3, 4, 6}

In [576]:
loc_mapping = {val : index for index, val in enumerate(strings)}
loc_mapping

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

In [579]:
dict(tuple(((val, idx) for idx, val in enumerate(strings))))

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

In [580]:
loc_mapping = dict((val, idx) for idx, val in enumerate(strings))
loc_mapping

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

#### 1) Nested list comprehensions

In [582]:
all_data = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'],
            ['Susie', 'Casey', 'Jill', 'Ana', 'Eva', 'Jennifer', 'Stephanie']]


In [583]:
names_of_interest = []
for names in all_data:
    enough_es = [name for name in names if name.count('e') > 1]
    names_of_interest.extend(enough_es)
    
names_of_interest

['Jefferson', 'Wesley', 'Steven', 'Jennifer', 'Stephanie']

In [586]:
[
    name for names in all_data for name in names if name.count('e') > 1
]

['Jefferson', 'Wesley', 'Steven', 'Jennifer', 'Stephanie']

중첩된 내포로 한번에 표시하면 아래와 같다.
- for 절은 중첩의 순서에 따라 큰 순으로 먼저 제출되며,
- 필터 조건 절은 마지막에 제시한다.

In [585]:
result = [name for names in all_data for name in names
          if name.count('e') >= 2]
result


['Jefferson', 'Wesley', 'Steven', 'Jennifer', 'Stephanie']

int 형의 element를 갖는 tuple을 element로 갖는 list에 대해 아래와 같이 flatten을 적용할 수 있다.

In [593]:
some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
flattened = [x for tup in some_tuples for x in tup]
flattened

[1, 2, 3, 4, 5, 6, 7, 8, 9]

아래와 같은 이중 for 문을 머리속에 그려보면 쉽게 구현할 수 있다.

In [594]:
flattened = []

for tup in some_tuples:
    for x in tup:
        flattened.append(x)
        
flattened

[1, 2, 3, 4, 5, 6, 7, 8, 9]

아래와 같이 list 내포 안에 list 내포를 또 사용하면, 원하는 결과가 나타나지 않는다.

In [598]:
[[x for x in tup] for tup in some_tuples]

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

위의 결과로 부터 아래와 같은 중첩 내포를 이끌어 낼 수 있도록 연습이 필요하다.

In [599]:
[x for tup in some_tuples for x in tup]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

## 1.4 Functions
함수의 일반적인 형태: return 문장이 없으면 None 이 반환된다.

함수의 인자는 순서인자와 키워드 인자가 있는데, 키워드 인자는 항상 순서 인자가 끝난 후에 제시되어야 한다.

In [603]:
def my_function(x, y, z=1.5, w=0.1):
    if z > 1:
        return z * (x + y)
    else:
        return z / (x + y)

In [604]:
my_function(5, 6, z=0.7)

0.06363636363636363

In [606]:
my_function(3.14, 7, 3.5, 0)

35.49

### 1.4.1 Namespaces, scope, and local functions
함수는 지역, 전역 이 두가지 스코프에서 변수를 참조한다.
- 지역 변수는 함수 실행과 함께 생성되며, 함수가 종료하면, 사라진다.

지역변수 a를 사용한 예:

In [612]:
del a
def func():
    a = []
    for i in range(5):
        a.append(i)

In [613]:
func()

In [615]:
# a # a는 존재하지 않는다.

전역변수 a를 사용하려고 한 예: but

In [619]:
a = []
def func():
    a = []
    for i in range(5):
        a.append(i)
        print(a)

func()
a

[0]
[0, 1]
[0, 1, 2]
[0, 1, 2, 3]
[0, 1, 2, 3, 4]


[]

전역 변수를 사용하려면, global이라는 키워드를 사용해야 한다.
>가급적 전역 변수를 사용하지 않는 것이 좋으며, 만약 전역변수를 사용하려면 static class를 사용하는 것을 권장한다.

In [623]:
a = None
def bind_a_variable():
    global a
    a = []
bind_a_variable()
print (a)

[]


함수는 어디서나 선언할 수 있으며, 지역변수를 사용하는 것은 아무런 문제가 되지 않는다.

In [None]:
def outer_function(x, y, z):
    def inner_function(a, b, c):
        pass
    pass

### 1.4.2 Returning multiple values

In [624]:
def f():
    a = 5
    b = 6
    c = 7
    return a, b, c

a, b, c = f()

In [625]:
return_value = f()
type(return_value)

tuple

In [626]:
def f():
    a = 5
    b = 6
    c = 7
    return {'a' : a, 'b' : b, 'c' : c}

### 1.4.3 Functions are objects
python에서는 함수도 객체이다. 다음과 같은 문자열 리스트를 정재해야 한다고 생각해보자.

In [627]:
states = ['   Alabama ', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda',
          'south   carolina##', 'West virginia?']

In [637]:
import re  # Regular expression module

def clean_strings(strings):
    result = []
    for value in strings:
        value = value.strip()
        value = re.sub('[!#?]', '', value) # remove punctuation
        value = re.sub('[\s]+', ' ', value)
        value = value.title() #1st character would be upper.
        result.append(value)
    return result

In [631]:
s = " s tr "
s.strip()

's tr'

In [638]:
clean_strings(states)

['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

필요한 함수를 list로 등록하고(함수 객체를 element로 하는 list):
- 이를 사용하는 clean_strings 함수를 정의하면, 
- 이 함수는 clean_ops를 변경함으로써, 재사용이 가능하게 된다.

In [639]:
def remove_punctuation(value):
    return re.sub('[!#?]', '', value)

def shrink_seq_space(value):
    return re.sub('[\s]+', ' ', value)

clean_ops = [str.strip, remove_punctuation, shrink_seq_space, str.title]

def clean_strings(strings, ops):
    result = []
    for value in strings:
        for function in ops:
            value = function(value)
        result.append(value)
    return result

In [640]:
clean_strings(states, clean_ops)


['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

map 함수는 seq의 각 elements에 함수를 적용하는 함수이다.

In [643]:
list(map(remove_punctuation, states))

['   Alabama ',
 'Georgia',
 'Georgia',
 'georgia',
 'FlOrIda',
 'south   carolina',
 'West virginia']

- states의 각 state에 적용하여 [!#?] 등을 제거하였다.

### 1.4.5 Anonymous (lambda) functions
객체로서 이름이 없는 함수를 lambda 함수라 부른다.

In [645]:
def short_function(x):
    return x * 2

equiv_anon = lambda x: x * 2

In [646]:
def apply_to_list(some_list, f):
    return [f(x) for x in some_list]

ints = [4, 0, 1, 5, 6]
apply_to_list(ints, lambda x: x * 2)

[8, 0, 2, 10, 12]

In [647]:
apply_to_list(ints, equiv_anon)

[8, 0, 2, 10, 12]

In [651]:
strings = ['foo', 'card', 'bar', 'aaaa', 'abab']

unique한 문자의 수를 key로 하여 정렬하는 함수를 적용

In [652]:
strings.sort(key=lambda x: len(set(list(x))))
strings

['aaaa', 'foo', 'abab', 'bar', 'card']

### 1.4.5 Closures: functions that return functions
함수2를 반환하는 함수1로서, 반환되는 함수2의 특징은:
- 생성시점에 인자로 받는 지역변수를 사용할 수 있다는 점이다.

In [662]:
def make_closure(a):
    def nestf():
        print('I know the secret: %d' % a)
    return nestf

closure = make_closure(5)
closure()

I know the secret: 5


list에 있는 element가 처음 출현하면 False를, 기 출현했으면 True를 반환하는 함수.
- dictionary를 이용하여 구현하였다.

In [663]:
def make_watcher():
    have_seen = {}

    def has_been_seen(x):
        if x in have_seen:
            return True
        else:
            have_seen[x] = True
            return False

    return has_been_seen

In [664]:
watcher = make_watcher()
vals = [5, 6, 1, 5, 1, 6, 3, 5]
[watcher(x) for x in vals]

[False, False, False, True, True, True, False, True]

- [F, F, F, T, T, T, F, T]

지역변수 count의 값을 기억했다가 수행될 때 마다 이 값을 증가시킨다.

In [685]:
def make_counter():
    count = [0]
    def counter(a=0):
        # increment and return the current count
        count[0] += 1
        count[0] += a
        return count[0]
    return counter, count

counter, cnt = make_counter()
print (counter())
print (counter(7))
# print (cnt)

1
9


이때 주의할 사항은 내부 변수 객체의 상태를 변경할 수는 있지만, closure 함수 내부에서 초기화하지 않은 변수를 직접 바인딩을 할 수 없다는 점이다.
- 위의 경우 count라는 변수를 직접 바인딩 하지 않고, 변경만 했을 뿐이지만,
- 아래의 경우, 매 counter 함수를 호출할 때 마다, 내부에서 초기화하지 않은 변수에 대한 대입문을 사용함으로써,
- 초기화하지 않는 변수에 대한 바인딩을 시도하므로, 에러가 발생한다.

이때문에, closure에서는 <U>scalar 변수를 직접 사용하기 보다는 collections(muttable한 list, set, dict 등) 변수의 elements에 접근하는 방법</U>을 사용한다.

In [680]:
def make_counter():
    count = 0
    def counter():
        # increment and return the current count
        count += 1
        return count
    return counter

counter = make_counter()
print (counter())
print (counter())

UnboundLocalError: local variable 'count' referenced before assignment

In [683]:
def make_counter():
    count = 0
    def counter(count):
        # increment and return the current count
        count += 1
        return count
    return counter

counter = make_counter()
print (counter(3))
print (counter(6))

4
7


closure의 유용성은 실제 개발 시, 
- 많은 인자를 갖는 범용 함수를 작성한 후에, 
- 좀 더 단순하고 특화된 함수를 작성하는 데 유용하게 사용될 수 있다.

아래와 같이 특정한 길이를 갖는 formatter를 작성하고자 하는 경우를 보자.

In [692]:
s = "str"
s.rjust(6, " ")

'   str'

In [694]:
def format_and_pad(template, space):
    def formatter(x):
        return (template % x).rjust(space)

    return formatter

In [699]:
fmt = format_and_pad('%.4f', 15)
fmt(1.756)

'         1.7560'

In [697]:
('%.4f' % 1.756).rjust(15)

'         1.7560'

In [698]:
print('%.4f' % 1.756)

1.7560


### 1.4.6 Extended call syntax with `*args`, `**kwargs`
함수 func(a, b, c, d=some, e=value)로 인자를 전달하면:
- 순서 인자는 tuple 형식으로 저장되고,
- 키워드 인자는 dict 형식으로 저장된다.

따라서, 내부적으로 argc 튜플과 kwargs 사전으로 다음과 같이 작업할 수 있다.

In [700]:
def say_hello_then_call_f(f, *args, **kwargs):
    print ('args is', args)
    print ('kwargs is', kwargs)
    print("Hello! Now I'm going to call %s" % f)
    return f(*args, **kwargs)

def g(x, y, z=1, u=3):
    return (x + y) / z*u

In [701]:
say_hello_then_call_f(g, 1, 2, z=5., u=3.)

args is (1, 2)
kwargs is {'z': 5.0, 'u': 3.0}
Hello! Now I'm going to call <function g at 0x00000283AD1C50D0>


1.7999999999999998

### 1.4.7 Currying: partial argument application
커링은 재미있는 컴퓨터 과학 용어로서, 함수에서 일부 인자를 고정하여 새로운 함수를 생성하는 기법이다.

In [702]:
def add_numbers(x, y):
    return x + y

In [703]:
add_five = lambda y: add_numbers(5, y)

In [704]:
add_five(3)

8

In [714]:
def minus_numbers(x, y=0):
    return x - y

In [715]:
minus_five1 = lambda y: minus_numbers(5, y)
minus_five2 = lambda y: minus_numbers(y, 5)

In [716]:
minus_five1(3)

2

In [717]:
minus_five2(3)

-2

이때, `add_numbers 함수의 두번째 arg가 커리되었다`라고 한다.

내장 functools 모듈의 partial 함수를 사용하면 이를 좀 더 단순화할 수 있다.

In [718]:
from functools import partial
add_five = partial(add_numbers, 5)

In [721]:
minus_five = partial(minus_numbers, y=5)

In [722]:
minus_five(9)

4

>걍 새로운 함수를 익힐 바에 lambda 함수를 쓰고 말지!!!

pandas의 시계열 데이터를 다룰 때, 이러한 커링 기법을 자주 사용한다.

### 1.4.8 Generators
python은 순회하면서 elements를 생성하는 객체를 정의하였는 데, 이를 generator라고 부른다. 즉, **iterator를 생성하는 함수.**
![](https://i.imgur.com/jlvOKG7.png)

- iterable: iter 함수로 iterator가 될 수 있는 객체. Collections
- iterator: data를 갖지 않으면서, next()에 의해 하나씩 data를 토해내는 객체
- generator: iterator를 생성하는 함수.


In [723]:
some_dict = {'a': 1, 'b': 2, 'c': 3}
for key in some_dict:
    print (key),

a
b
c


`for key in some_dict`로 작성하면, 
- python은 `some_dict`을 순회하는 iterator를 생성하고, 
- 이 iterator는 for 문을 통해 각 loop에서 key를 generate한다. 

이 때문에 `iter(some_dict)` 객체를 generator라 하며, 반복적으로 접근할 때 마다 새로운 elements를 생성한다. 따라서, for 문 등을 만나면, sequence 객체를 리턴하며, list와 달리 처음부터 모든 data를 생성하지 않기 때문에 메모리 관점에서 매우 유용하다.

In [727]:
dict_iterator = iter(some_dict)
dict_iterator

<dict_keyiterator at 0x283ad3418b8>

In [725]:
list(dict_iterator)

['a', 'b', 'c']

In [791]:
dict_iterator = iter(some_dict)
dict_iterator

<dict_keyiterator at 0x283ad3b8318>

In [795]:
next(dict_iterator)

StopIteration: 

generator를 생성하는 일반적인 방법은 
- 함수식에서 for 문장의 결과에 return 대신에 yield를 사용하는 것이다.
- 이때 for 루프에 의해 매 반복마다 새로운 값을 생성하므로 generator가 된다.

yield는 생산하다라는 뜻과 함께 양보하다라는 뜻도 가지고 있다. 즉, yield를 사용하면 값을 함수 바깥으로 전달하면서 코드 실행을 함수 바깥에 양보한다. 그래서 yield는 현재 함수를 잠시 중단하고 함수 바깥의 코드가 실행되도록 만든다.
```python
def number_generator():
    yield 0    # 0을 함수 바깥으로 전달하면서 코드 실행을 함수 바깥에 양보
    yield 1    # 1을 함수 바깥으로 전달하면서 코드 실행을 함수 바깥에 양보
    yield 2    # 2를 함수 바깥으로 전달하면서 코드 실행을 함수 바깥에 양보
```

![](https://i.imgur.com/wQ5Zxpx.png)

In [796]:
def squares(n=10):
    for i in range(1, n + 1):
        print ('Generating squares from 1 to %d' % (n ** 2))
        yield i ** 2

generator를 호출하면 아무 효과가 없다.

In [797]:
gen = squares()
gen

<generator object squares at 0x00000283AD3ABCA8>

for 문을 통해 값을 요청할 때, 드디어 generator가 값을 반환한다.

In [800]:
next(gen)

Generating squares from 1 to 100


9

In [739]:
for x in gen:
    print (x,)

Generating squares from 1 to 100
4
Generating squares from 1 to 100
9
Generating squares from 1 to 100
16
Generating squares from 1 to 100
25
Generating squares from 1 to 100
36
Generating squares from 1 to 100
49
Generating squares from 1 to 100
64
Generating squares from 1 to 100
81
Generating squares from 1 to 100
100


1달러의 잔돈을 만들 수 있는 유일한 조합을 찾는 고달픈 예제를 생각해보자.
- 각 동전은 1cent, 5cent, 10cent, 25cent 밖에 없다.

In [740]:
def make_change(amount, coins=[1, 5, 10, 25], hand=None):
    hand = [] if hand is None else hand
    if amount == 0:
        yield hand
    for coin in coins:
        # ensures we don't give too much change, and combinations are unique
        if coin > amount or (len(hand) > 0 and hand[-1] < coin):
            continue

        for result in make_change(amount - coin, coins=coins,
                                  hand=hand + [coin]):
            yield result

In [741]:
for way in make_change(100, coins=[10, 25, 50]):
    print (way)
len(list(make_change(100)))

[10, 10, 10, 10, 10, 10, 10, 10, 10, 10]
[25, 25, 10, 10, 10, 10, 10]
[25, 25, 25, 25]
[50, 10, 10, 10, 10, 10]
[50, 25, 25]
[50, 50]


242

In [769]:
for way in make_change(100, coins=[30, 45, 10, 15]):
    print (way)
len(list(make_change(100)))

[30, 30, 30, 10]
[30, 30, 10, 10, 10, 10]
[30, 30, 15, 15, 10]
[30, 10, 10, 10, 10, 10, 10, 10]
[30, 15, 15, 10, 10, 10, 10]
[30, 15, 15, 15, 15, 10]
[45, 30, 15, 10]
[45, 45, 10]
[45, 15, 10, 10, 10, 10]
[45, 15, 15, 15, 10]
[10, 10, 10, 10, 10, 10, 10, 10, 10, 10]
[15, 15, 10, 10, 10, 10, 10, 10, 10]
[15, 15, 15, 15, 10, 10, 10, 10]
[15, 15, 15, 15, 15, 15, 10]


242

In [742]:
len(list(make_change(100, coins=[10, 25, 50])))

6

In [743]:
list(make_change(100, coins=[10, 25, 50]))

[[10, 10, 10, 10, 10, 10, 10, 10, 10, 10],
 [25, 25, 10, 10, 10, 10, 10],
 [25, 25, 25, 25],
 [50, 10, 10, 10, 10, 10],
 [50, 25, 25],
 [50, 50]]

동일한 결과를 얻기 위한 또다른 솔루션을 알아보자.

In [818]:
def change(n, coins_available, coins_so_far):
	if sum(coins_so_far) == n:
		yield coins_so_far
	elif sum(coins_so_far) > n:
		pass
	elif coins_available == []:
		pass
	else:
		for c in change(n, coins_available[:], coins_so_far+[coins_available[0]]):
			yield c
		for c in change(n, coins_available[1:], coins_so_far):
			yield c

In [820]:
n = 100
coins = [10, 25, 50]

solutions = [s for s in change(n, coins, [])]
for s in solutions:
	print (s)

print ('optimal solution:', min(solutions, key=len))

[10, 10, 10, 10, 10, 10, 10, 10, 10, 10]
[10, 10, 10, 10, 10, 25, 25]
[10, 10, 10, 10, 10, 50]
[25, 25, 25, 25]
[25, 25, 50]
[50, 50]
optimal solution: [50, 50]


#### 1) yield from iterable
for 문을 사용하는 대신에 iterable로 부터 직접 generator를 생성하는 방법으로 yield from을 사용할 수 있다.

아래 예는 가능한 최소 수의 동전으로 원하는 값을 지불하는 예이다.

In [812]:
def return_change(to_return, coins = [.01, .05, .10, .25, 1.0, 5.0]):
    flag = None
    for c in coins:
        if c == to_return:  return c
        if c < to_return:
            flag = c
    temp_balance = round(to_return - flag, 2)
    return [flag] + [return_change(temp_balance)]

In [813]:
result = return_change(4.33) # Highly nested iterable
print(result)

[1.0, [1.0, [1.0, [1.0, [0.25, [0.05, [0.01, [0.01, 0.01]]]]]]]]


이때, 복잡한 list 내포를 다음과 같이 flatting할 수 있다.

In [814]:
def flatten(L):
    for item in L:
        try:
            yield from flatten(item)
        except TypeError:
            yield item

In [816]:
list(flatten(result))

[1.0, 1.0, 1.0, 1.0, 0.25, 0.05, 0.01, 0.01, 0.01]

#### 2) Generator expresssions
list, set, dict 등에서 내포를 사용한 `[]` 대신에 `()`을 사용하여 generator를 생성할 수 있다.

In [745]:
collec = [x ** 2 for x in range(100)]
collec

[0,
 1,
 4,
 9,
 16,
 25,
 36,
 49,
 64,
 81,
 100,
 121,
 144,
 169,
 196,
 225,
 256,
 289,
 324,
 361,
 400,
 441,
 484,
 529,
 576,
 625,
 676,
 729,
 784,
 841,
 900,
 961,
 1024,
 1089,
 1156,
 1225,
 1296,
 1369,
 1444,
 1521,
 1600,
 1681,
 1764,
 1849,
 1936,
 2025,
 2116,
 2209,
 2304,
 2401,
 2500,
 2601,
 2704,
 2809,
 2916,
 3025,
 3136,
 3249,
 3364,
 3481,
 3600,
 3721,
 3844,
 3969,
 4096,
 4225,
 4356,
 4489,
 4624,
 4761,
 4900,
 5041,
 5184,
 5329,
 5476,
 5625,
 5776,
 5929,
 6084,
 6241,
 6400,
 6561,
 6724,
 6889,
 7056,
 7225,
 7396,
 7569,
 7744,
 7921,
 8100,
 8281,
 8464,
 8649,
 8836,
 9025,
 9216,
 9409,
 9604,
 9801]

In [746]:
gen = (x ** 2 for x in range(100))
gen

<generator object <genexpr> at 0x00000283AD38A150>

동일한 표현으로 아래와 같이 함수식으로 작성할 수도 있다.

In [747]:
def _make_gen():
    for x in xrange(100):
        yield x ** 2
gen = _make_gen()
gen

<generator object _make_gen at 0x00000283AD38A2B0>

generator를 함수에 적용하여 모든 generation의 결과를 객체화할 수 있다.

In [749]:
sum((x ** 2 for x in range(100)))

TypeError: 'int' object is not callable

sum이라는 python built-in 함수가 int 객체로 선언이 되어서 sum 함수를 사용할 수 없다. 이 ref를 삭제하자!!

In [756]:
del sum

In [753]:
sum((x ** 2 for x in range(100)))

328350

In [755]:
sum = 0
for x in range(100):
    sum += x**2
sum

328350

In [757]:
dict((i, i **2) for i in range(5))

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

#### 2) itertools module
각 loop 마다 iterator를 생성하는 많은 함수들을 제공한다. 자세한 사항은 [공식 가이드 문서](https://docs.python.org/2/library/itertools.html) 참고.

infinite iterators:

| Iterator | Arguments | Results | Example |
|----------|---------------|------------------------------------------------|---------------------------------------|
| count() | start, [step] | start, start+step, start+2*step, … | count(10) --> 10 11 12 13 14 ... |
| cycle() | p | p0, p1, … plast, p0, p1, … | cycle('ABCD') --> A B C D A B C D ... |
| repeat() | elem [,n] | elem, elem, elem, … endlessly or up to n times | repeat(10, 3) --> 10 10 10 |

Iterators terminating on the shortest input sequence:

| Iterator | Arguments | Results | Example |
|----------------|-----------------------------|----------------------------------------------|----------------------------------------------------------|
| chain() | p, q, … | p0, p1, … plast, q0, q1, … | chain('ABC', 'DEF') --> A B C D E F |
| compress() | data, selectors | (d[0] if s[0]), (d[1] if s[1]), … | compress('ABCDEF', [1,0,1,0,1,1]) --> A C E F |
| dropwhile() | pred, seq | seq[n], seq[n+1], starting when pred fails | dropwhile(lambda x: x<5, [1,4,6,4,1]) --> 6 4 1 |
| groupby() | iterable[, keyfunc] | sub-iterators grouped by value of keyfunc(v) |   |
| ifilter() | pred, seq | elements of seq where pred(elem) is true | ifilter(lambda x: x%2, range(10)) --> 1 3 5 7 9 |
| ifilterfalse() | pred, seq | elements of seq where pred(elem) is false | ifilterfalse(lambda x: x%2, range(10)) --> 0 2 4 6 8 |
| islice() | seq, [start,] stop [, step] | elements from seq[start:stop:step] | islice('ABCDEFG', 2, None) --> C D E F G |
| imap() | func, p, q, … | func(p0, q0), func(p1, q1), … | imap(pow, (2,3,10), (5,2,3)) --> 32 9 1000 |
| starmap() | func, seq | func(*seq[0]), func(*seq[1]), … | starmap(pow, [(2,5), (3,2), (10,3)]) --> 32 9 1000 |
| tee() | it, n | it1, it2, … itn splits one iterator into n |   |
| takewhile() | pred, seq | seq[0], seq[1], until pred fails | takewhile(lambda x: x<5, [1,4,6,4,1]) --> 1 4 |
| izip() | p, q, … | (p[0], q[0]), (p[1], q[1]), … | izip('ABCD', 'xy') --> Ax By |
| izip_longest() | p, q, … | (p[0], q[0]), (p[1], q[1]), … | izip_longest('ABCD', 'xy', fillvalue='-') --> Ax ByC- D- |

Combinatoric generators:

| Iterator | Arguments | Results |
|------------------------------------------|--------------------|---------------------------------------------------------------|
| product() | p, q, … [repeat=1] | cartesian product, equivalent to a nested for-loop |
| permutations() | p[, r] | r-length tuples, all possible orderings, no repeated elements |
| combinations() | p, r | r-length tuples, in sorted order, no repeated elements |
| combinations_with_replacement() | p, r | r-length tuples, in sorted order, with repeated elements |
| product('ABCD', repeat=2) |   | AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD |
| permutations('ABCD', 2) |   | AB AC AD BA BC BD CA CB CD DA DB DC |
| combinations('ABCD', 2) |   | AB AC AD BC BD CD |
| combinations_with_replacement('ABCD', 2) |   | AA AB AC AD BB BC BD CC CD DD |

In [None]:
import itertools
first_letter = lambda x: x[0]

names = ['Alan', 'Adam', 'Wes', 'Will', 'Albert', 'Steven']

for letter, names in itertools.groupby(names, first_letter):
    print (letter, list(names)) # names is a generator

## 1.5 Files and the operating system
python에서는 파일에서 데이터를 읽어와 처리하는 방식이 매우 간단하다.

In [758]:
!dir/w

 C 드라이브의 볼륨에는 이름이 없습니다.
 볼륨 일련 번호: 7465-91A5

 C:\Users\great\Documents\pydata-book\pydata-book-old-edition\notebooks 디렉터리

[.]                                   [..]
[.ipynb_checkpoints]                  0.1cralling_cont.ipynb
0.CrawlingPrep.ipynb                  ch01 python basic.ipynb
ch02.Introductory examples.ipynb      ch03_Introduction IPython.ipynb
ch04.NumPy_Basic.ipynb                ch05.StartPandas.ipynb
ch06 Data IO.ipynb                    ch07.DataWrangling.ipynb
ch08.plot_N_Visualization.ipynb       ch09. 데이터 수집과 그룹 연산.ipynb
ch10. TimeSeries.ipynb                ch11.Finance.Economy.App.ipynb
ch12.AdvancedNumPy.ipynb              ch8_1.DisplayEarthquake.ipynb
fec_study.ipynb                       figpath.png
figpath.svg                           haiti.py
hello_world.py                        ipython_log.py
ipython_script_test.py                mydata.csv
mymmap                                some_module.py
some_module.pyc                       test
[__pycache__]       

In [759]:
!type ..\examples\segismundo.txt

Sue챰a el rico en su riqueza,
que m찼s cuidados le ofrece;

sue챰a el pobre que padece
su miseria y su pobreza;

sue챰a el que a medrar empieza,
sue챰a el que afana y pretende,
sue챰a el que agravia y ofende,

y en el mundo, en conclusi처n,
todos sue챰an lo que son,
aunque ninguno lo entiende.



In [760]:
path = '../examples/segismundo.txt'
f = open(path)

In [761]:
for line in f:
    pass

In [763]:
lines = [x.rstrip() for x in open(path, encoding='utf-8')]
lines

['Sueña el rico en su riqueza,',
 'que más cuidados le ofrece;',
 '',
 'sueña el pobre que padece',
 'su miseria y su pobreza;',
 '',
 'sueña el que a medrar empieza,',
 'sueña el que afana y pretende,',
 'sueña el que agravia y ofende,',
 '',
 'y en el mundo, en conclusión,',
 'todos sueñan lo que son,',
 'aunque ninguno lo entiende.',
 '']

In [766]:
with open('tmp.txt', 'w', encoding='utf-8') as handle:
    handle.writelines(x for x in open(path, encoding='utf-8') if len(x) > 1)

open('tmp.txt', encoding='utf-8').readlines()

['Sueña el rico en su riqueza,\n',
 'que más cuidados le ofrece;\n',
 'sueña el pobre que padece\n',
 'su miseria y su pobreza;\n',
 'sueña el que a medrar empieza,\n',
 'sueña el que afana y pretende,\n',
 'sueña el que agravia y ofende,\n',
 'y en el mundo, en conclusión,\n',
 'todos sueñan lo que son,\n',
 'aunque ninguno lo entiende.\n']

In [767]:
import os
os.remove('tmp.txt')

### 1) python file open mode


| Mode | Description |
|------|-----------------------------------------------------------------------------------------------------------|
| 'r' | Open a file for reading. (default) |
| 'w' | Open a file for writing. Creates a new file if it does not exist or truncates the file if it exists. |
| 'x' | Open a file for exclusive creation. If the file already exists, the operation fails. |
| 'a' | Open for appending at the end of the file without truncating it. Creates a new file if it does not exist. |
| 't' | Open in text mode. (default) |
| 'b' | Open in binary mode. |
| '+' | Open a file for updating (reading and writing) |

### 2) python file methods

| Method | Description |
|----------------------------|--------------------------------------------------------------------------------------------------|
| close() | Close an open file. It has no effect if the file is already closed. |
| detach() | Separate the underlying binary buffer from the TextIOBaseand return it. |
| fileno() | Return an integer number (file descriptor) of the file. |
| flush() | Flush the write buffer of the file stream. |
| isatty() | Return True if the file stream is interactive. |
| read(n) | Read atmost n characters form the file. Reads till end of file if it is negative or None. |
| readable() | Returns True if the file stream can be read from. |
| readline(n=-1) | Read and return one line from the file. Reads in at most nbytes if specified. |
| readlines(n=-1) | Read and return a list of lines from the file. Reads in at most n bytes/characters if specified. |
| seek(offset,from=SEEK_SET) | Change the file position to offset bytes, in reference to from (start, current, end). |
| seekable() | Returns True if the file stream supports random access. |
| tell() | Returns the current file location. |
| truncate(size=None) | Resize the file stream to size bytes. If size is not specified, resize to current location. |
| writable() | Returns True if the file stream can be written to. |
| write(s) | Write string s to the file and return the number of characters written. |
| writelines(lines) | Write a list of lines to the file. |

### <참고> [동전교환문제](https://jaytaylor.com/notes/node/1464472015000.html)

알고리즘(T)의 문제 해결을 위해 각 성분간의 연산 수([time complexity](https://ko.wikipedia.org/wiki/%EC%8B%9C%EA%B0%84_%EB%B3%B5%EC%9E%A1%EB%8F%84))로 알고리즘의 복잡도를 설명한다. 만약 n 개의 입력에 대해 최대 $\alpha n^3 + \cdots$의 연산이 필요하다면 이 알고리즘의 복잡도를 [$T(n) = O(n^k)$](https://joshuajangblog.wordpress.com/2016/09/21/time_complexity_big_o_in_easy_explanation/)라고 하며, k-다항 복잡도를 갖는다고 말한다.

또한 이러한 복잡도와 문제의 성격을 고려하여 다음과 같은 [complexity class](https://namu.wiki/w/P-NP%20%EB%AC%B8%EC%A0%9C)를 정의한다 :
- P: $T(n) = O(n^k)$ k-다항 복잡도를 가지며 매 순간 yes, no 2가지의 답변으로 해를 찾을 수 있는 문제.
- NP(nondeterministic polynomial time): k-다항 복잡도를 가지고 답이 맞는 지 검산할 수 있는 문제
- NP hard: 다항 시간 내에 NP 문제로 환원할 수 있는 문제. 적어도 NP 문제보다 어렵다.
- NP complete: NP hard이면서 NP인 문제.

동전교환문제는 NP-complete의 대표적인 문제로서, 재귀적인 방법으로 해결할 수 있다.

```python
def make_change(amount, coins=[10, 25, 50], hand=None):
    hand = [] if hand is None else hand
    if amount == 0:
        yield hand
    for coin in coins:
        # ensures we don't give too much change, and combinations are unique
        if coin > amount or (len(hand) > 0 and hand[-1] < coin):
            continue

        for result in make_change(amount - coin, coins=coins,
                                  hand=hand + [coin]):
            yield result
```

두번째 for 문 내의 재귀적 호출로 인해 
1. 현재 coin을 hand의 성분에 포함시키고, coin 만큼 amount룰 줄이면서,
2. 무한 깊이의 첫번째 for문이 형성되지만,

첫 for 루프 내의 if 문에 의해 hand에 포함된 coin보다 큰 coin에 대한 loop는 무시된다.

이로인해 :
- [10, ..., 10] 이 첫 hand로 yield된 후,
 - [10, 10, ..., 25, 25]와 같이 앞 10 보다 큰 25 이상의 루프는 무시되고,
 - [25, 10, ....]은 coin > amount에 의해 무시되고
- [25, 25, 10, ..., 10]이 두번째 hand가 되어 yield 된다.
 - 마찬가지로 [25, 25, 50]은 `hand[-1] < coin`에 의해 무시된다.

In [18]:
def make_change(amount, coins=[10, 25, 50], hand=None):
    hand = [] if hand is None else hand
    if amount == 0:
        yield hand
    for coin in coins:
        # ensures we don't give too much change, and combinations are unique
        if coin > amount or (len(hand) > 0 and hand[-1] < coin):
            continue

        for result in make_change(amount - coin, coins=coins,
                                  hand=hand + [coin]):
            yield result  

In [21]:
coin_exchange = make_change(100, coins=[10, 25, 50, 80])
coin_exchange

<generator object make_change at 0x00000206351228E0>

In [22]:
list(coin_exchange)

[[10, 10, 10, 10, 10, 10, 10, 10, 10, 10],
 [25, 25, 10, 10, 10, 10, 10],
 [25, 25, 25, 25],
 [50, 10, 10, 10, 10, 10],
 [50, 25, 25],
 [50, 50],
 [80, 10, 10]]

동일한 결과로 이끄는 다른 코딩의 예가 존재한다.

In [27]:
def change(n, coins_available, coins_so_far=[]):
    if sum(coins_so_far) == n:
        yield coins_so_far
    elif sum(coins_so_far) > n:
        pass
    elif coins_available == []:
        pass
    else:
        for c in change(n, coins_available[:], coins_so_far+[coins_available[0]]):
            yield c
        for c in change(n, coins_available[1:], coins_so_far):
            yield c

In [28]:
list(change(100, [10, 25, 50]))

[[10, 10, 10, 10, 10, 10, 10, 10, 10, 10],
 [10, 10, 10, 10, 10, 25, 25],
 [10, 10, 10, 10, 10, 50],
 [25, 25, 25, 25],
 [25, 25, 50],
 [50, 50]]

#### [quiz] 파일 읽기 제너레이터 만들기
words.txt 파일을 한 줄씩 읽은 뒤 내용을 함수 바깥에 전달하는 제너레이터를 작성하세요. 파일의 내용을 출력할 때 파일에서 읽은 \n은 출력되지 않아야 합니다(단어 사이에 줄바꿈이 두 번 일어나면 안 됨).

대용량 파일을 읽을 때, 메모리에 한꺼번에 올리면 처리가 불가능할 수도 있다. 이때 아래와 같이 generator를 생성하면 처리가 가능하다.

아래 코드를 완성하여 출력하세요.
```python
def file_read():
    with open('words.txt') as file:
                                   
        ...
                                   
 
for i in file_read():
    print(i)
```

In [11]:
%%writefile words.txt
compatibility
experience

photography
spotlight

Overwriting words.txt


In [9]:
def file_read():
    with open('words.txt', encoding='utf-8') as file:
        while(True):
            line = file.readline()
            if line == '':
                break
            yield line.strip("\n")

In [10]:
for line in file_read():
    print(line)

compatibility
experience
photography
spotlight


### <참고> [코루틴 사용하기](https://dojang.io/mod/page/view.php?id=2423)
지금까지 함수를 호출한 뒤 함수가 끝나면 현재 코드로 다시 돌아왔다. 아래 예를 보자.

In [29]:
def add(a, b):
     c = a + b    # add 함수가 끝나면 변수와 계산식은 사라짐
     print(c)
     print('add 함수')
 
def calc():
    add(1, 2)    # add 함수가 끝나면 다시 calc 함수로 돌아옴
    print('calc 함수')
 
calc()

3
add 함수
calc 함수


이 소스 코드에서 calc 함수와 add 함수의 관계를 살펴보겠습니다. calc가 메인 루틴(main routine)이면 add는 calc의 서브 루틴(sub routine)입니다. 이 메인 루틴과 서브 루틴의 동작 과정을 그림으로 나타내면 다음과 같은 모양이 됩니다.
![](https://i.imgur.com/jVaua72.png)

메인 루틴에서 서브 루틴을 호출하면 서브 루틴의 코드를 실행한 뒤 다시 메인 루틴으로 돌아옵니다. 특히 서브 루틴이 끝나면 서브 루틴의 내용은 모두 사라집니다. 즉, 서브 루틴은 메인 루틴에 종속된 관계입니다.

### 코루틴
코루틴은 방식이 조금 다릅니다. 코루틴(coroutine)은 cooperative routine를 의미하는데 서로 협력하는 루틴이라는 뜻입니다. 즉, 메인 루틴과 서브 루틴처럼 종속된 관계가 아니라 서로 대등한 관계이며 특정 시점에 상대방의 코드를 실행합니다.
![](https://i.imgur.com/unfwDqn.png)

이처럼 코루틴은 함수가 종료되지 않은 상태에서 메인 루틴의 코드를 실행한 뒤 다시 돌아와서 코루틴의 코드를 실행합니다. 따라서 코루틴이 종료되지 않았으므로 코루틴의 내용도 계속 유지됩니다.

일반 함수를 호출하면 코드를 한 번만 실행할 수 있지만, 코루틴은 코드를 여러 번 실행할 수 있습니다. 참고로 함수의 코드를 실행하는 지점을 진입점(entry point)이라고 하는데, 코루틴은 진입점이 여러 개인 함수입니다.

#### 코루틴에 값 보내기
코루틴은 제너레이터의 특별한 형태입니다. 제너레이터는 yield로 값을 발생시켰지만 코루틴은 yield로 값을 받아올 수 있습니다. 다음과 같이 코루틴에 값을 보내면서 코드를 실행할 때는 send 메서드를 사용합니다. 그리고 send 메서드가 보낸 값을 받아오려면 (yield) 형식으로 yield를 괄호로 묶어준 뒤 변수에 저장합니다.

- 코루틴객체.send(값)
- 변수 = (yield)

그럼 코루틴에 숫자 1, 2, 3을 보내서 출력해보겠습니다.

In [30]:
def number_coroutine():
    while True:        # 코루틴을 계속 유지하기 위해 무한 루프 사용
        x = (yield)    # 코루틴 바깥에서 값을 받아옴, yield를 괄호로 묶어야 함
        print(x)
 
co = number_coroutine()
next(co)      # 코루틴 안의 yield까지 코드 실행(최초 실행)
 
co.send(1)    # 코루틴에 숫자 1을 보냄
co.send(2)    # 코루틴에 숫자 2을 보냄
co.send(3)    # 코루틴에 숫자 3을 보냄

1
2
3


![](https://dojang.io/pluginfile.php/13976/mod_page/content/1/041003.png)

#### 코루틴 바깥으로 값 전달하기
이번에는 코루틴에서 바깥으로 값을 전달해보겠습니다. 다음과 같이 (yield 변수) 형식으로 yield에 변수를 지정한 뒤 괄호로 묶어주면 값을 받아오면서 바깥으로 값을 전달합니다. 그리고 yield를 사용하여 바깥으로 전달한 값은 next 함수(__next__ 메서드)와 send 메서드의 반환값으로 나옵니다.
- 변수 = (yield 변수)
- next(코루틴객체)
- 코루틴객체.send(값)

그럼 코루틴에 숫자를 보내고, 코루틴은 받은 숫자를 누적해서 바깥에 전달해보겠습니다.

In [31]:
def sum_coroutine():
    total = 0
    while True:
        x = (yield total) # 코루틴 외부로 total을 보내고, 외부에서 값을 받기 위해 대기
        total += x
 
co = sum_coroutine()
print(next(co))      # 0: 코루틴 안의 yield까지 코드를 실행하고 코루틴에서 받은 값 출력
 
print(co.send(1))    # 1: 코루틴에 숫자 1을 보내고 코루틴에서 나온 값 출력
print(co.send(2))    # 3: 코루틴에 숫자 2를 보내고 코루틴에서 나온 값 출력
print(co.send(3))    # 6: 코루틴에 숫자 3을 보내고 코루틴에서 나온 값 출력

0
1
3
6


![](https://dojang.io/pluginfile.php/13977/mod_page/content/1/041005.png)

제너레이터와 코루틴의 차이점을 정리해보겠습니다.

- 제너레이터는 next 함수(__next__ 메서드)를 반복 호출하여 값을 얻어내는 방식
- 코루틴은 next 함수(__next__ 메서드)를 한 번만 호출한 뒤 send로 값을 주고 받는 방식

값을 보내지 않고, 코루틴을 실행하고자 할 때는 next 함수만을 사용하며, 이는 제너레이터를 사용하는 방법이다.

#### 코루틴을 종료하고 예외 처리하기
보통 코루틴은 실행 상태를 유지하기 위해 while True:를 사용해서 끝나지 않는 무한 루프로 동작합니다. 만약 코루틴을 강제로 종료하고 싶다면 close 메서드를 사용합니다.

In [32]:
co.close()

### 예외처리하기
####  GeneratorExit 예외 처리하기
코루틴 객체에서 close 메서드를 호출하면 코루틴이 종료될 때 GeneratorExit 예외가 발생합니다. 따라서 이 예외를 처리하면 코루틴의 종료 시점을 알 수 있습니다.

In [33]:
def number_coroutine():
    try:
        while True:
            x = (yield)
            print(x, end=' ')
    except GeneratorExit:    # 코루틴이 종료 될 때 GeneratorExit 예외 발생
        print()
        print('코루틴 종료')
 
co = number_coroutine()
next(co)
 
for i in range(20):
    co.send(i)
 
co.close()

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 
코루틴 종료


#### 코루틴 안에서 예외 발생시키기
그럼 코루틴 안에 특정 예외를 발생시킬 수는 없을까요? 이번에는 코루틴 안에 예외를 발생시켜서 코루틴을 종료해보겠습니다.

코루틴 안에 예외를 발생 시킬 때는 throw 메서드를 사용합니다. throw는 말그대로 던지다라는 뜻인데 예외를 코루틴 안으로 던집니다. 이때 throw 메서드에 지정한 에러 메시지는 except as의 변수에 들어갑니다.

- 코루틴객체.throw(예외이름, 에러메시지)

다음은 코루틴에 숫자를 보내서 누적하다가 RuntimeError 예외가 발생하면 에러 메시지를 출력하고 누적된 값을 코루틴 바깥으로 전달합니다.

In [34]:
def sum_coroutine():
    try:
        total = 0
        while True:
            x = (yield)
            total += x
    except RuntimeError as e:
        print(e)
        yield total    # 코루틴 바깥으로 값 전달
 
co = sum_coroutine()
next(co)
 
for i in range(20):
    co.send(i)
 
print(co.throw(RuntimeError, '예외로 코루틴 끝내기')) # 190
                                                      # 코루틴의 except에서 yield로 전달받은 값

예외로 코루틴 끝내기
190


### 하위 코루틴의 반환값 가져오기
제너레이터에서 yield from을 사용하면 값을 바깥으로 여러 번 전달한다고 했습니다. 하지만 코루틴에서는 조금 다르게 사용합니다. yield from에 코루틴를 지정하면 해당 코루틴에서 return으로 반환한 값을 가져옵니다.

In [35]:
def accumulate():
    total = 0
    while True:
        x = (yield)         # 코루틴 바깥에서 값을 받아옴
        if x is None:       # 받아온 값이 None이면
            return total    # 합계 total을 반환하고 종료.
        total += x
 
def sum_coroutine():
    while True:         # 또 다른 루프에서 accumulate를 재 실행함.
        total = yield from accumulate()    # accumulate의 반환값을 가져오고, 전달도 하고, next(accumulator)도 실행.
        print(total)
 
co = sum_coroutine()
next(co)
 
for i in range(1, 11):    # 1부터 10까지 반복
    co.send(i)            # 하위 코루틴 accumulate에 까지 숫자를 보냄
co.send(None)             # 코루틴 accumulate에 None을 보내서 숫자 누적을 끝냄
 
for i in range(1, 101):   # 1부터 100까지 반복. sum_coroutine의 2nd loop 시작.
    co.send(i)            # 코루틴 accumulate에 숫자를 보냄
co.send(None)             # 코루틴 accumulate에 None을 보내서 숫자 누적을 끝냄

55
5050


#### StopIteration 예외 발생시키기
코루틴도 제너레이터이므로 return을 사용하면 StopIteration이 발생합니다. 사실 코루틴에서 return 값은 raise StopIteration(값)과 동작이 같습니다. 따라서 raise로 예외를 직접 발생시키고 값을 지정하면 yield from으로 값을 가져올 수 있습니다.

In [36]:
def accumulate():
    total = 0
    while True:
        x = (yield)                       # 코루틴 바깥에서 값을 받아옴
        if x is None:                     # 받아온 값이 None이면
            raise StopIteration(total)    # StopIteration에 반환할 값을 지정
        total += x
 
def sum_coroutine():
    while True:
        total = yield from accumulate()    # accumulate의 반환값을 가져옴
        print(total)
 
co = sum_coroutine()
next(co)
 
for i in range(1, 11):    # 1부터 10까지 반복
    co.send(i)            # 코루틴 accumulate에 숫자를 보냄
co.send(None)             # 코루틴 accumulate에 None을 보내서 숫자 누적을 끝냄
 
for i in range(1, 101):   # 1부터 100까지 반복
    co.send(i)            # 코루틴 accumulate에 숫자를 보냄
co.send(None)             # 코루틴 accumulate에 None을 보내서 숫자 누적을 끝냄

55
5050


  # This is added back by InteractiveShellApp.init_path()


- return을 사용하면 warning을 없앨 수 있다.

코루틴은 함수가 종료되지 않은 상태에서 값을 주고 받을 수 있는 함수이며 이 과정에서 현재 코드의 실행을 대기하고 상대방의 코드를 실행한다는 점이 중요합니다. 보통 코루틴은 시간이 오래 걸리는 작업을 분할하여 처리할 때 사용하는데 주로 파일 처리, 네트워크 처리 등에 활용합니다.

### < Quiz > 문자열 검색 코루틴 만들기
다음 소스 코드를 완성하여 문자열에서 특정 단어가 있으면 True, 없으면 False가 출력되게 만드세요. find 함수는 코루틴으로 작성해야 합니다.

```python
                                 
...
                                 
 
f = find('Python')
next(f)
 
print(f.send('Hello, Python!'))
print(f.send('Hello, world!'))
print(f.send('Python Script'))
 
f.close()
```
결과 :
```python
True
False
True
```

In [52]:
def find(s):
    ins = False
    while True:
        string = (yield ins)
        ins = s in string
#         ins = string.find(s) >= 0

In [53]:
f = find('Python')
next(f)

print(f.send('Hello, Python!'))
print(f.send('Hello, world!'))
print(f.send('Python Script'))

f.close()

True
False
True
