### 배포판
- Python에는 여러가지 배포판이 있고, 그 중 아나콘다(Anaconda) 배포판에는 데이터 과학에 필요한 대부분의 라이브러리들이 이미 설치되어 있다.
- IPython은 더 괜찮은 파이썬 쉘이고, Jupyter라고 불리는 기존 IPython notebook을 쓰는 사람도 많다.

### 문법
- 들여쓰기로 코드의 단락이 구분된다.
- 괄호 안에서는 공백문자는 무시되므로 가독성을 높이는데 유용하게 쓸 수 있다.

### Import

In [2]:
# 전체 모듈을 불러올 때
import re

# 앨리어스를 사용해 불러옴
import re as regex
import matplotlib.pyplot as plt

# 모듈 하나에서 특정 기능만 가져올 수도 있다
from collections import defaultdict, Counter

# 모듈 기능을 통째로 가져오는 습관은 좋지않다.
match = 10
from re import *
print match # re에도 match가 있다

<function match at 0x7f90aba07c80>


### 연산

In [4]:
# Python 2.7에서는 정수 나눗셈을 기본으로 사용한다.
# 원하는 결과를 얻기 위해 아래처럼 __future__ 모듈을 사용하자
from __future__ import division

### 함수


In [10]:
# def 로 함수를 정의한다
def double(x):
    return x * 2

# 파이썬 함수는 변수로 할당되거나 함수의 인자로 전달할 수 있다는 점에서 일급 함수(first-class) 특성을 갖는다
def apply_to_one(f):
    return f(1)

my_double = double
x = apply_to_one(my_double)

print x #-> 2

# 익명함수인 람다를 쓸 수도 있다
y = apply_to_one(lambda x: x + 4)

print y #-> 5

# 람다를 변수에 할당할 수도 있지만 가능한 피하는 것이 좋다
another_double = lambda x: 2 * x

# 함수의 인자에는 기본값을 할당할 수 있다
def my_print(message="default message"):
    print message

my_print("hello")
my_print()

# 인자에 이름을 명시해주면 편리하다
def subtract(a=0, b=0):
    return a - b

print subtract(10, 2)
print subtract(0, 5)
print subtract(b=5)

2
5
hello
default message
8
-5
-5


### 문자열

In [15]:
# 문자열은 작음 따옴표(')나 큰 따옴표(")로 묶어 나타낸다
single_quoted_string = 'data science'
double_quoted_string = "data science"

# 특수 문자를 인코딩할 땐 역슬래시를 사용한다
tab_string = "\t"
print len(tab_string) # 1

# 역슬래시를 역슬래시로 보이는 문자로 사용하고 싶다면,
# (예를 들어, 정규식이나 윈도우 OS의 디렉토리 이름 등)
# 문자열 앞에 r을 붙여서 raw string 으로 명시하면 된다
not_tab_string = r"\t"
print len(not_tab_string) # 2

### 세 개의 따옴표는 여러 줄로 나타낼 수 있다
multi_line_string = """This is the first line.
and this is the second line
and this is the third line
"""

1
2


### 예외 처리

In [16]:
# try 와 except로 예외 처리할 수 있다
try:
    print 0 / 0
except ZeroDivisionError:
    print "cannot divide by zero"
    


cannot divide by zero


### list

In [32]:
# 순서가 있는 자료의 집합 (배열과 유사하지만 기능이 좀 더 풍부하다)
integer_list = [1, 2, 3]
heterogeneous_list = ['string', 0.1, True]

print len(integer_list) # 3
print sum(integer_list) # 5

# 대괄호로 인덱스에 해당하는 값을 가져올 수 있다
x = range(10) # [0, 1, ... 9] 형태의 리스트
zero = x[0]
one = x[1]
nine = x[-1]
eight = x[-2]
x[0] = -1

print x

# 대괄호로 list를 나눌 수 있다
first_three = x[:3]
three_to_end = x[3:]
one_to_four = x[1:5]
last_three = x[-3:] # -3에서 0까지
without_first_and_last = x[1:-1]
copy_of_x = x[:] # 복사본

print first_three
print three_to_end
print one_to_four
print last_three
print without_first_and_last
print copy_of_x

# in 연산자로 항목의 존재 여부를 확인할 수 있다
print -1 in first_three
print -1 in three_to_end
# 이 방법은 전체 항목을 모두 확인하므로 리스트 크기가 작을 때에만 사용하자

# 리스트 연결
x = [1, 2, 3]
x.extend([4, 5, 6]) # x 자체가 변경된다
print x # [1, 2, 3, 4, 5, 6]

# x를 수정하고 싶지 않다면 더하면 된다
x = [1, 2, 3]
y = x + [4, 5, 6]
print x # [1, 2, 3]
print y # [1, 2, 3, 4, 5, 6]

# 항목을 하나씩 추가할 땐
x.append(0)
print x # [1, 2, 3, 0]

# 리스트를 쉽게 풀 수도 있다 (unpack)
x, y = [1, 2]
print x # 1
print y # 2

# 갯수가 다르면 ValueError가 발생하며, 보통 버릴 항목은 _로 처리한다
_, y = [1, 2]
print y # 2
print _ # _에도 1이 할당되지만 신경쓰지 않는다

3
6
[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[-1, 1, 2]
[3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4]
[7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8]
[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]
True
False
[1, 2, 3, 4, 5, 6]
[1, 2, 3]
[1, 2, 3, 4, 5, 6]
[1, 2, 3, 0]
1
2
2
1


### tuple

In [35]:
# 튜플은 변경할 수 없는 list이다. 리스트에서 수정 기능을 제외하고 모두 튜플에 적용할 수 있다
# 튜플은 대괄호 대신 괄호를 사용한다
my_list = [1, 2]
my_tuple = (1, 2)
outher_tuple = 3, 4 # 괄호를 생략할 수도 있다
my_list[1] = 3

try:
    my_tuple[1] = 3
except TypeError:
    print "cannot modify a tuple"
    
# 함수에서 여러 값을 반환할 때 튜플을 사용하면 편리하다
def sum_and_product(x, y):
    return (x + y), (x * y)
sp = sum_and_product(2, 3)
print sp # (5, 6)

x, p = sum_and_product(5, 10) # 바로 풀어서 받을 수도 있다
print x, p

# tuple과 list 모두 다중 할당(multiple assignment)를 지원한다
x, y = 1, 2
x, y = y, x # 가장 파이썬스러운 교환


cannot modify a tuple
(5, 6)
15 50


### dict

In [62]:
# dict(dictionary, 사전)은 key와 value를 연결하는 데이터 구조이다
empty_dict = {}
empty_dict2 = dict() # 이렇게 할 수도 있지만 보통 {} 를 사용한다

# 키 값에는 반드시 따옴표를 붙여야 한다
grades = { "Joel": 80, "Tim": 95 }

# 대괄호로 키의 값을 가져올 수 있다
print grades['Joel'] # 80

# 대괄호로 존재하지 않는 key를 입력하면 KeyError가 발생한다
try:
    grades["Kate"]
except KeyError:
    print "no grade for Kate!"
    
# in 연산자로 key의 존재 여부를 확인할 수 있다
print 'Joel' in grades
print 'Kate' in grades
print 'Kate' not in grades

# get() 메서드를 사용하면, 키가 없을 때 에러 대신 기본값을 반환한다. 기본값이 없다면 None을 반환한다
print grades.get('Joel', 0) # 80
print grades.get('Kate', 0) # 0
print grades.get('Kate') # None

# 대괄호로 새 값을 지정할 수 있다
grades['Kate'] = 100
num_students = len(grades) # 사전도 len()으로 크기를 가져올 수 있다
print num_students # 3

# 키 값을 지울 땐 del을 사용하면 된다
del grades['Joel']
print len(grades) # 2

# 전체 키를 살펴볼 수도 있다
tweet = {
    "user": "joelgrus",
    "text": "Data Science is Awesome",
    "retweet_count": 100,
    "hashtags": ["#data", "#science", "#datascience", "#awesome", "#yolo"]
}
tweet_keys = tweet.keys()
tweet_values = tweet.values()
tweet_items = tweet.items() # (key, value) 목록

print tweet_keys
print tweet_values
print tweet_items

# 사전 내에서 검색할 수도 있다
print "user" in tweet_keys # 전체 리스트를 찾으므로 느리다
print "user" in tweet # 키로 바로 찾으므로 빠르다
print "joelgrus" in tweet_values

# dict의 키는 수정할 수 없으며, 그렇기 때문에 list를 key로 사용할 수 없다
# 다양한 값으로 구성된 키가 필요하다면 tuple이나 문자열을 조합해 사용한다
tweet[('lat','lng')] = (123, 456)
print tweet

80
no grade for Kate!
True
False
True
80
0
None
3
2
['text', 'retweet_count', 'hashtags', 'user']
['Data Science is Awesome', 100, ['#data', '#science', '#datascience', '#awesome', '#yolo'], 'joelgrus']
[('text', 'Data Science is Awesome'), ('retweet_count', 100), ('hashtags', ['#data', '#science', '#datascience', '#awesome', '#yolo']), ('user', 'joelgrus')]
True
True
True
{'text': 'Data Science is Awesome', 'retweet_count': 100, 'hashtags': ['#data', '#science', '#datascience', '#awesome', '#yolo'], 'user': 'joelgrus', ('lat', 'lng'): (123, 456)}


### defaultdict

In [74]:
# 문서에서 단어의 빈도를 세어보는 중이라고 상상해보자
document = ['foo', 'bar', 'baz', 'foo', 'hello']

# 첫번째 방법
word_counts = {}
for word in document:
    if word in word_counts:
        word_counts[word] += 1
    else:
        word_counts[word] = 1
print word_counts

# 두번째 방법: 예외를 사용해볼 수 있다
word_counts = {}
for word in document:
    try:
        word_counts[word] += 1
    except KeyError:
        word_counts[word] = 1
print word_counts

# 세번째 방법: get()을 사용해본다
word_counts = {}
for word in document:
    prev_count = word_counts.get(word, 0)
    word_counts[word] = prev_count + 1
print word_counts

# 이런 경우, defaultdict를 사용하면 편리하다
from collections import defaultdict

word_counts = defaultdict(int) # int()는 기본값으로 0을 생성한다
for word in document:
    word_counts[word] += 1
print word_counts

# 같은 방법으로 list나 dict, 혹은 직접 만든 함수를 넣어줄 수도 있다
dd_list = defaultdict(list)
dd_list[2].append(1)
print dd_list

dd_dict = defaultdict(dict)
dd_dict['Joel']['City'] = 'Seattle'
print dd_dict

dd_pair = defaultdict(lambda: [0, 0])
dd_pair[2][1] = 1 # dd_pair[2] => [0, 0]으로 초기화됨
print dd_pair

{'baz': 1, 'foo': 2, 'bar': 1, 'hello': 1}
{'baz': 1, 'foo': 2, 'bar': 1, 'hello': 1}
{'baz': 1, 'foo': 2, 'bar': 1, 'hello': 1}
defaultdict(<type 'int'>, {'baz': 1, 'foo': 2, 'bar': 1, 'hello': 1})
defaultdict(<type 'list'>, {2: [1]})
defaultdict(<type 'dict'>, {'Joel': {'City': 'Seattle'}})
defaultdict(<function <lambda> at 0x7f907d0c01b8>, {2: [0, 1]})


### Counter

In [79]:
# Counter는 연속된 값을 defaultdict(int)와 유사한 객체로 변환해주면, 리스트 내의 값을 key로, value를 빈도로 만들어준다
# 히스토그램을 그릴 때 자주 사용한다

from collections import Counter
c = Counter([0, 1, 2, 0])
print c

# 특정 문서의 단어의 개수를 셀 때에도 유용하다
word_counts = Counter(document)

# 가장 자주 나오는 단어 2개와 빈도수
for word, count in word_counts.most_common(2):
    print word, count


Counter({0: 2, 1: 1, 2: 1})
foo 2
baz 1


### set

In [111]:
# set은 유일한 항목의 집합을 나타낸다
s = set()
s.add(1)
s.add(2)
s.add(2)
print len(s) # 2
print 2 in s
print 3 in s

s2 = {1, 2, 2, 4} # {} 로 정의할 수도 있다
print s2 # set([1, 2, 4])

# list보다 set에서의 in 연산자가 빠르게 동작한다
stopwords_list = ['a', 'an', 'at', 'yet', 'you']
print 'zip' in stopwords_list # 전체 항목을 훑는다

stopwords_set = set(stopwords_list)
print 'zip' in stopwords_set # 빠르다

2
True
False
set([1, 2, 4])
False
False


### 흐름 제어

In [93]:
if 1 > 2:
    print 'a'
elif 1 > 3:
    print 'b'
else:
    print 'c'

# if 문을 한 줄로 표현할 수도 있다
parity = "even" if x % 2 == 0 else "odd"
print parity

# 파이썬에도 while이 있지만,
x = 0
while x < 10:
    print x, "is less than 10"
    x += 1

# 주로 for과 in을 더 많이 사용한다
for x in range(10):
    print x, "is less thant 10"

# continue와 break도 사용할 수 있다
for x in range(10):
    if x == 3:
        continue
    if x == 5:
        break
    print x


c
odd
0 is less than 10
1 is less than 10
2 is less than 10
3 is less than 10
4 is less than 10
5 is less than 10
6 is less than 10
7 is less than 10
8 is less than 10
9 is less than 10
0 is less thant 10
1 is less thant 10
2 is less thant 10
3 is less thant 10
4 is less thant 10
5 is less thant 10
6 is less thant 10
7 is less thant 10
8 is less thant 10
9 is less thant 10
0
1
2
4


### True와 False

In [114]:
# 파이썬에서의 불리언은 항상 대문자로 시작한다
print 1 < 2
print 1 > 2

# 존재하지 않는 값은 None이다
x = None
print x == None
print x is None # 비교할 땐 is를 사용하는 것이 더 파이썬스럽다

# 불리언 대신 다른 값으로 불리언을 표현할 수 있다
# 아래 목록은 비교문에서 모두 거짓을 의미한다
falsy_list = [False, None, [], {}, "", set(), 0, 0.0]

# 파이썬에는 리스트의 모든 항목이 참이라면 True를 반환해주는 all()이 있고,
# 적어도 하나의 항목이 참이라면 True를 반환하는 any()가 있다
print all([True, 1, {3}]) # True
print all([]) # True, 거짓인 항목이 없으므로
print any([]) # False, 참인 항목이 없으므로
print any(falsy_list) # False


True
False
True
True
True
True
False
False


### 정렬

In [120]:
# sort()와 sorted()로 목록을 정렬할 수 있다
# sort()는 리스트 자체를 정렬하고, sorted()는 정렬된 새로운 리스트를 반환한다
x = [4, 1, 2, 3]
y = sorted(x)
print x # x는 변하지 않음
print y
x.sort() # 이제 x도 정렬된다
print x

# 내림차순으로 정렬하고 싶다면, reverse=True를 준다
x.sort(reverse=True)
print x

# 지정한 함수의 결과값으로 정렬하고 싶다면, key에 함수를 넘겨주면 된다
print sorted([-4, -1, 2, 3], key=abs, reverse=True)

# 빈도의 내림차순으로 정렬
print sorted(word_counts.items(),
            key=lambda (word, count): count,
            reverse=True)

[4, 1, 2, 3]
[1, 2, 3, 4]
[1, 2, 3, 4]
[4, 3, 2, 1]
[-4, 3, 2, -1]
[('foo', 2), ('baz', 1), ('bar', 1), ('hello', 1)]


### List Comprehension

In [131]:
# 리스트에서 특정 항목을 선택하거나 변환한 결과를 새로운 리스트에 저장해야할 땐,
# 리스트 컴프리헨션을 사용하는 것이 가장 파이썬스럽다
even_numbers = [x for x in range(5) if x % 2 == 0]
squres = [x * x for x in range(5)]
even_squres = [x * x for x in range(5) if x % 2 == 0]

print even_numbers
print squres
print even_squres

# 리스트를 dict나 set으로 변환할 수도 있다
squre_dict = { x : x * x for x in range(5) }
squre_set = { x * x for x in [1, -1] }

print squre_dict
print squre_set

# 리스트에서 불필요한 값은 _ 로 표기한다
zeroes = [0 for _ in even_numbers] # even_numbers와 동일한 길이의 0의 리스트

# 리스트 컴프리헨션에서는 여러 for을 포함할 수 있다
pairs = [(x, y)
        for x in range(10)
        for y in range(10)]
print len(pairs) # 100

# 뒤에 나오는 for는 앞의 for의 결과에 대해 반복한다
incresing_pairs = [(x, y)
                  for x in range(5)
                  for y in range(x + 1, 5)]
print incresing_pairs

[0, 2, 4]
[0, 1, 4, 9, 16]
[0, 4, 16]
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}
set([1])
100
[(0, 1), (0, 2), (0, 3), (0, 4), (1, 2), (1, 3), (1, 4), (2, 3), (2, 4), (3, 4)]


### Generator와 iterator

In [155]:
# 리스트의 크기가 클 경우, 한 번에 항목을 하나씩 처리하기 위해 전체 리스트를 사용하는 것은 비효율적이며 메모리가 부족해질 수도 있다
# 만약 리스트 앞부분의 몇몇 값만 필요하다면 리스트 전체를 계산할 필요가 없다

# Generator는 (주로 for문을 통해) 반복할 수 있으며, generator의 각 항목은 필요한 순간 그 때 그 때 생성된다
# Generator는 함수와 yield로 만들 수 있다

def lazy_range(n):
    i = 0
    while i < n:
        yield i
        i += 1

# 아래와 같은 반복문은 yield로 반환되는 값이 없을 때까지 번환된 값을 차례로 하나씩 사용한다
for i in lazy_range(10):
    print i

# 제너레이터를 반환하는 함수를 호출하면, 반복되기 전까지 실행되지 않는다
def lazy_range_with_print(n):
    print 'initialize'
    i = 0
    while i < n:
        print 'before yield', i
        yield i
        print 'after yield', i
        i += 1

lazy_range_generator = lazy_range_with_print(2)
print 'before for loop'
for i in lazy_range_generator:
    print i

# 실제로 파이썬에는 xrange()라는 이름으로 lazy_range 함수가 구현되어 있고,
# 파이썬 3부터는 range 자체가 generator로 만들어져있다

# 제너레이터의 단점은, 제너레이터를 단 한 번만 반복할 수 있다는 점이다.
# 데이터를 여러 번 반복하려고 한다면 매번 generator를 만들어야 한다


# 괄호 안에 for문을 추가하는 방법으로도 generator를 만들 수 있다
lazy_evens_below_20 = (i for i in xrange(20) if i % 2 == 0)
print lazy_evens_below_20 # list가 아니라 generator다

# dict의 items()는 dict의 모든 key와 value를 반환한다
# iteritems()는 제너레이터를 반환한다
for word, count in word_counts.iteritems():
    print word, count


0
1
2
3
4
5
6
7
8
9
before for loop
initialize
before yield 0
0
after yield 0
before yield 1
1
after yield 1
<generator object <genexpr> at 0x7f907d0be6e0>
baz 1
foo 2
bar 1
hello 1


### 난수 생성

In [183]:
# 난수(random number)를 생성해야 할 땐 random 모듈을 사용하면 된다
import random

four_uniform_randoms = [random.random() for _ in range(4)] # random.random()은 0과 1 사이의 난수를 생성한다
print four_uniform_randoms

# 만약 동일한 난수를 계속 사용하고 싶다면 random.seed()로 매번 고정된 난수를 생성하면 된다
random.seed(10)
print random.random()
random.seed(10)
print random.random() # 동일하다
print random.random() # 한 번 고정 후엔 시드가 초기화된다

# random.seed()를 한 번 설정한 후엔 초기화해준다
# 생략하면 os.random() 또는 시스템 타임이 기본으로 사용된다
random.seed()

# randrange([start=0], stop)으로 구간 안에서의 난수를 생성할 수 있다
print random.randrange(10) # [0, 1, ..., 9]에서 난수 생성
print random.randrange(3, 6) # [3, 4, 5] 중에 난수 생성

# shuffle(list)는 리스트의 항목의 순서를 임의로 재정렬한다
up_to_ten = range(10)
random.shuffle(up_to_ten)
print up_to_ten

# choice()는 임의의 항목을 하나 선택한다
print random.choice(up_to_ten)

# sample(list, numer)를 사용하면 중복을 허용하지 않는 임의의 표본 리스트를 만든다
lottery_numbers = range(60)
winning_numbers = random.sample(lottery_numbers, 6)
print winning_numbers

# 모수 리스트가 표본 리스트보다 작다면 ValueError가 발생한다
try:
    random.sample([1, 2], 5)
except ValueError:
    print "sample large then population"

# 중복을 허용하고 싶다면 choice()를 여러 번 호출하면 된다
four_with_replacement = [random.choice(range(10))
                        for _ in range(4)]
print four_with_replacement

[0.7590759125821485, 0.17150008286557084, 0.5600729735057532, 0.5358903343136648]
0.57140259469
0.57140259469
0.428889054675
5
3
[3, 7, 5, 8, 4, 6, 0, 9, 1, 2]
1
[6, 57, 26, 44, 9, 3]
sample large then population
[8, 4, 3, 2]


### 정규표현식

In [189]:
# re 모듈을 사용하면 된다
import re

print all([
        not re.match("a", "cat"),
        re.search("a", "cat"),
        not re.search("c", "dog"),
        3 == len(re.split("[ab]", "carbs")), # a 또는 b 로 나누면 3개
        "R-D-" == re.sub("[0-9]", "-", "R2D2") # 숫자를 - 로 대체
])

True


### 객체 지향 프로그래밍

In [195]:
# 클래스 이름은 캐멀케이스로
class Set:
    # 모든 멤버 함수의 첫 번째 인자는 self
    # self는 현재 인스턴스를 의미한다
    def __init__(self, values=None):
        """생성자"""
        self.dict = {}
        
        if values is not None:
            for value in values:
                self.add(value)
    
    def __repr__(self):
        """파이썬 프롬프트에서 이 인스턴스를 입력하거나, str()로 보내주면 문자열로 출력한다"""
        return "Set: " + str(self.dict.keys())

    def add(self, value):
        self.dict[value] = True
    
    def contains(self, value):
        return value in self.dict

    def remove(self, value):
        del self.dict[value]

# 생성한 클래스는 아래처럼 사용할 수 있다
s1 = Set([1, 2, 3])
print s1

s1.add(4)
print s1

print s1.contains(2)

s1.remove(2)
print s1


Set: [1, 2, 3]
Set: [1, 2, 3, 4]
True
Set: [1, 3, 4]


### 함수형 도구

In [210]:
# 함수의 특정 부분을 사용해 새로운 함수를 만들고 싶은 경우가 있다
# 이를 partial function application 또는 currying 이라고 한다
def exp(base, power):
    return base ** power

# 이 때 base 값을 고정해주는 함수를 만들고 싶다면 아래처럼 정의할 수 있다
def two_to_the(power):
    return exp(2, power)

# 이런 방식 대신 functool.partial이라는 것을 사용할 수 있다
from functools import partial
two_to_the = partial(exp, 2) # 첫 번째 인자를 2로 고정한 함수가 반환된다
print two_to_the(3) # 8

# 인자의 이름을 정해주면 첫 번째 인자가 아니어도 적용할 수 있다
square_of = partial(exp, power=2)
print square_of(3) # 9
# 하지만 함수 중간 인자를 partial로 사용하면 복잡해질 수 있으므로 지양하는 것이 좋다

# list comprehension의 대안으로 map, reduce, filter를 사용하는 경우도 있다
def double(x):
    return 2 * x

# list comprehension
xs = [1, 2, 3, 4]
twice_xs = [double(x) for x in xs]
print twice_xs

# map을 사용
twice_xs = map(double, xs) # 첫 번째 인자가 함수인 것에 주의한다
print twice_xs

# partial + map
list_doubler = partial(map, double) # 맵의 첫 번째 인자를 double로 설정. list 값을 두 배로 만들어주는 함수가 된다.
twice_xs = list_doubler(xs)
print twice_xs

# 여러 개의 list를 입력해주면, 인자가 여러 개인 함수에도 map을 적용할 수 있다
def multiply(x, y):
    return x * y

products = map(multiply, [1, 2], [4, 5]) # [1*4, 2*5]
print products

# filter는 if가 포함된 list comprehension과 동일하다
def is_even(x):
    return x % 2 == 0

x_evens = [x for x in xs if is_even(x)] # [2, 4]
print x_evens

x_evens = filter(is_even, xs)
print x_evens

list_evener = partial(filter, is_even)
x_evens = list_evener(xs)
print x_evens

# reduce는 모든 항목을 순차적으로 합해주면서 리스트를 하나의 값으로 표현한다
x_product = reduce(multiply, xs) # = 1 * 2 * 3 * 4 = 24
print x_product

list_product = partial(reduce, multiply)
x_product = list_product(xs)
print x_product

8
9
[2, 4, 6, 8]
[2, 4, 6, 8]
[2, 4, 6, 8]
[4, 10]
[2, 4]
[2, 4]
[2, 4]
24
24


### enumerate

In [213]:
# list를 반복하면서 항목과 인덱스가 필요할 때는 tuple을 생성하는 enumerate을 활용하면 된다.
for i, v in enumerate(range(3, 10)):
    print i, v

# 만약 인덱스만 필요하다면 다음과 같이 작성해도 좋다
for i, _ in enumerate(range(3, 10)):
    print i

0 3
1 4
2 5
3 6
4 7
5 8
6 9
0
1
2
3
4
5
6


### zip과 argument unpacking

In [222]:
# 가끔식 2개 이상의 리스트를 서로 묶어 주고 싶을 때가 있다.
# zip은 여러 개의 리스트를 서로 상응하는 튜플로 구성된 리스트로 변환해준다.
list1 = ['a', 'b', 'c', 'd']
list2 = [1, 2, 3]
pairs = zip(list1, list2) # 리스트 길이가 다르다면 첫 번째 리스트가 끝날 때 멈춘다
print pairs

# 묶인 리스트를 아래처럼 풀 수도 있다
letters, numbers = zip(*pairs)
print letters
print numbers

# 별표(*)는 원래 argument unpacking(인자 해체)을 할 때 사용되는 문법으로, 
# 이렇게 하면 pairs 내의 항목들을 zip 함수에 개발적인 인자로 전달해준다.
# 결국 아래와 같이 호출하는 것과 동일하다
print zip(('a', 1), ('b', 2), ('c', 3))

# 이런 방식의 argument unpacking은 모든 함수에 적용할 수 있다
def add(a, b):
    return a + b

print add(1, 2) # 3
print add(*[1, 2]) # 3, add([1, 2])와 같이 호출하면 TypeError가 발생한다


[('a', 1), ('b', 2), ('c', 3)]
('a', 'b', 'c')
(1, 2, 3)
[('a', 'b', 'c'), (1, 2, 3)]
3
3


### args와 kwargs

In [227]:
# 특정 함수 f를 입력하면 f의 결과를 두 배로 만드는 함수를 반환해주는 고차 함수를 만들고 싶다고 해보자
def doubler(f):
    def g(x):
        return 2 * f(x)
    return g

def f1(x):
    return x + 1

g = doubler(f1)
print g(3) # 8, (3+1) * 2
print g(-1) # 0


# 이 때 인자가 2개 이상이라면 문제가 발생한다
# doubler()는 인자가 1개인 함수만 처리하기 때문이다
def f2(x, y):
    return x + y

# 이럴 때 argument unpacking을 활용하면 처리할 수 있다
def magic(*args, **kwargs):
    print "unnamed args:", args # 이름 없는 인자들의 tuple
    print "named args:", kwargs # 이름 있는 인자의 dict

magic(1, 2, key="word", key2="word2")

# 반대로, 정해진 수의 인자가 있는 함수를 호출할 때에도 list나 dict로 인자를 전달할 수 있다
def other_way_magic(x, y, z):
    return x + y + z

x_y_list = [1, 2]
z_dict = {"z": 3}
print other_way_magic(*x_y_list, **z_dict) # 6

# args와 kwargs는 특히 임의의 인자를 받는 고차함수를 만들 때 요긴하게 사용할 수 있다
def doubler_correct(f):
    def g(*args, **kwargs):
        """어떤 인자가 들어오든 그대로 f로 전달한다"""
        return 2 * f(*args, **kwargs)
    return g

g = doubler_correct(f2)
print g(2, 3) # 10, (2 + 3) * 2

8
0
unnamed args: (1, 2)
named args: {'key2': 'word2', 'key': 'word'}
6
10
