# Chapter 1 - Pythonic Thinking
## 1장 - 파이썬다운 생각

## Item 01 : Know Which Version of Python You're Using
### Better Way 1 : 사용 중인 파이썬의 버전을 알자
https://github.com/gilbutITbook/006764/blob/master/item_01.py

* 정리
  * 파이썬의 주요 버전인 파이썬2, 파이썬3 모두 여전히 활발히 사용된다.
  * 파이썬에는 CPython, Jython, IronPython, PyPy 같은 다양한 런타임이 있다.
  * 시스템에서 파이썬을 실행하는 명령이 사용하고자 하는 파이썬 버전인지 확인해야 한다.
  * 파이썬 커뮤니티에서 주로 다루는 버전은 파이썬3이르모 새 파이썬 프로젝트를 시작할 때는 파이썬3를 사용하는 편이 좋다.


파이썬 공식 문서에서는 "파이썬 2.x 는 레거시(낡은 기술)이고, 파이썬 3.x가 파이썬의 현재와 미래가 될 것"이라고 요약을 했는데, 처음 배우는 프로그래머들은 파이썬 3으로 시작하는 것을 권장하고 있다.[[5](https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%B4%EC%8D%AC#cite_note-5)]

In [1]:
%%bash
python --version

Python 3.6.3


In [2]:
import sys
print(sys.version_info, '\n')
print(sys.version)

sys.version_info(major=3, minor=6, micro=3, releaselevel='final', serial=0) 

3.6.3 (default, Oct 18 2017, 11:44:13) 
[GCC 5.4.0 20160609]


## Item 02 : Follow the PEP 8 Style Guide
### Better Way 2 : PEP 8 스타일 가이드를 따르자

* 정리
  * 파이썬 코드를 작성할 때 항상 PEP 8 스타일 가이드를 따르자.
  * 큰 파이썬 커뮤니티에서 다른 사람과 원활하게 협업하려면 공통된 스타일을 공유해야 한다.
  * 일관성 있는 스타일로 작성하면 나중에 자신의 코드를 더 쉽게 수정할 수 있다.

* 참고
  * https://www.python.org/dev/peps/pep-0008/
  * https://spoqa.github.io/2012/08/03/about-python-coding-convention.html

## Item 03 : Know the Differences Between *bytes, str* and *unicode*
### Better Way 3 : bytes, str, unicode의 차이점을 알자
https://github.com/gilbutITbook/006764/blob/master/item_03.py

* 정리
  * 파이썬 3에서 bytes는 8비트 값을 지정하고, str은 유니코드 문자열을 저장한다. >나 +와 같은 연산자에 bytes와 str 인스턴스를 함께 사용할 수 없다.
  * 파이썬 2에서 str은 8비트 값을 저장하고, unicode는 유니코드 문자를 저장한다. str이 7 비트 아스크 문자만 포함한다면 연산자에 str과 unicode를 함께 사용할 수 있다.
  * 헬퍼 함수를 사용해서 처리할 입력값이 원하는 문자 시퀀스 타입(8비트 값, UTF-8 인코딩 문자, 유니코드 문자 등)으로 되어 있게 한다.
  * 바이너리 데이터를 파일에서 읽거나 쓸때는 파일을 바이너리 모드('rb' 혹은 'wb')로 오픈한다.

In [3]:
import logging
from pprint import pprint

def to_str(bytes_or_str):
    if isinstance(bytes_or_str, bytes):
        value = bytes_or_str.decode('utf-8')
    else:
        value = bytes_or_str
    
    return value

print(repr(to_str(b'foo')))
print(repr(to_str('foo')))

'foo'
'foo'


In [4]:
def to_bytes(bytes_or_str):
    if isinstance(bytes_or_str, str):
        value = bytes_or_str.encode('utf-8')
    else:
        value = bytes_or_str
    
    return value # Instance of bytes

print(repr(to_bytes(b'foo')))
print(repr(to_bytes('foo')))

b'foo'
b'foo'


In [5]:
try:
    import os
    with open('random.bin', 'w') as f:
        f.write(os.urandom(10))
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-5-277da9313844>", line 4, in <module>
    f.write(os.urandom(10))
TypeError: write() argument must be str, not bytes


In [6]:
with open('random.bin', 'wb') as f:
    f.write(os.urandom(10))

## Item 04 : Write Helper Functions Instead of Complex Expressions
### Better Way 4 : 복잡한 표신식 대신 헬퍼 함수를 작성하자
https://github.com/gilbutITbook/006764/blob/master/item_04.py

* 정리
  * 파이썬의 문법을 이용하면 한 줄짜리 표현식을 쉽게 작성할 수 있지만 코드가 복잡해지고 읽기 어려워진다.
  * 복잡한 표현식은 헬퍼 함수로 옮기는 게 좋다. 특히 같은 로직을 반복해서 사용해야 한다면 헬퍼 함수를 사용하자.
  * if/else 표현식을 이용하면 or나 and 같은 부울 연산자를 사용할 때보다 읽기 수월한 코드를 작성할 수 있다.

In [7]:
import logging
from pprint import pprint

from urllib.parse import parse_qs
my_values = parse_qs('red=5&blue=0&green=',
                     keep_blank_values=True)
print(repr(my_values))

{'red': ['5'], 'blue': ['0'], 'green': ['']}


In [8]:
print('Red:    ', my_values.get('red'))
print('Green:  ', my_values.get('green'))
print('Opacity:', my_values.get('opacity'))

Red:     ['5']
Green:   ['']
Opacity: None


In [9]:
# For query string 'red=5&blue=0&green='
red = my_values.get('red', [''])[0] or 0
green = my_values.get('green', [''])[0] or 0
opacity = my_values.get('opacity', [''])[0] or 0
print('Red:     %r' % red)
print('Green:   %r' % green)
print('Opacity: %r' % opacity)

Red:     '5'
Green:   0
Opacity: 0


* 참고
  * [Python 3항 연산자](https://blueshw.github.io/2016/01/22/2016-01-22-python-conditional-ternary-operator/)

In [10]:
red = my_values.get('red', [''])
red = int(red[0]) if red[0] else 0
green = my_values.get('green', [''])
green = int(green[0]) if green[0] else 0
opacity = my_values.get('opacity', [''])
opacity = int(opactity[0]) if opacity[0] else 0
print('Red:     %r' % red)
print('Green:   %r' % green)
print('Opacity: %r' % opacity)

Red:     5
Green:   0
Opacity: 0


**풀어쓰면 더 복잡**

In [11]:
green = my_values.get('green', [''])
if green[0]:
    green = int(green[0])
else:
    green = 0
print('Green:   %r' % green)

Green:   0


**표현식이 복잡해 지면 헬퍼 함수로 옮기는 방안을 고려.**

In [12]:
def get_first_int(values, key, default=0):
    found = values.get(key, [''])
    if found[0]:
        found = int(found[0])
    else:
        found = default
    return found

green = get_first_int(my_values, 'green')
print('Green:    %r' % green)

Green:    0


## Item 05 : Know How to Slice Sequences
### Better Way 5 : 시퀀스를 슬라이스하는 방법을 알자
https://github.com/gilbutITbook/006764/blob/master/item_05.py

* 정리
  * 너무 장황하지 않게 하자. start 인덱스에 0을 설정하거나 end 인덱스에 시퀀스의 길이를 설정하지 말자.
  * 슬라이싱은 범위를 벗어난 start나 end 인덱스를 허용하므로 a[:20]이나 a[-20]처럼 시퀀스의 앞쪽이나 뒤쪽 경계에 놓인 슬라이스를 표현하기가 쉽다.
  * list 슬라이스에 할당하면 원본 시퀀스에 지정한 범위를 참조 대상의 내용으로 대체한다(길이가 달라도 동작하다).

In [13]:
import logging
from pprint import pprint

a = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
print('First four:', a[:4])
print('Last four: ', a[-4:])
print('Middle two:', a[3:-3])

First four: ['a', 'b', 'c', 'd']
Last four:  ['e', 'f', 'g', 'h']
Middle two: ['d', 'e']


In [14]:
assert a[:5] == a[0:5]

In [15]:
assert a[5:] == a[5:len(a)]

In [16]:
print(a[:5])
print(a[:-1])
print(a[4:])
print(a[-3:])
print(a[2:5])
print(a[2:-1])
print(a[-3:-1])

['a', 'b', 'c', 'd', 'e']
['a', 'b', 'c', 'd', 'e', 'f', 'g']
['e', 'f', 'g', 'h']
['f', 'g', 'h']
['c', 'd', 'e']
['c', 'd', 'e', 'f', 'g']
['f', 'g']


In [17]:
print(a[:])     # ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
print(a[:5])    # ['a', 'b', 'c', 'd', 'e']
print(a[:-1])   # ['a', 'b', 'c', 'd', 'e', 'f', 'g']
print(a[4:])    #                     ['e', 'f', 'g', 'h']
print(a[-3:])   #                          ['f', 'g', 'h']
print(a[2:5])   #           ['c', 'd', 'e']
print(a[2:-1])  #           ['c', 'd', 'e', 'f', 'g']
print(a[-3:-1]) #                          ['f', 'g']

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
['a', 'b', 'c', 'd', 'e']
['a', 'b', 'c', 'd', 'e', 'f', 'g']
['e', 'f', 'g', 'h']
['f', 'g', 'h']
['c', 'd', 'e']
['c', 'd', 'e', 'f', 'g']
['f', 'g']


**start와 end로 조회시 인덱스가 경계를 벗어나도 적절하게 처리되지만, 인덱스를 직접 조회할 경우 예외가 발생.**

In [18]:
first_twenty_item = a[:20]
last_twenty_item = a[-20:]

try:
    a[20]
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-18-df00dccf5b2b>", line 5, in <module>
    a[20]
IndexError: list index out of range


In [19]:
b = a[4:]
print('Before:   ', b)
b[1] = 99
print('After:    ', b)
print('No change:', a)

Before:    ['e', 'f', 'g', 'h']
After:     ['e', 99, 'g', 'h']
No change: ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']


In [20]:
print('Before ', a)
a[2:7] = [99, 22, 14]
print('After  ', a)

Before  ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
After   ['a', 'b', 99, 22, 14, 'h']


In [21]:
b = a[:]
assert b == a and b is not a

* 참고
  * [Shallow Copy vs Deep Copy](https://blueshw.github.io/2016/01/20/2016-01-20-shallow-copy-deep-copy/)
  * [Mutable vs Immutable](http://ledgku.tistory.com/54)

In [22]:
b = a
print('Before', a)
a[:] = [101, 102, 103]
assert a is b        # Still the same list objects
print('After ', a)   # Now has different contents

Before ['a', 'b', 99, 22, 14, 'h']
After  [101, 102, 103]


## Item 06 : Avoid Using *start, end,* and *stride* in a Single Slice
### Better Way 6 : 한 슬라이드에 start, end, stride를 함께 쓰지 말라
https://github.com/gilbutITbook/006764/blob/master/item_06.py

* 정리
  * 한 슬라이드에 start, end, stride를 지정하면 매우 혼란스러울 수 있다.
  * 슬라이스에 start와 end 인덱스 없이 양수 stride 값을 사용하자. 음수 stride 같은 가능하면 피하는 게 좋다.
  * 한 슬라이스에 start, end, stride를 함께 사용하는 상황은 피하자. 파라미터 세 개를 사용해야 한다면 할당 두개(하나는 슬라이스, 다른 하나는 스타라이드)를 사용하거나 내장 모듈 itertools의 islice를 사용하자.

In [23]:
import logging
from pprint import pprint

a = ['red', 'orange', 'yellow', 'green', 'blue', 'purple']
odds = a[::2]
evens = a[1::2]
print(odds)
print(evens)

['red', 'yellow', 'blue']
['orange', 'green', 'purple']


In [24]:
x = b'mongoose'
y = x[::-1]
print(y)

b'esoognom'


In [25]:
try:
    w = '謝謝'
    x = w.encode('utf-8')
    y = x[::-1]
    z = y.decode('utf-8')
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-25-97291a2b26f2>", line 5, in <module>
    z = y.decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x9d in position 0: invalid start byte


In [26]:
a = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
print(a[::2])
print(a[::-2])

['a', 'c', 'e', 'g']
['h', 'f', 'd', 'b']


In [27]:
print(a[2::2])
print(a[-2::-2])
print(a[-2:2:-2])
print(a[2:2:-2])

['c', 'e', 'g']
['g', 'e', 'c', 'a']
['g', 'e']
[]


**특히 stride가 음수일때 예측이 쉽지 않다**

In [28]:
b = a[::2]  # ['a', 'c', 'e', 'g']
c = b[1:-1] # ['c', 'e']
print(a)
print(b)
print(c)

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
['a', 'c', 'e', 'g']
['c', 'e']


## Item 07 : Use List Comprehensions Instead of *map* and *filter*
### Better Way 7 : map과 filter 대신 리스트 컴프리헨션을 사용하자
https://github.com/gilbutITbook/006764/blob/master/item_07.py

* 정리
  * 리스트 컴프리헨션은 추가적인 lambda 표현식이 필요 없어서 내장 함수인 map이나 filter를 사용하는 것보다 명확하다.
  * 리스크 컴프리헨션은 사용하면 입력 리스트에서 아이템을 간단히 건너뛸 수 있다. map으로는 filter를 사용하지 않고는 이런 작업을 못한다.
  * 딕셔너리와 세트도 컴프리헨션 표현식을 지원한다.

In [29]:
import logging
from pprint import pprint

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # list(range(1, 11))
squares = [x**2 for x in a]
print(squares)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


In [30]:
squres = map(lambda x: x ** 2, a)
print(list(squres))

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


In [31]:
even_squares = [x ** 2 for x in a if x % 2 == 0]
print(even_squares)

[4, 16, 36, 64, 100]


In [32]:
alt = map(lambda x: x ** 2, filter(lambda x: x % 2 == 0, a))
assert even_squares == list(alt)

In [33]:
chile_ranks = {'ghost': 1, 'habanero': 2, 'cayuenne': 3}
rank_dict = {rank: name for name, rank in chile_ranks.items()}
chile_len_set = {len(name) for name in rank_dict.values()}
print(rank_dict)
print(chile_len_set)

{1: 'ghost', 2: 'habanero', 3: 'cayuenne'}
{8, 5}


## Item 08 : Avoid More then Two Expression in List Comprehensions
### Better Way 8 : 리스트 컴프리헨션에서 표현식을 두 개 넘게 쓰지 말라
https://github.com/gilbutITbook/006764/blob/master/item_08.py

* 정리
  * 리스트 컴프리헨션은 다중 루프와 루프 레벨별 다중 조건을 지원한다.
  * 표현식이 두 개가 넘게 들어 있는 리스트 컴프리헨션은 이해하기 매우 어려우므로 피해야 한다.

In [34]:
import logging
from pprint import pprint

matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
flat = [x for row in matrix for x in row]
print(flat)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [35]:
squared = [[x**2 for x in row] for row in matrix]
print(squared)

[[1, 4, 9], [16, 25, 36], [49, 64, 81]]


In [36]:
my_lists = [
    [[1, 2, 3], [4, 5, 6]],
    [[7, 8, 9], [10, 11, 12]],
]
flat = [x for sublist1 in my_lists
       for sublist2 in sublist1
       for x in sublist2]
print(flat)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]


**여러 줄짜리 컴프리헨션은 다른 법보다 잛지도 않고, 이해도 어렵다**

In [37]:
flat = []
for sublist1 in my_lists:
    for sublist2 in sublist1:
        flat.extend(sublist2)
print(flat)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]


In [38]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
b = [x for x in a if x > 4 if x % 2 == 0]
c = [x for x in a if x > 4 and x % 2 == 0]
print(b)
print(c)
assert b and c
assert b == c

[6, 8, 10]
[6, 8, 10]


**아래와 같이 복작한 리스트 컴프리헨션은 피하자.(이해가 어렵다)**  
**헬퍼 함수 작성**

In [39]:
matrix =[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
filtered = [[x for x in row if x % 3 == 0]
           for row in matrix if sum(row) >= 10]
print(filtered)

[[6], [9]]


## Item 09 : Consider Generator Expressions for Large Comprehensions
### Better Way 9 : 컴프리헨션이 클 때는 제너레이터 표션식을 고려하자
https://github.com/gilbutITbook/006764/blob/master/item_09.py

* 정리
  * 리스트 컴프리헨션은 큰 입력을 처리할 때 너무 많은 메모리를 소모해서 문제를 읽으킬 수 있다.
  * 제너레이터 표현식은 이터레이터로 한 번에 한 출력만 만드므로 메모리 문제를 피할 수 있다.
  * 한 제너레이터 표현식에서 나온 이터레이터를 또 다른 제너레이터 표현식의 for 서브 표현식으로 넘기는 방식으로 제너레이터 표현식을 조합할 수있다.
  * 제너레이터 표현식은 서로 연결되어 있을 때 매우 빠르게 실행된다.

In [40]:
import logging
from pprint import pprint

import random
with open('my_file.txt', 'w') as f:
    for _ in range(10):
        f.write('a' * random.randint(0, 100))
        f.write('\n')

value = [len(x) for x in open('my_file.txt')]
print(value)

[11, 62, 90, 85, 34, 28, 51, 37, 82, 2]


In [41]:
it = (len(x) for x in open('my_file.txt'))
print(it)

<generator object <genexpr> at 0x7f0f346558e0>


In [42]:
print(next(it))
print(next(it))

11
62


In [43]:
roots = ((x, x**0.5) for x in it)
print(next(roots))

(90, 9.486832980505138)


## Item 10 : Prefer *enumerate* Over *range*
### Better Way 10 : range보다는 enumerate를 사용하자
https://github.com/gilbutITbook/006764/blob/master/item_10.py

* 정리
  * enumerate는 이터레이터를 순회하면서 이터레이터에서 각 아이템의 인수를 얻어오는 간결한 문법을 제공한다.
  * range로 루프를 실행하고 시퀀스에 인덱스로 접근하기 보다는 enumerate를 사용하는 게 좋다.
  * enumerate에 두번째 파라미터를 사용하면 세기 시작할 숫자를 지정할 수 있다(기본값은 0이다).

In [44]:
import logging
from pprint import pprint

from random import randint
random_bits = 0
for i in range(64):
    if randint(0, 1):
        random_bits |= 1 << i
print(bin(random_bits))

0b1110010101001100110001001110010001010010010101001011001101101111


In [45]:
flavor_list = ['vanilla', 'chocolate', 'pecan', 'strawberry']
for flavor in flavor_list:
    print('%s is delicious' % flavor)

vanilla is delicious
chocolate is delicious
pecan is delicious
strawberry is delicious


In [46]:
for i in range(len(flavor_list)):
    flavor = flavor_list[i]
    print('%d: %s' % (i + 1, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


In [47]:
for i, flavor in enumerate(flavor_list):
    print('%d: %s' % (i + 1, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


In [48]:
for i, flavor in enumerate(flavor_list, 1):
    print('%d: %s' % (i, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


## Item 11 : Use *Zip* to Process Iterators in Parallel
### Better Way 11 : 이터레이터를 병렬로 처리하려면 zip을 사용하자
https://github.com/gilbutITbook/006764/blob/master/item_11.py

* 정리
  * 내장 함수 zip은 여러 이터레이터를 병렬로 순회할 때 사용할 수 있다.
  * 파이썬3의 zip은 튜플을 생성하는 지연 제너레이터다. 파이썬 2의 zip은 전체 결과를 튜플 리스트로 반환한다.
  * 길이가 다른 이터레이터를 사용하면 zip은 그 결과를 조용히 잘라낸다.
  * 내장 모듈 itertool의 zip_longest 함수를 쓰면 여러 이터레이터의 길이에 상관없이 병렬로 순회할 수 있다.

In [49]:
import logging
from pprint import pprint

names = ['Cecilia', 'Lise', 'Marie']
letters = [len(n) for n in names]
print(letters)

[7, 4, 5]


In [50]:
longest_name = None
max_letters = 0

for i in range(len(names)):
    count = letters[i]
    if count > max_letters:
        longest_name = names[i]
        max_letters = count

print(longest_name)

Cecilia


In [51]:
longest_name = None
max_letters = 0

for i, name in enumerate(names):
    count = letters[i]
    if count > max_letters:
        longest_name = name
        max_letters = count

print(longest_name)

Cecilia


In [52]:
longest_name = None
max_letters = 0

for name, count in zip(names, letters):
    if count > max_letters:
        longest_name = name
        max_letters = count

print(longest_name)

Cecilia


In [53]:
names.append('Rosalind')

for name, count in zip(names, letters):
    print(name)

Cecilia
Lise
Marie


## Item 12 : Avoid *else* Blocks After *for* and *while* Loops
### Better Way 12 : for와 while 루프 뒤에는 else 블록을 쓰지 말자
https://github.com/gilbutITbook/006764/blob/master/item_12.py

* 정리
  * 파이썬에는 for와 while 루프에 내부 블록 바로 뒤에 else 블록을 사용할 수 있게 하는 특별한 문법이 있다.
  * 루프 본문이 break문을 만다지 않은 경우에만 루프 다음에 오는 else 블록이이 실행된다.
  * 루프 뒤에 else 블록을 사용하면 직관적이지 않고 혼동하기 쉬우니 사용하지 말아야 한다.

In [54]:
import logging
from pprint import pprint

for i in range(3):
    print('Loop %d' % i)
else:
    print('Else block!')

Loop 0
Loop 1
Loop 2
Else block!


In [55]:
for i in range(3):
    print('Loop %d' % i)
    if i == 1:
        break
else:
    print('Else block')

Loop 0
Loop 1


In [56]:
for x in []:
    print('Never runs')
else:
    print('For Else block!')

For Else block!


In [57]:
while False:
    print('Never runs')
else:
    print('While Else blocks!')

While Else blocks!


**아래는 두 숫자가 서로소(coprime: 공약수가 1밖에 없는 둘 이상의 수) 인지를 판별하는 예(좋지 못한 예)**

In [58]:
a = 4
b = 9

for i in range(2, min(a, b) + 1):
    print('Testing', i)
    if a % i == 0 and b % i == 0:
        print('Not coprime')
        break
else:
    print('Coprime')

Testing 2
Testing 3
Testing 4
Coprime


In [59]:
def coprime(a, b):
    for i in range(2, min(a, b) + 1):
        if a % i == 0 and b % i == 0:
            return False
    return True

print(coprime(4, 9))
print(coprime(3, 6))

True
False


In [60]:
def coprime2(a, b):
    is_coprime = True
    for i in range(2, min(a, b) + 1):
        if a % i == 0 and b % i == 0:
            is_coprime = False
            break
    return is_coprime

print(coprime2(4, 9))
print(coprime2(3, 6))

True
False


## Item 13 : Take Advantage of Each block in *try/exception/else/finally*
### Better Way 13 : try/except/else/finally에서 각 블록의 장점을 이용하자
https://github.com/gilbutITbook/006764/blob/master/item_13.py

* 정리
  * try/finally 복합문을 이용하면 try 블록에서 예외 발생 여부와 상관없이 정리 코드를 실행 할 수 있다.
  * else 블록은 try 블록에 있는 코드의 양을 최소로 줄이는 데 도움을 주며 try/except 블록과 성공한 경우에 실행할 코드를 시각적으로 구분해준다.
  * else 블록은 try 블록의 코드가 성공적으로 실행된 후 finally 블록에서 공통 정리 코드를 실행하기 전에 추가 작업을 하는 데 사용할 수 있다.

In [61]:
import logging
from pprint import pprint

handle = open('random_data.txt', 'w', encoding='utf-8')
handle.write('success\nand\nnew\nlines')
handle.close()
handle = open('random_data.txt') # May raise IOError
try:
    data = handle.read()         # May raise UnicodeDecodeError
finally:
    handle.close()               # Always run after try:

In [62]:
import json

def load_json_key(data, key):
    try:
        result_dict = json.loads(data) # May raise ValueError
    except ValueError as e:
        print('ValueError')
        raise KeyError from e
    else:
        return result_dict[key]        # May raise KeyError

# JSON decode successful
assert load_json_key('{"foo": "bar"}', 'foo') == 'bar'
try:
    load_json_key('{"foo": "bar"}', 'does not exist')
    assert False
except KeyError:
    print('KeyError')
    # pass # Expected

# JSON decode fails
try:
    load_json_key('{"foo": bad payload', 'foo') # Raise ValueError
    assert False
except KeyError:
    print('KeyError')
    # pass # Expected

KeyError
ValueError
KeyError


In [63]:
import json
UNDEFINED = object()

def divide_json(path):
    handle = open(path, 'r+')  # May raise IOError
    try:
        data = handle.read()   # May raise UnicodeDecodeEror
        op = json.loads(data)  # May raise ValueError
        value = (
            op['numerator'] /
            op['denominator']) # May raise ZeroDivisionError
    except ZeroDivisionError as e:
        return UNDEFINED
    else:
        op['result'] = value
        result = json.dumps(op)
        handle.seek(0)
        handle.write(result)   # May raise IOError
        return value
    finally:
        handle.close()         # Always runs

# Everything works
temp_path = 'random_data.json'
handle = open(temp_path, 'w')
handle.write('{"numerator": 1, "denominator": 10}')
handle.close()
assert divide_json(temp_path) == 0.1

# Divide by Zero error
handle = open(temp_path, 'w')
handle.write('{"numerator": 1, "denominator": 0}')
handle.close()
assert divide_json(temp_path) is UNDEFINED

# JSON decode error
handle = open(temp_path, 'w')
handle.write('{"numerator": 1 bad data')
handle.close()
try:
    divide_json(temp_path)
    assert False
except ValueError:
    print('ValueError')
    # pass # Expected

ValueError


# Chapter 2 - Functions
## 2장 - 함수

## Item 14 : Prefer Exceptions to Returning *None*
### Better Way 14 : None을 반환하기보다는 예외를 일으키자
https://github.com/gilbutITbook/006764/blob/master/item_14.py

* 정리
  * 특별한 의미를 나타내려고 None을 반환하는 함수가 오류를 일의키기 쉬운 이유는 None이나 다른 값(예를 들면 0이나 빈 문자열)이 조건식에서 False로 평가되기 때문이다.
  * 특별한 상황을 알릴 때 None을 반환하는 대신에 예외를 일으키자. 문서화가 되어 있다면 호출하는 코드에서 예외를 적절하게 처리할 것이라고 기대할 수 있다.

In [64]:
import logging
from pprint import pprint

def divide(a, b):
    try:
        return a / b
    except ZeroDivisionError:
        return None

assert divide(4, 2) == 2
assert divide(0, 1) == 0
assert divide(3, 6) == 0.5
assert divide(1, 0) == None

In [65]:
x, y = 1, 0
result = divide(x, y)
if result is None:
    print('Invalid inputs')
else:
    print('Result is %.1f' % result)

Invalid inputs


**None은 Python의 if문에서 False로 판단해서 문제의 여지가 있음**

In [66]:
x, y = 0, 5
result = divide(x, y)
if not result:
    print('Invalid inputs') # This is wrong!
else:
    assert False

Invalid inputs


**개선 방법 1 - 작업의 성공 여부와 계산 결과를 두개 값을 반환(좋지 않은 방법)**

In [67]:
def divide(a, b):
    try:
        return True, a / b
    except ZeroDivisionError:
        return False, None

x, y = 5, 0
success, result = divide(x, y)
if not success:
    print('Invalid inputs')

Invalid inputs


In [68]:
x, y = 5, 0
_, result = divide(x, y)
if not result:
    print('Invalid inputs') # This is right

Invalid inputs


**아래 예시의 문제는 if문에서 0도 False로 판단한다는 문제를 보임**

In [69]:
x, y = 0, 5
_, result = divide(x, y)
if not result:
    print('Invalid inputs') # This is wrong

Invalid inputs


**개선 방법 2 - 예외 처리(이 방법이 좋은 방법)**

In [70]:
def divide(a, b):
    try:
        return a / b
    except ZeroDivisionError as e:
        raise ValueError('Invalid inputs') from e

x, y = 5, 2
try:
    result = divide(x, y)
except ValueError:
    printt('Invalid inputs')
else:
    print('Result is %.1f' % result)

Result is 2.5


## Item 15 : Know How Closures Interact with Variable Scope
### Better Way 15 : 클로저가 변수 스코프와 상호 작용하는 방법을 알자
https://github.com/gilbutITbook/006764/blob/master/item_15.py

* 정리
  * 클로저 함수는 자신이 정의된 스코프 중 어디에 있는 변수도 참조할 수 있다.
  * 기본적으로 클로저에서 변수를 할당하면 바깥쪽 스코프에는 영향을 미치지 않는다.
  * 파이썬 3에서는 nonlocal 문을 사용하여 클로저를 감싸고 있는 스코프의 변수를 수정할 수 있음을 알린다.
  * 파이썬 2에서는 (아이템이 한 개만 있는 리스트 같은) 수정 가능한 값으로 nonlocal 문이 없는 문제를 우회한다.
  * 간단한 함수 이외에는 nonlocal 문을 사용하지 말자.

In [71]:
import logging
from pprint import pprint

def sort_priority(values, group):
    def helper(x):
        if x in group:
            return (0, x)
        return (1, x)
    values.sort(key=helper)

numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
sort_priority(numbers, group)
print(numbers)

[2, 3, 5, 7, 1, 4, 6, 8]


* 위의 예제가 정상 동작한 3가지 이유
  * 파이썬은 [클로저(clouser)](http://schoolofweb.net/blog/posts/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%ED%81%B4%EB%A1%9C%EC%A0%80-closure/)를 지원한다. 클로저란 자신이 정의된 스코프에 있는 변수를 참조하는 함수다. 바로 이 점 덕분에 helper 함수가 sort_priority의 group 인수에 접근할 수 있다.
  * 함수는 파이썬에서 [일급 객체(fisrt-class object)](http://whatisthenext.tistory.com/111)다. 이 말은 함수를 직접 참조하고, 변수에 할당하고, 다른 함수의 인수로 전달하고, 표현식과 if 문 등에서 비교할 수 있다는 의미다. 따라서 sort 메서드에서 클로저 함수를 key인수로 받을 수 있다.
  * 파이썬에는 튜플을 비교하는 특정한 규칙이 있다. 먼저 인덱스 0으로 아이템을 비교하고 그 다음으로 인덱스 1, 다음은 인덱스 2와 같이 진행한다. helper 클로저의 반환 값이 정렬 순서를 분리된 두 그룹으로 나뉘게 한 건 이 규칙 때문이다.

In [72]:
def sort_priority2(numbers, group):
    found = False
    def helper(x):
        if x in group:
            found = True # Seems simple
            return (0, x)
        return (1, x)
    numbers.sort(key=helper)
    return found

numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
found = sort_priority2(numbers, group)
print('Found:', found)
print(numbers)

def sort_priority2(numbers, group):
    found = False        # Scope: 'sort_priority2'
    def helper(x):
        if x in group:
            found = True # Scope: 'helper' -- Bad!
            return (0, x)
        return (1, x)
    numbers.sort(key=helper)
    return found

Found: False
[2, 3, 5, 7, 1, 4, 6, 8]


**nonlocal : Python3에서 클로저에서 데이터를 얻어 오는 특별한 문법**

In [73]:
def sort_priority3(numbers, group):
    found = False
    def helper(x):
        nonlocal found
        if x in group:
            found = True
            return (0, x)
        return (1, x)
    numbers.sort(key=helper)
    return found

numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
found = sort_priority3(numbers, group)
print('Found:', found)
print(numbers)

Found: True
[2, 3, 5, 7, 1, 4, 6, 8]


**아래는 헬퍼 클래스로 상태를 감싸는 법법을 이용한 예**  
**"Better Way 23 : 인터페이스가 간단하면 클래스 대신 함수를 받자" 항목 참조**

In [74]:
class Sorter(object):
    def __init__(self, group):
        self.group = group
        self.found = False
    
    def __call__(self, x):
        if x in self.group:
            self.found = True
            return (0, x)
        return (1, x)

numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 3, 5, 7}
sorter = Sorter(group)
numbers.sort(key=sorter)
assert sorter.found is True
print('Found:', found)
print(numbers)

Found: True
[2, 3, 5, 7, 1, 4, 6, 8]


## Item 16 : Consider Generators Instead of Returning Lists
### Better Way 16 : 리스트를 반환하는 대신 제너레이터를 고려하자
https://github.com/gilbutITbook/006764/blob/master/item_16.py

* 정리
  * 제너레이터를 사용하는 방법이 누적된 결과의 리스트를 반환하는 방법보다 이해하기에 명확하다.
  * 제너레이터를 반환한 이터레이터는 제너레이터 함수의 본문에 있는 yield 표현식에 전달된 값들의 집합이다.
  * 제너레이터는 모든 입력과 출력을 메모리에 저장하지 않으므로 입력값의 양을 알기 어려울 때도 연속된 출력을 만들수 있다.

In [75]:
import logging
from pprint import pprint

def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index + 1)
    return result

address = 'Four score and seven years ago...'
address = 'Four score and seven years ago our fathers brought forth on this continent a new nation, conceived in liberty, and dedicated to the proposition that all men are created equal.'
result = index_words(address)
print(result[:3])

[0, 5, 11]


**제너레이터 함수는 호출되면 실제로 실행하지 않고 바로 이터레이터(iterator)를 반환한다. 내장 함수 next를 호출할 때마다 이터레이터는 제너레이터가 다음 yield 표현식으로 진행하게 한다. 제너레이터에서 yield에 전달한 값을 이터레이터가 호출하는 쪽에 반환한다.**

In [76]:
def index_words_iter(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1

result = list(index_words_iter(address))
print(result[:3])

[0, 5, 11]


**아래의 예제는 한줄씩 읽어서 단어의 시작점을 내어주는 제너레이터이다.  
이 함수가 동작할 때 사용하는 메모리는 입력 한 줄의 최대 길이까지다.**

In [77]:
def index_file(handle):
    offset = 0
    for line in handle:
        if line:
            yield offset
        for letter in line:
            offset += 1
            if letter == ' ':
                yield offset

address_lines = """Four score and seven years
ago our fathers brought forth on this
continent a new nation, conceived in liberty,
and dedicated to the proposition that all men
are created equal."""

with open('address.txt', 'w') as f:
    f.write(address_lines)

from itertools import islice
with open('address.txt', 'r') as f:
    it = index_file(f)
    results = islice(it, 0, 3)
    print(list(results))

[0, 5, 11]


## Item 17 : Be Defensive When Iterating Over Arguments
### Better Way 17 : 인수를 순회할 때는 방어적으로 하자
https://github.com/gilbutITbook/006764/blob/master/item_17.py

* 정리
  * 입력 인수를 여러 번 순회하는 함수를 작성할 때 주의하자. 입력 인수가 이터레이터라면 이상하게 동작해서 값을 잃어버릴 수 있다.
  * 파이썬 이터레이터 프로토콜은 컨테이너와 이터레이터가 내장 함수 iter, next와 for 루프 및 관련 표현식과 상호 작용하는 방법을 정의한다.
  * \_\_iter\_\_ 메서드를 제너레이터로 구현하면 자신만의 이터러블 컨테이너 타입을 쉽게 정을할 수 있다.
  * 어떤 값에 iter를 두 번 호출했을 때 같은 결과가 나오고 내장 함수 next로 전진시킬 수 있다면 그 값은 컨테이너가 아닌 이터레이터다.

In [78]:
import logging
from pprint import pprint

def normalize(numbers):
    total = sum(numbers)
    result = []
    for value in numbers:
        percent = 100 * value / total
        result.append(percent)
    return result

visits = [15, 35, 80]
percentages = normalize(visits)
print(percentages)

[11.538461538461538, 26.923076923076923, 61.53846153846154]


In [79]:
path = 'my_numbers.txt'
with open(path, 'w') as f:
    for i in (15, 35, 80):
        f.write('%d\n' % i)

def read_visits(data_path):
    with open(data_path) as f:
        for line in f:
            yield int(line)

it = read_visits('my_numbers.txt')
percentages = normalize(it)
print(percentages)

[]


**위의 예는 noamlize에서 total을 구할 때 한번 읽어 버렸기 때문이다.  
이미 StopIteration 예외를 일으킨 이터레이터나 제너레이터를 순회하면 어떤 결과도 얻을 수 없다.**

In [80]:
it = read_visits('my_numbers.txt')
print(list(it))
print(list(it)) # Already exhausted

[15, 35, 80]
[]


In [81]:
def normalize_copy(numbers):
    numbers = list(numbers) # Copy the iterator
    total = sum(numbers)
    result = []
    for value in numbers:
        percent = 100 * value / total
        result.append(percent)
    return result

it = read_visits('my_numbers.txt')
percentages = normalize_copy(it)
print(percentages)

[11.538461538461538, 26.923076923076923, 61.53846153846154]


**위 방식의 문제는 이터레이터의 콘텐츠의 복사본이 큰 경우 문제가 될 수 있다.  
해결 방안은 아래와 같이 호출될 때마다 새 이터레이터를 반환하는 함수를 받도록 만드는 것이다.**

In [82]:
def normalize_func(get_iter):
    total = sum(get_iter())  # New iterator
    result = []
    for value in get_iter():  # New iterator
        percent = 100 * value / total
        result.append(percent)
    return result

percentages = normalize_func(lambda: read_visits(path))
print(percentages)

[11.538461538461538, 26.923076923076923, 61.53846153846154]


**위의 방식은 잘 동작하긴 하지만, 이렇게 lambda 함수를 넘겨주는 방법은 세련되지 못하다.  
같은 결과를 얻는 더 좋은 방법은 이터레이터 프로토콜(iterator protocal)을 구현한 새 컨테이너 클래스를 제공하는 것이다.**

In [83]:
class ReadVisits(object):
    def __init__(self, data_path):
        self.data_path = data_path
    
    def __iter__(self):
        with open(self.data_path) as f:
            for line in f:
                yield int(line)

visits = ReadVisits(path)
percentages = normalize(visits)
print(percentages)

[11.538461538461538, 26.923076923076923, 61.53846153846154]


In [84]:
def normalize_defensive(numbers):
    if iter(numbers) is iter(numbers): # An iterator -- bad!
        raise TypeError('Must supply a container')
    total = sum(numbers)
    result = []
    for value in numbers:
        percent = 100 * value / total
        result.append(percent)
    return result

visits = [15, 35, 80]
normalize_defensive(visits) # No error
visits = ReadVisits(path)
normalize_defensive(visits) # No error

[11.538461538461538, 26.923076923076923, 61.53846153846154]

In [85]:
try:
    it = iter(visits)
    normalize_defensive(it)
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-85-27fe0c75c64d>", line 3, in <module>
    normalize_defensive(it)
  File "<ipython-input-84-e9eebb90f973>", line 3, in normalize_defensive
    raise TypeError('Must supply a container')
TypeError: Must supply a container


## Item 18 : Reduce Visual Noise with Variable Positional Arguments
### Better Way 18 : 가변 위치 인수로 깔끔하게 보이게 하자
https://github.com/gilbutITbook/006764/blob/master/item_18.py

* 정리
  * def 문에서 *args를 사용하면 함수에서 가변 개수의 위치 인수를 받을 수 있다.
  * \* 연산자를 쓰면 시퀀스에 들어 있는 아이템을 함수의 위치 인수로 사용할 수 있다.
  * 제너레이터와 \* 연산자를 함께 사용하면 프로그램이 메모리 부족으로 망가질 수도 있다.
  * \*args를 받는 함수에 새 위치 파라미터를 추가하면 정말 찾기 어려운 버그가 생길 수도 있다.

In [86]:
import logging
from pprint import pprint

def log(message, values):
    if not values:
        print(message)
    else:
        values_str = ', '.join(str(x) for x in values)
        print('%s: %s' % (message, values_str))

log('My numbers are', [1, 2])
log('Hi there', [])

My numbers are: 1, 2
Hi there


In [87]:
def log(message, *values): # The only difference
    if not values:
        print(message)
    else:
        values_str = ', '.join(str(x) for x in values)
        print('%s: %s' % (message, values_str))

log('My numbers are', 1, 2)
log('Hi there')  # Much better

favorites = [7, 33, 99]
log('Favorite colors', *favorites)

My numbers are: 1, 2
Hi there
Favorite colors: 7, 33, 99


In [88]:
def my_generator():
    for i in range(10):
        yield i

def my_func(*args):
    print(args)

it = my_generator()
my_func(*it)

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)


* 가변 개수의 위치 인수들을 받는 방법에는 두 가지 문제가 있다.
  * 가변 인수가 함수에 전달되기에 앞서 항상 튜플로 변환하게 된다는 점.
    * 호출측에서 제너레이터에 \* 연산자를 쓰면 제너레이터가 모두 소진될때까지 순회됨을 의미(메모리 문제 발생 여지 있음).(위의 예시)
    * 입력의 수가 적당하다는 사실을 아는 상황에서는 좋은 방법
  * 추후에 호출 코드를 모두 변경하지 않고서는 새 위치 인수를 추가할 수 없다는 점.(아래 예시)
    * 버그 발견도 어려움. 이런 문제를 완전히 없애기 위해서는 \*args를 받는 함수를 확장할 때 키워드 전용(keyword-only) 인수를 사용해야 한다  
    ("Better Way 21 : 키워드 전용 인수로 명료성을 강조하자" 참고)

In [89]:
def log(sequence, message, *values):
    if not values:
        print('%s: %s' % (sequence, message))
    else:
        values_str = ', '.join(str(x) for x in values)
        print('%s: %s: %s' % (sequence, message, values_str))

log(1, 'Favorites', 7, 33)     # New usage is OK
log('Favorite numbers', 7, 33) # Old usage breaks

1: Favorites: 7, 33
Favorite numbers: 7: 33


## Item 19 : Provide Optional Behavior with Keyword Arguments
### Better Way 19 : 키워드 인수로 선택적인 동작을 제공하자
https://github.com/gilbutITbook/006764/blob/master/item_19.py

* 정리
  * 함수의 인수를 위치나 키워드로 지정할 수 있다.
  * 위치 인수만으로는 이해하기 어려울 때 키워드 인수를 쓰면 각 인수를 사용하는 목적이 명확해진다.
  * 키워드 인수에 기본값을 지정하면 함수에 새 동작을 쉽게 추가할 수 있다. 특히 함수를 호출하는 기존 코드가 있을 때 사용하면 좋다.
  * 선택적인 키워드 인수는 항상 위치가 아닌 키워드로 넘겨야 한다.

In [90]:
import logging
from pprint import pprint

def remainder(number, divisor):
    return number % divisor

assert remainder(20, 7) == 6

In [91]:
remainder(20, 7)
remainder(20, divisor=7)
remainder(number=20, divisor=7)
remainder(divisor=7, number=20)

6

In [92]:
try:
    # This will not compile
    source = """remainder(number=20, 7)"""
    eval(source)
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-92-b9e3cf7fdfd3>", line 4, in <module>
    eval(source)
  File "<string>", line 1
SyntaxError: positional argument follows keyword argument


**위의 예는 위치 인수를 키워드 인수 뒤에 지정했기 때문에 에러 발생.  
아래 예는 number가 두번 지정되었기 때문에 에러 발생.**

In [93]:
try:
    remainder(20, number=7)
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-93-9b9c03585c63>", line 2, in <module>
    remainder(20, number=7)
TypeError: remainder() got multiple values for argument 'number'


In [94]:
def flow_rate(weight_diff, time_diff):
    return weight_diff / time_diff

weight_diff = 0.5
time_diff = 3
flow = flow_rate(weight_diff, time_diff)
print('%.3f kg per second' % flow)
assert (flow - 0.16666666666666666) < 0.0001

0.167 kg per second


In [95]:
def flow_rate(weight_diff, time_diff, period):
    return (weight_diff / time_diff) * period

flow_per_second = flow_rate(weight_diff, time_diff, 1)
print(flow_per_second)
assert (flow_per_second - 0.16666666666666666) < 0.0001

0.16666666666666666


In [96]:
def flow_rate(weight_diff, time_diff, period=1):
    return (weight_diff / time_diff) * period

flow_per_second = flow_rate(weight_diff, time_diff)
assert(flow_per_second - 0.16666666666666666) < 0.0001
flow_per_hour = flow_rate(weight_diff, time_diff, period=3600)
print(flow_per_hour)
assert flow_per_hour == 600.0

600.0


In [97]:
def flow_rate(weight_diff, time_diff,
              period=1, units_per_kg=1):
    return ((weight_diff * units_per_kg) / time_diff) * period

pounds_per_hour = flow_rate(weight_diff, time_diff,
                           period=3600, units_per_kg=2.2)
print(pounds_per_hour)
assert pounds_per_hour == 1320.0

1320.0


In [98]:
pounds_per_hour = flow_rate(weight_diff, time_diff, 3600, 2.2)
print(pounds_per_hour)
assert pounds_per_hour == 1320.0

1320.0


## Item 20 : Use *None* and Docstrings to Specify Dynamic Default Arguments
### Better Way 20 : 동적 기본 인수를 지정하려면 None과 docstring을 사용하자
https://github.com/gilbutITbook/006764/blob/master/item_20.py

* 정리
  * 기본 인수는 모듈 로드 시점에 함수 정의 과정에서 딱 한번만 평가된다. 그래서 ({}나 []와 같은) 동적 값에는 이상하게 동작하는 원인이 되기도 한다.
  * 값이 동적인 키워드 인수에는 기본값으로 None을 사용하자. 그러고 나서 함수의 docstring에 실제 기본 동작을 문서화하자.

In [99]:
import logging
from pprint import pprint

from time import sleep
from datetime import datetime

def log(message, when=datetime.now()):
    print('%s: %s' % (when, message))

log('Hi there')
sleep(0.1)
log('Hi again!')

2018-03-12 22:49:09.866187: Hi there
2018-03-12 22:49:09.866187: Hi again!


In [100]:
def log(message, when=None):
    """Log a message with a timestamp.
    
    Args:
        message: Message to print.
        when: datetime of when th message occurred.
            Defaults to the pressent time.
    """
    when = datetime.now() if when is None else when
    print('%s: %s' % (when, message))

log('Hi there!')
sleep(0.1)
log('Hi again!')

2018-03-12 22:49:09.982203: Hi there!
2018-03-12 22:49:10.083453: Hi again!


In [101]:
import json

def decode(data, default={}):
    try:
        return json.loads(data)
    except ValueError:
        return default

foo = decode('bad data')
foo['stuff'] = 5
bar = decode('also bad')
bar['meep'] = 1
print('Foo:', foo)
print('Bar:', bar)

Foo: {'stuff': 5, 'meep': 1}
Bar: {'stuff': 5, 'meep': 1}


In [102]:
assert foo is bar

In [103]:
def decode(data, default=None):
    """Load JSON data from a string.
    
    Args:
        data: JSON data to decode.
        default: Value to return if decoding fails.
            Defaults to an empth dictionary.
    """
    if default is None:
        default = {}
    try:
        return json.loads(data)
    except ValueError:
        return default

foo = decode('bad data')
foo['stuff'] = 5
bar = decode('alse bad')
bar['meep'] = 1
print('Foo:', foo)
print('Bar:', bar)

Foo: {'stuff': 5}
Bar: {'meep': 1}


## Item 21 : Enforce Clarity with Keyworkd-Only Arguments
### Better Way 21 : 키워드 전용 인수로 명료성을 강요하자
https://github.com/gilbutITbook/006764/blob/master/item_21.py

* 정리
  * 키워드 인수는 함수 호출의 의도를 더 명확하게 해준다.
  * 특히 부울 플래그를 여러 개 받는 함수처럼 헷갈리기 쉬운 함수를 호출할 때 키워드 인수를 넘기게 하려면 키워드 전용 인수를 사용하자.
  * 파이썬 3는 함수의 키워드 전용 인수 문법을 명시적으로 지원한다.
  * 파이썬 2에서는 \*\*kwargs를 사용하고 TypeError 예외를 직접 일으키는 방법으로 함수의 키워드 전용 인수를 흉내 낼 수 있다.

In [104]:
import logging
from pprint import pprint

def safe_division(number, divisor, ignore_overflow, ignore_zero_division):
    try:
        return number / divisor
    except OverflowError:
        if ignore_overflow:
            return 0
        else:
            raise
    except ZeroDivisionError:
        if ignore_zero_division:
            return float('inf')
        else:
            raise

result = safe_division(1, 10**500, True, False)
print('Overflow Test: ', result)

result = safe_division(1, 0, False, True)
print('Zero Division Test : ', result)

Overflow Test:  0.0
Zero Division Test :  inf


**위의 예제는 제어 인수의 위치를 혼동하기 쉽기 때문에 찾기 어려운 버그가 발생할 수 있다.  
이런 코드의 가독성을 높이는 방법은 아래와 같이 키워드 인수를 사용하는 것이다.**

In [105]:
def safe_division_b(number, divisor, ignore_overflow=False, ignore_zero_division=False):
    try:
        return number / divisor
    except OverflowError:
        if ignore_overflow:
            return 0
        else:
            raise
    except ZeroDivisionError:
        if ignore_zero_division:
            return float('inf')
        else:
            raise

result = safe_division_b(1, 10**500, ignore_overflow=True)
print('Overflow Test: ', result)

result = safe_division_b(1, 0, ignore_zero_division=True)
print('Zero Division Test : ', result)

Overflow Test:  0.0
Zero Division Test :  inf


In [106]:
assert safe_division_b(1.0, 10**500, True, False) is 0

**파이썬 3에서는 키워드 전용 인수(keyworkd-only argument)로 함수를 정의해서 의도를 명확히 드러내도록 요구할 수 있다. 키워드 전용 인수는 키워드로만 넘길 뿐, 위치로는 절대 넘길 수 없다.  
아래 예는 키워드 전용 인수를 사용한 예이다.**

In [107]:
def safe_division_c(number, divisor, *,
                    ignore_overflow=False,
                    ignore_zero_division=False):
    try:
        return number / divisor
    except OverflowError:
        if ignore_overflow:
            return 0
        else:
            raise
    except ZeroDivisionError:
        if ignore_zero_division:
            return float('inf')
        else:
            raise

try:
    safe_division_c(1, 10**500, True, False)
except:
    logging.exception('Expected')
else:
    assert False

ERROR:root:Expected
Traceback (most recent call last):
  File "<ipython-input-107-6000ec9635f2>", line 18, in <module>
    safe_division_c(1, 10**500, True, False)
TypeError: safe_division_c() takes 2 positional arguments but 4 were given


In [108]:
safe_division_c(1.0, 0, ignore_zero_division=True) # No exception

try:
    safe_division_c(1.0, 0)
    assert False
except ZeroDivisionError:
    print('ZeroDivisionError')
    # pass # Expected

ZeroDivisionError


**내 생각에는 아래 케이스가 더 깔끔**

In [109]:
param = {'number': 1.0,
         'divisor': 0,
         'ignore_zero_division': True}

safe_division_c(**param)

inf