Practice and summarize ***"Effective Python"*** <br>
https://effectivepython.com/

# Chapter 1: Pythonic Thinking

## Item 1: Know Which Version of Python You’re Using

In [16]:
!python --version

Python 3.6.5 :: Anaconda, Inc.


In [17]:
import sys
print(sys.version_info)
print(sys.version)

sys.version_info(major=3, minor=6, micro=5, releaselevel='final', serial=0)
3.6.5 |Anaconda, Inc.| (default, Mar 29 2018, 13:32:41) [MSC v.1900 64 bit (AMD64)]


## Item 2: Follow the PEP 8 Style Guide

reference : https://www.python.org/dev/peps/pep-0008/

### Things I did not know:

**[Naming]**
- Functions, variables, and attributes should be in ***lowercase_underscore*** format

In [23]:
def print_twice(a):
    print(a)
    print(a)

In [24]:
print_twice("lowercase_underscore format")

lowercase_underscore format
lowercase_underscore format


- **Protected instance attributes** should be in ***_leading_underscore*** format. <br>
    - *" one underline in the beginning of a method, function or data member means you shouldn’t access this method because it’s not part of the API."* <br>
    <br>
- **Private instance attributes** should be in ***__double_leading_underscor*** format. <br>
    - *"double underscore will mangle the attribute names of a class to avoid conflicts of attribute names between classe."*
<br>
<br>
- additional references:  
    - "Private Variables in Python": https://www.geeksforgeeks.org/private-variables-python/
    - "Understanding the underscore( _ ) of Python": https://hackernoon.com/understanding-the-underscore-of-python-309d1a029edc

In [60]:
class TestClass(object):
    def __double_leading_underscore(self):
        pass
    def _leading_underscore(self):
        pass
    def lowercase_underscore(self):
        pass
t = TestClass()

In [61]:
property(t)

<property at 0x19e6610e408>

In [66]:
print(t)
#print(dir(t))

print([attr for attr in dir(t) if 'underscore' in attr])

<__main__.TestClass object at 0x0000019E660F7E48>
['_TestClass__double_leading_underscore', '_leading_underscore', 'lowercase_underscore']


위의 결과를 보면, **__double_leading_underscore**를 사용한 경우, ***"_TestClass__double_leading_underscor"***로 맹글링(mangling)되어 다른 클래스에 사용될 동일한 이름의 attribute와의 충돌을 막아줌.

- reference: https://en.wikipedia.org/wiki/Name_mangling#Python

## Item 4: Write Helper Functions Instead of Complex Expressions

간단할 때는 아래처럼 boolean expressions 등과 같은 single-line expressions를 활용하자.

In [33]:
co_info = {'co_name': ['김밥천국 교대점'], 
            'rep_phone_num': ['02000000'],
            'addr': ['서울특별시 서초구 xx동 xxx길 33'], 'road_addr':['']}

In [40]:
a = co_info.get('co_name', [''])[0] or 0  #get : dictionary에서 value 가져오기 (예 - dict.get(key) 하면 value 반환)
b = co_info.get('road_addr', [''])[0] or 0
c = co_info.get('tags', [''])[0] or 0 

print(a,b,c)

김밥천국 교대점 0 0


### *하지만,  이보다 좀 더 복잡해진다면  Helper Functions를 쓰자!*
- 한 줄로 짧게 코드를 짜는 것이 좋은 면도 있지만, 가독성이 떨어지면 오히려 향후 독자에게 악영향!
- 특히 같은 코드를 반복해서 쓴다면, 더더욱 helper functions를 만들어보자. 
<br>
<br>
- 이 책에서는 int(co_info.get('road_addr', [''])[0] or 0)만 추가되어도 읽기 안좋은 코드라고 설명함.
- 아마 co_info.get('road_addr', [''])[0] or 0의 결과값을 int로 감싸주는 형식. ***즉, 왼쪽 --> 오른쪽 순서대로 읽어서는 코드를 한 번에 이해할 수 없기 때문에***  가독성이 떨어진다고 지적하는 것으로 보임. 

가독성 최악

In [29]:
int(co_info.get('road_addr', [''])[0] or 0)

0

가독성 중간

In [30]:
a = co_info.get('road_addr', [''])
a = int(a[0]) if a[0] else 0

최선은 helper functions을 만드는 것!

In [35]:
def get_state(values, key, default=0):
    addr = values.get(key, [''])
    if addr[0]:
        addr = int(addr[0])
    else:
        addr = default
    return addr

In [38]:
get_state(co_info, 'road_addr')

0

In [147]:
co_info['state'] = get_state(co_info, 'road_addr')

In [34]:
co_info

{'co_name': ['김밥천국 교대점'],
 'rep_phone_num': ['02000000'],
 'addr': ['서울특별시 서초구 xx동 xxx길 33'],
 'road_addr': ['']}

## Item 5: Know How to Slice Sequences

파이썬에서 슬라이싱(slicing)은 기본적으로 ':'을 이용
- [시작점:끝나는 점]으로 작성
- 시작은 1이 아니라 0부터
- 시작점은 포함 끝나는 점은 포함되지 않은 값을 반환
- 음수로 넣으면 거꾸로. 예: [-2:-1] 은 뒤에서 두 번째부터 마지막에서 첫번째 앞까지


In [1]:
livealone = ['헨리', '박나래', '전현무', '한혜진', '기안84']

In [50]:
livealone[:-1]==livealone[0:-1]

True

In [4]:
livealone[-2:-1]

['한혜진']

## Item 6: Avoid Using start, end, and stride in a Single Slice

- [시작:끝] 뒤에 **"'n'번째씩 건너뛰고"**라는 간격 조건을 넣을 수 있음. somelist[start:end:stride]

In [5]:
livealone[0:4:2] 

['헨리', '전현무']

In [14]:
num = [n for n in range(20)]
print(num)
print(num[-2:2:-2]) # 뒤에서 두번째부터 시작해서 앞에서 두번째의 전까지 내용에 대해, 뒤에서부터 2개씩 건너가면서 반환

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
[18, 16, 14, 12, 10, 8, 6, 4]


- 하지만 이런식으론 쓰지 않는 게 좋음. "stride" 부분에서 아래처럼 버그가 종종 발생하기 문

In [20]:
x = b'mongoose'
y = x[0:6:-1]
z = x[0:6][::-1]
print(y) # 버그!
print(z)

b''
b'oognom'


정리하면,<br>
- [시작점:끝점]만 사용. 
- [간격]은 [::간격]으로 단독 사용
- 동시에 사용해야 하는 경우, [시작:끝점]으로 하나의 변수에 넣고, 그 변수에 다시 [::간격] 이용<br>
--> 이렇게 2스텝으로 진행하는 방식이 데이터가 중복해서 들어가는 변수의 생성되어 메모리가 부족한 경우, ***Item 46: “Use Built-in Algorithms and Data Structures"*** 참고

## Item 7: Use List Comprehensions Instead of map and filter
## Item 8: Avoid More Than Two Expressions in List Comprehensions

- 기존 리스트 ==> 새로운 리스트 만들어 낼 때 "list comprehensions" 이용
- 즉, 계산식 + 계산식에 들어갈 인풋 루프로 새로운 리스트 생성
- 조건을 덧붙이기도 쉬움
- 예를 들어, 기존 리스트 a 의 숫자 중, 2로 나누어 떨어지는 수에 대해 제곱한 값을 구하고 싶다면 if 문 이용할 수도 있음<br>
==> 하지만 이중 for 문, 이중 if 문, for+if문 조합을 list comprehensions에 사용하는 것은 추천하지 않음!<br>
==> 차라리 helper function이나 list 밖에서 사용하는 편이 가독성 좋음

In [27]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
squares = [x**2 for x in a]
print(squares)
even_squares = [x**2 for x in a if x % 2 == 0]
print(even_squares)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
[4, 16, 36, 64, 100]


- 똑같은 결과를 'map' + 'filter'의 조합으로도 만들어 낼 수 있지만, 복잡해짐

In [None]:
alt = map(lambda x: x**2, filter(lambda x: x % 2 == 0, a))
assert even_squares == list(alt)

- dictionary나 set에도 적용 가능

In [34]:
co_info

{'co_name': ['김밥천국 교대점'],
 'rep_phone_num': ['02000000'],
 'addr': ['서울특별시 서초구 xx동 xxx길 33'],
 'road_addr': ['']}

In [41]:
print({i: i[1] for i in co_info})
print({i*2 for i in co_info.keys()})

{'co_name': 'o', 'rep_phone_num': 'e', 'addr': 'd', 'road_addr': 'o'}
{'rep_phone_numrep_phone_num', 'road_addrroad_addr', 'addraddr', 'co_nameco_name'}



## Item 9: Consider Generator Expressions for Large Comprehensions

- generator expressions : a generalization of list comprehensions & generators
- list comprehension은 리스트가 커질수록 잡아먹는 메모리가 커지기 때문에 매우 비효율적
- generator expressions은 expression을 실행한다고 해서 결과물이 반환되어 나오는 방식이 아님. 일단 실행되면 해당 표현식에 대해 immediately evaluates만 하고, 가만히 있음. "next"를 통해 실행시켜줘야 하나씩 실행됨

In [None]:
# list comprehension
it = [len(x) for x in open(‘/tmp/my_file.txt’)]

In [None]:
# generator comprehension
it = (len(x) for x in open(‘/tmp/my_file.txt’))
print(next(it))

*"The only gotcha is that the iterators returned by generator expressions are **stateful**, so you must be careful not to use them more than once."* <br>
--> 무슨 의미지 ㅠㅠ

## Item 10: Prefer enumerate Over range

- list에 대하여 for loop을 돌리면서 list 안의 item의 index를 알고 싶은 경우, for i in range(len(list_name))을 쓸 수도 있음
- 하지만 이보다는 for i, a in enumerate(list_name)을 써서 index와 item을 각각 불러오는 것이 적절함
- enumerate 안에서 list name 다음에 index를 시작할 숫자를 입력해줄 수도 있음

In [2]:
livealone

['헨리', '박나래', '전현무', '한혜진', '기안84']

In [11]:
for i, member in enumerate(livealone): # index를 0부터 시작
    print('%d: %s' % (i, member))

print('\n')
for i, member in enumerate(livealone, 10): #index를 10부터 시작
    print('%d: %s' % (i, member))

0: 헨리
1: 박나래
2: 전현무
3: 한혜진
4: 기안84


10: 헨리
11: 박나래
12: 전현무
13: 한혜진
14: 기안84


## Item 11: Use zip to Process Iterators in Parallel

- list comprehension을 쓰면 source list를 기반으로 변형된 list를 만들어낼 수 있음
- 이렇게 만들어진 2 개 이상의 리스트를 합쳐서 for loop을 돌리고 싶을 때는 **"zip"**을 사용
- **zip**은 **tuple** 형태로 값을 만들어냄
- 단, zip으로 감싸는 list들의 길이가 같아야 함. 길이에 대해 명확히 알 수 없다면, **itertools**의 **zip_longgest**를 사용!

In [12]:
livealone

['헨리', '박나래', '전현무', '한혜진', '기안84']

In [18]:
letters = [len(member) for member in livealone]
letters

[2, 3, 3, 3, 4]

In [17]:
longest_name = None
max_letters = 0

for i in range(len(livealone)):
    count = letters[i]
    if count > max_letters:
        longest_name = livealone[i]
        max_letters = count
print(longest_name)

기안84


위와 같은 코드가 아래와 같이 깔끔해짐

In [27]:
longest_name = None
max_letters = 0

for m, l in zip(livealone, letters):
    if l > max_letters:
        longgest_name = m
        max_letters = l
        
print(longgest_name)

기안84


In [43]:
livealone2 = ['헨리', '박나래', '전현무', '한혜진', '기안84', '이시언']

In [46]:
for m, l in zip(livealone2, letters): # 새로 추가된 이시언 안나옴
    print(m,l)

print('\n')

from itertools import zip_longest
for m, l in zip_longest(livealone2, letters): # 이시언까지 나옴
    print(m,l)

헨리 2
박나래 3
전현무 3
한혜진 3
기안84 4


헨리 2
박나래 3
전현무 3
한혜진 3
기안84 4
이시언 None


## Item 12: Avoid else Blocks After for and while Loops

- for loop이나 while loop 다음에도 else를 쓸 수 있음. loop이 끝나면 실행
- for loop 이 break로 끝나는 경우는 실행되지 않음
- 쓰지 않는 것이 좋음

## Item 13: Take Advantage of Each Block in try/except/else/finally

- 예외처리하는 4가지 방법: **try**, **except**, **else**, **finally**
- 각각을 제대로 이해하고 쓰자

In [47]:
handle = open('restaurants_nyc.csv', 'rb')

In [48]:
handle

<_io.BufferedReader name='restaurants_nyc.csv'>

In [53]:
try:
    data = handle.read(sep)
finally:
    handle.close()

TypeError: read() takes no keyword arguments

In [54]:
data

b',index,hrefid,numberofreviews,new,pricerange,neighbor1,neighbor2,neighbor3,neighbor4,neighbor5,address,category1,category2,category3,category4,category5,firstreviewdate\r\n0,5418,/biz/%C3%A9picerie-boulud-new-york-7,30,,$$,Midtown West,,,,,"1 W 59th St\r\r\nNew York, NY 10019",Bakeries,Coffee & Tea,Sandwiches,,,2015-03-20\r\n1,2622,/biz/%C3%A9picerie-boulud-new-york-8,41,,$$,Financial District,,,,,"185 Greenwich St\r\r\nNew York, NY 10007",Sandwiches,French,,,,2016-11-02\r\n2,2724,/biz/11-hanover-greek-new-york,40,,$$$,Financial District,,,,,"11 Hanover Sq\r\r\nNew York, NY 10005",Wine Bars,Mediterranean,,,,2016-11-07\r\n3,3334,/biz/118-kitchen-new-york,24,,$,East Harlem,,,,,"1 E 118th St\r\r\nNew York, NY 10035",Tex-Mex,Japanese,,,,2016-01-27\r\n4,2805,/biz/2nd-city-new-york-4,399,,$$,West Village,,,,,"525 Hudson St\r\r\nNew York, NY 10014",Filipino,Asian Fusion,Mexican,,,2016-05-11\r\n5,4493,/biz/4-charles-prime-rib-new-york,69,,$$$,West Village,,,,,"4 Charles St\r\r\nNew York, NY 