# 1장 - 파이썬답게 생각하기

### BETTER WAY 1 - 사용 중인 파이썬의 버전을 알아두라

In [3]:
import sys
print(sys.version_info)
print(sys.version)

sys.version_info(major=3, minor=8, micro=1, releaselevel='final', serial=0)
3.8.1 (tags/v3.8.1:1b293b6, Dec 18 2019, 23:11:46) [MSC v.1916 64 bit (AMD64)]


### BETTER WAY 2 - PEP 8 스타일 가이드를 따르라

PEP: Python Enhancement Proposal
파이썬을 어떤 형식으로 작성할 지 알려주는 스타일 가이드

공백
- 탭 대신 스페이스를 사용해 들여쓰기하라
- 문법적으로 중요한 들여쓰기에는 4칸 스페이스를 사용하라
- 라인 길이는 79개 문자 이하여야 한다
- 긴 식을 다음 줄에 이어서 쓸 경우에는 일반적인 들여쓰기보다 4 스페이스를 더 들여써야 한다.
- 파일 안에서 각 함수와 클래스 사이에는 빈 줄을 두 줄 넣어라
- 클래스 안에서 메서드와 메서드 사이에는 빈 줄을 한 줄 넣어라
- 변수 대입에서 = 전후에는 스페이스를 하나씩만 넣는다

명명 규약
- 함수, 변수, attribute 는 lowercase_underscore 처럼 소문자와 밑줄을 사용한다 -> 이런 표기법을 snake case (뱀표기법) 이라고 부른다
- 보호돼야 하는 인스턴스 attribute 는 일반적인 attribute 이름 규칙을 따르되, _leading_underscore 처럼 밑줄로 시작한다
- 비공개(private) 인스턴스 attribute 는 __leading_underscore 처럼 밑줄 두 개로 시작한다
- 클래스는 CapitalizedWord 처럼 여러 단어를 붙이되, 각 단어의 첫 글자를 대문자로 만든다 -> 이런 표기법을 camel case (낙타표기법)이라고 부른다
- 모듈 수준의 상수는 ALL_CAPS 처럼 모든 글자를 대문자로 하고, 단어와 단어 사이를 밑줄로 연결한 형태를 사용한다

식과 문
- 긍정적인 식을 부정하지 말고(if not a is b) 부정을 내부에 넣어라 (if a is not b)
- 빈 컨테이너나 시퀀스를 검사할 때는 길이를 0 과 비교 하지 말라
- 빈 컨테이너나 시퀀스 값이 암묵적으로 False로 취급된다는 사실을 활용해 'if not 컨테이너' 라는 조건문을 써라
- 마찬가지로 비워 있지 않은 컨테이너나 시퀀스를 검사할 때에도 길이가 0 보다 큰지 비교하지 말라
- 한 줄짜리 if 문이나 한 줄짜리 for, while 루프, 한 줄짜리 except 복합문을 사용하지 말라. 명확성을 위해 각 부분을 여러 줄에 나눠 배치하라
- 식을 한 줄 안에 다 쓸 수 없는 경우, 식을 괄호로 둘러싸고 줄바꿈과 들여쓰기를 추가해서 읽기 쉽게 만들어라
- 여러 줄에 걸쳐 식을 쓸 때는 줄이 계속된다는 표시를 하는 \ 문자보다는 괄호를 사용하라

임포트
- import 문을 항상 파일 맨 앞에 위치시켜라
- import 를 적을 때는 표준 라이브러리 모듈, 서드 파티 모듈, 여러분이 만든 모듈 순서로 섹션을 나눠라. 각 섹션에서는 알파벳 순서로 임포트

### BETTER WAY 3 - bytes 와 str의 차이를 알아두라

bytes 에는 8 비트 값의 시퀀스가 들어 있고, str 에는 유니코드 코드 포인터의 시퀀스가 들어 있다

In [7]:
# byte 타입의 인스턴스에는 부호가 없는 8 바이트 데이터가 그대로 들어간다
a = b'h\x65llo'
print(list(a))
print(a)

[104, 101, 108, 108, 111]
b'hello'


In [8]:
# str 인스턴스에는 사람이 사용하는 언어의 문자를 표현하는 유니코드 코드 포인트가 들어 있다
a = 'a\u0303 propos'
print(list(a))
print(a)

['a', '̃', ' ', 'p', 'r', 'o', 'p', 'o', 's']
ã propos


str 인스턴스에는 직접 대응하는 이진 인코딩이 없고, bytes 에는 직접 대응하는 텐스트 인코딩이 없다

### BETTER WAY 4 - C 스타일 형식 문자열을 str.format 과 쓰기보다는 f-문자열을 통한 인터폴레이션을 사용하라

In [21]:
key = 'my_var'
value = 1.23456789

formatted = f'문자열 {key} = {value}'
print(formatted)

문자열 my_var = 1.23456789


In [22]:
# 출력할 숫자 개수를 지정
places = 3
formatted = f'문자열 {key} = {value: .{places}f}'
print(formatted)

문자열 my_var =  1.235


### BETTER WAY 5 - 복잡한 식을 쓰는 대신 도우미 함수를 작성하라

In [16]:
from urllib.parse import parse_qs

my_values = parse_qs('빨강=5&파랑=0&초록=',
                    keep_blank_values=True)
print(my_values)

{'빨강': ['5'], '파랑': ['0'], '초록': ['']}


In [18]:
print(my_values.get('빨강'))
print(my_values.get('파랑'))
print(my_values.get('투명도'))

['5']
['0']
None


In [20]:
print(my_values.get('빨강', [''])[0] or 0)
print(my_values.get('파랑', [''])[0] or 0)
print(my_values.get('투명도', [''])[0] or 0)

5
0
0


In [23]:
# 이 코드는 너무 읽기 어렵고, 시각적 잡음이 많다.

In [24]:
# 따라서 도우미 함수를 작성해야 한다.
def get_first_int(values, key, default=0):
    found = values.get(key, [''])
    if found[0]:
        return int(found[0])
    return default

In [25]:
print(get_first_int(my_values, '빨강'))
print(get_first_int(my_values, '파랑'))
print(get_first_int(my_values, '투명도'))

5
0
0


### BETTER WAY 6 - 인덱스를 사용하는 대신 대입을 사용해 데이터를 언패킹하라

파이썬에는 값으로 이뤄진 불변(immutable) 순서쌍을 만들어낼 수 있는 tuple 내장 타입이 있다

In [26]:
snack_calories = {
    '감자칩': 140,
    '팝콘': 80,
    '땅콩': 190,
    '피자': '미정의'
}

In [28]:
print(snack_calories)

{'감자칩': 140, '팝콘': 80, '땅콩': 190, '피자': '미정의'}


In [29]:
items = tuple(snack_calories.items())
print(items)

(('감자칩', 140), ('팝콘', 80), ('땅콩', 190), ('피자', '미정의'))


In [31]:
# 튜플에 있는 값은 숫자 인덱스를 사용해 접근할 수 있다.
item = ('호박엿', '식혜')
first = item[0]
second = item[1]
print(first, '&', second)

호박엿 & 식혜


In [32]:
# 일단 튜플이 만들어지면, 인덱스틀 통해 새 값을 대입해서 튜플을 변경할 수는 없다
pair = ('약과', '호박엿')
pair[0] = '타래과'

TypeError: 'tuple' object does not support item assignment

In [33]:
# 파이썬에서는 언패킹 구문이 있다
item = ('호박엿', '식혜')
first, second = item
print(first, '&', second)

호박엿 & 식혜


In [35]:
def bubble_sort(a):
    for _ in range(len(a)):
        for i in range(1, len(a)):
            if a[i] < a[i-1]:
                temp = a[i]
                a[i] = a[i-1]
                a[i-1] = temp
names = ['프레즐', '당근', '쑥갓', '베이컨']
print(names)
bubble_sort(names)
print(names)

['프레즐', '당근', '쑥갓', '베이컨']
['당근', '베이컨', '쑥갓', '프레즐']


In [37]:
def bubble_sort(a):
    for _ in range(len(a)):
        for i in range(1, len(a)):
            if a[i] < a[i-1]:
                a[i], a[i-1] = a[i-1], a[i]     # 언패킹 구문
names = ['프레즐', '당근', '쑥갓', '베이컨']
print(names)
bubble_sort(names)
print(names)

['프레즐', '당근', '쑥갓', '베이컨']
['당근', '베이컨', '쑥갓', '프레즐']


- 파이썬 언패킹은 일반화돼 있으므로 모든 이터러블에 적용할 수 있다
- 인덱스를 사용해 시퀀스 내부에 접근하는 대신, 언패킹을 사용해 시각적인 잡음을 줄이고 코드를 더 명확하게 만들라

### BETTER WAY 7 - range 보다는 enumerate 를 사용하라

range 내장 함수는 어떤 정수 집합을 이터레이션하는 루프가 필요할 때 유용하다.
문자열로 이뤄진 list 처럼 이터레이션할 대상 데이터 구조가 있으면 이 시퀀스에 대해 바로 루프를 돌 수 있다.

In [40]:
# 그런데, 리스트를 이터레이션하면서 리스트의 몇 번째 원소를 처리 중인지 알아야 할 때가 있다.
#

flavor_list = ['바닐라', '초콜릿', '피칸', '딸기']

# range 를 사용하는 방법
for i in range(len(flavor_list)):
    flavor = flavor_list[i]
    print(f'flavor {i+1}: {flavor}')

flavor 1: 바닐라
flavor 2: 초콜릿
flavor 3: 피칸
flavor 4: 딸기


In [41]:
# enumerate 함수를 사용하는 방법
for i, flavor in enumerate(flavor_list):
    print(f'flavor {i+1}: {flavor}')

flavor 1: 바닐라
flavor 2: 초콜릿
flavor 3: 피칸
flavor 4: 딸기


### BETTER WAY 8 - 여러 이터레이터에 대해 나란히 루프를 수행하려면 zip 을 사용하라

In [1]:
# 소스 리스트에서 새로운 리스트 파생
names = ['Cecilia', '남궁민수', '金二三']
counts = [len(n) for n in names]
print(names)
print(counts)

['Cecilia', '남궁민수', '金二三']
[7, 4, 3]


In [9]:
'''
두 리스트를 동시에 이터레이션할 경우 names 소스 리스트의 길이를 사용해 이터레이션할 수 있다
'''
longest_name = None
max_count = 0
for i in range(len(names)):
    count = counts[i]
    if count > max_count:
        longest_name = names[i]
        max_count = count
print(longest_name)

Cecilia


In [8]:
'''
enumerate 를 해도 코드가 여전히 이상적이지 않다
'''
longest_name = None
max_count = 0
for i, name in enumerate(names):
    count = counts[i]
    if count > max_count:
        longest_name = name
        max_count = count
print(longest_name)

Cecilia


In [7]:
'''
이런 코드를 더 깔끔하게 만들 수 있도록 파이썬은 zip 이라는 내장 함수를 제공한다.
zip은 둘 이상의 제너레이터를 지연 계산 제너레이터를 사용해 묶어준다.
zip은 자신이 감싼 이터레이터 원소를 하나씩 소비한다.
따라서 메모리를 다 소모해서 프로그램이 중단되는 위험 없이 아주 긴 입력도 처리할 수 있다. -> 지연 계산 제너레이터 방식이므로
자신이 감싼 이터레이터 중 어느 하나가 끝날때까지 튜플을 내 놓는다.
'''
longest_name = None
max_count = 0
for name, count in zip(names, counts):
    if count > max_count:
        longest_name = name
        max_count = count
print(longest_name)

Cecilia


### BETTER WAY 9 - for 나 while 루프 뒤에 else 불록을 사용하지 말라

In [12]:
'''
파이썬에서는 루프가 반복 수행 내부 블록 다음에 else 블록을 추가할 수 있다.
'''
for i in range(3):
    print('Loop', i)
else:                    # 이 블록 앞의 블록을 시도하다가 예외가 발생하면 이 블록을 실행하라 라는 뜻
    print('else block!') 

Loop 0
Loop 1
Loop 2
else block!


In [13]:
# 만약 중간에 break 를 하면 else 블록은 실행되지 않는다.
for i in range(3):
    print('Loop', i)
    if i == 1:
        break
else:
    print('else block!') 

Loop 0
Loop 1


In [14]:
# 빈 시퀀스인 경우에는 else 블록이 바로 실행된다.
for i in []:
    print('this code')
else:
    print('else block!')

else block!


- 하지만 else 블록을 사용함으로써 얻게 될 표현력보다는 미래에 이 코드르 이해하려는 사람들(자신 포함)이 느끼게 될 부담감이 더 크다.
- 파이썬에서 루프와 같은 간단한 구성 요소는 그 자체로 의미가 명확해야 한다.
- 따라서 절대로 루프 뒤에 else 블록ㅇ르 사용하지 말아야 한다.

### BETTER WAY 10 - 대입식을 사용해 반복을 피하라

In [19]:
'''
대입식은 영어로 assignment expression 이며 왈러즈 연산자(walrus operator)라고도 부른다.
고질적인 코드 중복 문제를 해결하고자 파이썬 3.8에서 새롭게 도입된 구문이다.
'''
fresh_fruit = {
    '사과': 10,
    '바나나': 8,
    '레몬': 5
}

def make_lemonade(count):
    print('make_lemonade:', count)
    pass

def out_of_stock():
    print('out_of_stock')
    pass

count = fresh_fruit.get('레몬', 0)
if count >= 4:
    make_lemonade(count)
else:
    out_of_stock()

make_lemonade: 5


In [22]:
'''
위 코드에서 count 변수는 if 문 안에서만 쓰인다.
그런데 이렇게 if 앞에서 count 를 정의하기 때문에, 향후 count 변수를 접근해야 할 필요가 있는 것처럼 보이지만 그렇지 않다.
이러한 변수들은 대입식을 이용해 왈러스 연산자로 다시 쓰면 다음과 같이 명확하게 할 수 있다
'''
if (count := fresh_fruit.get('레몬', 0)) >= 4:
    make_lemonade(count)
else:
    out_of_stock()

make_lemonade: 5
