<a href="https://colab.research.google.com/github/musicjae/intro_to_python/blob/master/Effective%20Python/1_12.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 3 byte/str

- 아스키 인코딩

In [None]:
a = b'h\x65llo'
print(list(a))
print(a)

[104, 101, 108, 108, 111]
b'hello'


- str 인스턴스: 자연언어의 문자 표현을 담당하는 유니코드 code point 포함.

In [None]:
a = 'a\u0300 propos'
print(list(a))
print(a)

['a', '̀', ' ', 'p', 'r', 'o', 'p', 'o', 's']
à propos


- str 인스턴스에 직접 대응하는 binary 인코딩 결여   
  - 유니코드 --> 이진 데이터 변환 requires  str의 encode 메서드 호출 
- bytes에는 직접 대응하는 텍스트 인코딩 결여 
  - 이진 데이터 --> 유니코드 변환 requires bytes의 decode 메서드 호출  
    
- 보통, UTF-8이 시스템 디폴트 인코딩 방식  
- **유니코드 샌드위치**: 유니코드 데이터 인코딩/디코딩 부분을 인터페이스 가장 먼 경계 지점에 위치

In [None]:
## str->byte

def to_bytes(bytes_to_str):
    if isinstance(bytes_to_str,str):
        value=bytes_to_str.encode('utf-8')

    else:
        value=bytes_to_str
    return value

print(repr(to_bytes(b'foo')))
print(repr(to_bytes('한글')))

b'foo'
b'\xed\x95\x9c\xea\xb8\x80'


# 4 f-string을 통한 인터폴레이션 권유

- 파이썬에서 문자열을 형식화하는 4 방법 중 가장 일반적인 것은 % 를 사용하는 것.

In [None]:
a=10
print('%d' % a) # % 뒤의 것은 형식지정자format specifier

10


**위 방법의 단점**  
 - 튜플 내 데이터 순서 바꾸거나, 값의 타입 변경 시, 타입 변환 불가능 -> 오류 발생  
 - 형식화 이전에 값을 변경해야 하는 경우, 코드 가독성을 떨어지게 만드는 것이 불가피.  
 - 형시고하 문자열에서 동일 값 여러 번 사용 시, 튜플에서 동일 값 여러 번 반복  
   
 - 위 문제를 해소하기 위해, % 연산자에는 튜플 대신 딕셔너리 사용하는 것이 더 좋기는 함. 하지만 이 경우 다른 문제가 발생하거나 기존 문제가 심해질 수 있음

### 내장함수 format

In [None]:
a = 321.123123
ff = format(a, '.2f')
print(ff)

321.12


### str format

In [None]:
key = 'test'
value=1.321

f = '{}={:.1f}'.format(key,value)
print(f)

## key, value replacing ##
f2 = '{1}={0}'.format(key,value)
print(f2)

test=1.3
1.321=test


### Interpolation을 통한 format string  
 - = f-string

In [None]:
key='jy'
v = 1.321321
f = f'{key:<10}={v:.2f}'
print(f)

jy        =1.32


# 5 복잡한 식 대신 "도우미 함수" 사용

In [None]:
from urllib.parse import parse_qs

my_value = parse_qs('red=5&blue=0&white=3&green=',keep_blank_values=True)
print(repr(my_value))

{'red': ['5'], 'blue': ['0'], 'white': ['3'], 'green': ['']}


In [None]:
red_str = my_value.get('red',[''])
print(red_str)

red = int(red_str[0]) if red_str[0] else 0
print(red)

['5']
5


# 6 인덱스 대신 <대입을 사용하여 데이터 언패킹> 하라

In [None]:
item = ('강아지','고양이')
fir, sec = item
print(fir)

강아지


- 언패킹을 사용하면 임시 변수를 정의하지 않고도 값을 맞바꿀 수 있다

In [None]:
def bubble_sort(a):

    for _ in range(len(a)):
        for i in range(1,len(a)):
            if a[i] < a[i-1]: # 나중 것이 이전 것보다 작으면
                tmp = a[i]
                a[i] = a[i-1]
                a[i-1] = tmp

names = ['c','z','a','d']

bubble_sort(names)

print(names)

def unpacking_bubble_sort(a):
    for _ in range(len(a)):
        for i in range(1,len(a)):
            if a[i] < a[i-1]:
                a[i-1],a[i] = a[i],a[i-1]

unpacking_bubble_sort(names)

print(names)

['a', 'c', 'd', 'z']
['a', 'c', 'd', 'z']


In [None]:
company = [('msft',270),('tsla',700),('apple',130)]

for i,(name,price) in enumerate(company,1):
    print(f'{i}: {name}은 {price} 달러이다')

1: msft은 270 달러이다
2: tsla은 700 달러이다
3: apple은 130 달러이다


# 7 enumerate is better than range

- 리스트를 iteration 하면서 이것의 몇 번째 원소를 처리 중인지 알아야 할 때가 있다.

In [None]:
flavor_list = ['vanila','choco','strawberry','greentea']
for i in range(len(flavor_list)):
    flavor = flavor_list[i]
    print(f'{i+1}:{flavor}')

1:vanila
2:choco
3:strawberry
4:greentea


In [None]:
for i, v in enumerate(flavor_list):
    print(f'{i+1}:{v}')

1:vanila
2:choco
3:strawberry
4:greentea


- next를 이용해 다음 원소 가져오기

In [None]:
it = enumerate(flavor_list)
print(next(it))
print(next(it))

(0, 'vanila')
(1, 'choco')


- 어디부터 수를 셀 것인가?

In [None]:
for i, v in enumerate(flavor_list,1):
    print(f'{i}:{v}')

1:vanila
2:choco
3:strawberry
4:greentea


# 8 여러 이터레이터에 대해 나란히 루프 수행: zip

In [None]:
# 여러 이터레이터 나란히 사용:
names=['abc','tommy','john']
counts = [len(n) for n in names]

longest_name=None
max_count = 0

for i in range(len(names)):
    count = counts[i]
    if count > max_count:
        longest_name = names[i]
        max_count = count

print(longest_name)

tommy


- 위 코드를 더 깔끔하고 연산적으로 효율적으로 만들어보자 
- zip: 둘 이상의 이터레이터를 묶어줌 -> 튜플 반환

In [None]:
for name, count in zip(names,counts):
    if count > max_count:
        longest_name = name
        max_count = count

print(longest_name)

tommy


- 주의: zip에 두 개의 다른 길이의 이터레이터 (길이:3, 길이:5)가 들어갔다고 해보자. 이 경우, zip은 길이 3 짜리 이터레이터가 종료되면 길이 5 에 대한 이터레이터도 3 바퀴 째에서 종료시킨다. 
- 위 경우를 처리하기 위해, itertools를 이용하는 것이 바람직하다.

In [None]:
import itertools

names.append('testman')
names.append('answerman')

for name,count in itertools.zip_longest(names,counts):
    print(f'{name}:{count}')

abc:3
tommy:5
john:4
testman:None
answerman:None


# 9 for, while 루프 뒤에 else 사용 x

- for... else 문을 만들지 말고, 차라리 태스크를 처리하기 위한 도우미 함수를 만들라

In [None]:
a=4
b=9
for i in range(2,min(a,b)+1):
    print('checking...',i)
    if a % i == 0 and b % i ==0:
        print('서로소 아님')
        break
else:
    print('서로소')

checking... 2
checking... 3
checking... 4
서로소


In [None]:
def coprime(a,b):
    for i in range(2,min(a,b)+1):
        if a%i ==0 and b%i==0:
            return False
    return True

print(coprime(4,9))

True


# 10 대입식 사용하여 반복 피하기

- 대입식(왈러스 연산자): assignment expression  

- 일반 대입문 vs 왈러스 연산자  
    - 일반 대입문: a = b
    - 왈러스 연산자(대입식): a := b

대입식은 대입문이 쓰일 수 없는 위치에서 변수에 값을 대입하기 때문에 유용하다.


아래 코드는 반복적으로 count가 들어간 상대적으로 지저분한 코드

In [None]:
def make_lemonade(count):
    if count != 0:
        print('레모네이드입니다')
        count -= 1
    else:
        print('재고 소진')

def out_of_stock():
    print('재고 소진')
    
fresh_fruit = {
    '배':10,
    '사과':3,
    '레몬':5
}

count = fresh_fruit.get('레몬',0)

if count:
    make_lemonade(count)
else:
    out_of_stock()

레모네이드입니다


대입 식을 사용하면 아래처럼 비교적 깔끔

In [None]:
if count := fresh_fruit.get('사과',0):
    make_lemonade(count)
else:
    out_of_stock()

SyntaxError: ignored

# 11 리스트 슬라이싱

In [None]:
import numpy as np

a = list(np.arange(20))
print(a[-10:])
print(a[:])

[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


# 12 스트라이드,슬라이스 한 식에 함께 사용 x

- stride: 일정 간격으로 리스트 내 슬라이싱  


In [None]:
odds = a[::2]
evens = a[1::2]
print(odds)
print(evens)

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]


문자열 뒤집기

In [None]:
x = 'testman'
y = x[::-1]
y

'namtset'

In [None]:
x = '사람들'
y = x[::-1]
y

'들람사'

슬라이딩과 스트라이드를 함께 쓰면 헷갈림  
  --> 각자 사용하기를 권장

In [None]:
print(a[2::2])
print(a[5::-2])

[2, 4, 6, 8, 10, 12, 14, 16, 18]
[5, 3, 1]


In [None]:
a = a[::2]
a = a[1:]
a

[2, 4, 6, 8, 10, 12, 14, 16, 18]