# 2장. 파이썬 (Python)

## 1. 공백 문자 (Whitespace)

### 문자 들여쓰기 (Indentation)
제어문 또는 함수의 body 부분을 구분할 때 Indentation Block으로 구분

In [1]:
# The pound sign marks the start of a comment. Python itself
# ignores the comments, but they're helpful for anyone reading the code.
for i in [1, 2, 3, 4, 5]:
    print(i)                    # first line in "for i" block
    for j in [1, 2, 3, 4, 5]:
        print(j)                # first line in "for j" block
        print(i + j)            # last line in "for j" block
    print(i)                    # last line in "for i" block
print("done looping")

1
1
2
2
3
3
4
4
5
5
6
1
2
1
3
2
4
3
5
4
6
5
7
2
3
1
4
2
5
3
6
4
7
5
8
3
4
1
5
2
6
3
7
4
8
5
9
4
5
1
6
2
7
3
8
4
9
5
10
5
done looping


### 문자 공백 문자 (Whitespace)

#### 코드 한 줄은 79자 이내로 작성하기를 권장

In [2]:
long_winded_computation = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12 +
                           13 + 14 + 15 + 16 + 17 + 18 + 19 + 20)

#### 중첩된 리스트 구조에서 줄 바꾸기의 활용해서 가독성 높이기

In [3]:
list_of_lists = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

easier_to_read_list_of_lists = [[1, 2, 3],
                                [4, 5, 6],
                                [7, 8, 9]]

###  문자 여러 줄 표현
#### 괄호 안이 아닌 경우 여러 줄로 표현하려면 backlash 사용

In [4]:
two_plus_three = 2 + \
                 3

## 2. 모듈

### 가져오기 (Import)

In [5]:
import re
my_regex = re.compile("[0-9]+", re.I)

#### 패키지 별명 (alias)

In [6]:
import re as regex
my_regex = regex.compile("[0-9]+", regex.I)

### 필요한 것만 가져오기
#### 클래스나 함수, 변수 임포트

In [7]:
from collections import defaultdict, Counter

lookup = defaultdict(int)
my_counter = Counter()

#### 패키지의 전체 내용을 임포트 하는 것은 권장하지 않음

In [8]:
match = 10
from re import *    # uh oh, re has a match function
print(match)        # "<function match at 0x10281e6a8>"

<function match at 0x00000141563175E0>


## 3.함수

### 1급 클래스 객체 (first-class object)
#### 함수 정의

In [9]:
def double(x):
    """
    This is where you put an optional docstring that explains what the
    function does. For example, this function multiplies its input by 2.
    """
    return x * 2

#### 함수는 1급 클래스 객체(first-class object)

In [10]:
def apply_to_one(f):
    """Calls the function f with 1 as its argument"""
    return f(1)

my_double = double             # refers to the previously defined function
x = apply_to_one(my_double)    # equals 2
assert x == 2

### 람다 함수 (lambda Function)
#### 람다 함수 (lambda function)

In [11]:
y = apply_to_one(lambda x: x + 4)      # equals 5

assert y == 5

#### 변수에 람다 함수 할당 (권장하지 않음)

In [12]:
another_double = lambda x: 2 * x       # Don't do this

#### 이름이 있는 한 줄 함수 정의는 람다 함수보다 def 함수 정의를 권장

In [13]:
def another_double(x): return 2 * x

### 인자의 기본 값 (default value) 

#### 함수 인자의 기본 값(default) 설정

In [14]:
def my_print(message = "my default message"):
    print(message)

my_print("hello")   # prints 'hello'
my_print()          # prints 'my default message'

hello
my default message


#### 위치와 상관 없이 인자를 지정하고 싶으면 키워드 방식으로 지정

In [15]:
def full_name(first = "What's-his-name", last = "Something"):
    return first + " " + last

In [16]:
full_name("Joel", "Grus")     # "Joel Grus"
full_name("Joel")             # "Joel Something"
full_name(last="Grus")        # "What's-his-name Grus"

assert full_name("Joel", "Grus")     == "Joel Grus"
assert full_name("Joel")             == "Joel Something"
assert full_name(last="Grus")        == "What's-his-name Grus"

## 4. 문자열

### 문자열 정의 (String)

In [17]:
single_quoted_string = 'data science'
double_quoted_string = "data science"

#### 여러 줄 문자열

In [18]:
multi_line_string = """This is the first line.
and this is the second line
and this is the third line"""

### 이스케이프 문자 (escape character)

In [19]:
tab_string = "\t"       # represents the tab character
len(tab_string)         # is 1

assert len(tab_string) == 1

#### Backslash를 raw string으로 표현하고 싶을 때

In [20]:
not_tab_string = r"\t"  # represents the characters '\' and 't'
len(not_tab_string)     # is 2

assert len(not_tab_string) == 2

#### 유니코드를 표현할 때

In [21]:
unicode_string = "\u20AC"   # represents €
print(unicode_string)

€


### f-string으로 포맷팅

#### 문자열 더하기 

In [22]:
first_name = "Joel"
last_name = "Grus"
full_name1 = first_name + " " + last_name             # string addition

print(full_name1)

Joel Grus


#### 문자열 포맷 함수 사용

In [23]:
full_name2 = "{0} {1}".format(first_name, last_name)  # string.format

print(full_name2)

Joel Grus


#### f-string 사용

In [24]:
full_name3 = f"{first_name} {last_name}"

print(full_name3)

Joel Grus


## 5. 예외 처리 (Exception Handling)

#### 예외 잡기 (catch)

In [25]:
try:
    print(0 / 0)
except ZeroDivisionError:
    print("cannot divide by zero")

cannot divide by zero


#### 예외 생성 (raise)

In [26]:
def sqrt(x):
    if not isinstance(x, (int, float)):
        raise TypeError('x must be numeric')
    elif x < 0:
        raise ValueError('x cannot be negative')
    # do the real work here...

## 6. 리스트

### 리스트 정의 (List)

In [27]:
integer_list = [1, 2, 3]
heterogeneous_list = ["string", 0.1, True]
list_of_lists = [integer_list, heterogeneous_list, []]

list_length = len(integer_list)     # equals 3
list_sum    = sum(integer_list)     # equals 6

assert list_length == 3
assert list_sum == 6

###  인덱싱 (List Indexing)

In [28]:
x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

zero = x[0]          # equals 0, lists are 0-indexed
one = x[1]           # equals 1
nine = x[-1]         # equals 9, 'Pythonic' for last element
eight = x[-2]        # equals 8, 'Pythonic' for next-to-last element
x[0] = -1            # now x is [-1, 1, 2, 3, ..., 9]

assert x == [-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

###  슬라이싱 (Slicing)

In [29]:
first_three = x[:3]                 # [-1, 1, 2]
three_to_end = x[3:]                # [3, 4, ..., 9]
one_to_four = x[1:5]                # [1, 2, 3, 4]
last_three = x[-3:]                 # [7, 8, 9]
without_first_and_last = x[1:-1]    # [1, 2, ..., 8]
copy_of_x = x[:]                    # [-1, 1, 2, ..., 9]

every_third = x[::3]                 # [-1, 3, 6, 9]
five_to_three = x[5:2:-1]            # [5, 4, 3]


assert every_third == [-1, 3, 6, 9]
assert five_to_three == [5, 4, 3]

###  집합 연산

In [30]:
1 in [1, 2, 3]    # True
0 in [1, 2, 3]    # False

False

###  더하기 연산

In [31]:
x = [1, 2, 3]
y = x + [4, 5, 6]       # y is [1, 2, 3, 4, 5, 6]; x is unchanged

assert x == [1, 2, 3]
assert y == [1, 2, 3, 4, 5, 6]

###  확장 (extend)

In [32]:
x = [1, 2, 3]
x.extend([4, 5, 6])     # x is now [1, 2, 3, 4, 5, 6]

assert x == [1, 2, 3, 4, 5, 6]

###  추가 (append)

In [33]:
x = [1, 2, 3]
x.append(0)      # x is now [1, 2, 3, 0]
y = x[-1]        # equals 0
z = len(x)       # equals 4

assert x == [1, 2, 3, 0]
assert y == 0
assert z == 4

###  언패킹 (Unpacking)

#### 요소를 변수로 언패킹

In [147]:
x, y = [1, 2]    # now x is 1, y is 2

assert x == 1
assert y == 2

1 2


#### 사용하지 않을 요소는 underscore로 처리

In [35]:
_, y = [1, 2]    # now y == 2, didn't care about the first element

## 7. 튜플

### 튜플 정의 (Tuple)

In [36]:
my_tuple = (1, 2)
other_tuple = 3, 4

#### 튜플은 수정 불가 (Immutable) 객체

In [37]:
try:
    my_tuple[1] = 3
except TypeError:
    print("cannot modify a tuple")

cannot modify a tuple


### 다중 반환 (Return Multiple Values)

In [38]:
def sum_and_product(x, y):
    return (x + y), (x * y)

sp = sum_and_product(2, 3)     # sp is (5, 6)
print(sp)
s, p = sum_and_product(5, 10)  # s is 15, p is 50
print(s, p)

(5, 6)
15 50


### 다중 할당 (Multiple Assignment)

#### 여러 변수에 값을 한번에 할당할 때

In [39]:
x, y = 1, 2     # now x is 1, y is 2
print(x)
print(y)

1
2


#### 교환 연산 (swap)

In [40]:
x, y = y, x     # Pythonic way to swap variables; now x is 2, y is 1

assert x == 2
assert y == 1

## 8.딕셔너리

### 딕셔너리 정의 (Dictionary)

#### 리터럴(liternal) 형식으로 선언

In [41]:
empty_dict = {}                     # Pythonic
grades = {"Joel": 80, "Tim": 95}    # dictionary literal

#### 클래스 객체로 선언

In [42]:
empty_dict2 = dict()                # less Pythonic

### 인덱스 접근 방식의 문법 제공

In [43]:
joels_grade = grades["Joel"]        # equals 80
assert joels_grade == 80

try:
    kates_grade = grades["Kate"]
except KeyError:
    print("no grade for Kate!")

no grade for Kate!


In [44]:
joel_has_grade = "Joel" in grades     # True
kate_has_grade = "Kate" in grades     # False

assert joel_has_grade
assert not kate_has_grade

### Get 연산

In [45]:
joels_grade = grades.get("Joel", 0)   # equals 80
kates_grade = grades.get("Kate", 0)   # equals 0
no_ones_grade = grades.get("No One")  # default default is None

assert joels_grade == 80
assert kates_grade == 0
assert no_ones_grade is None

grades["Tim"] = 99                    # replaces the old value
grades["Kate"] = 100                  # adds a third entry
num_students = len(grades)            # equals 3

assert num_students == 3

### 키, 값 리스트 반환

In [46]:
tweet = {
    "user" : "joelgrus",
    "text" : "Data Science is Awesome",
    "retweet_count" : 100,
    "hashtags" : ["#data", "#science", "#datascience", "#awesome", "#yolo"]
}

tweet_keys   = tweet.keys()     # iterable for the keys
tweet_values = tweet.values()   # iterable for the values
tweet_items  = tweet.items()    # iterable for the (key, value) tuples

In [47]:
"user" in tweet_keys            # True, but not Pythonic
"user" in tweet                 # Pythonic way of checking for keys
"joelgrus" in tweet_values      # True (slow but the only way to check)

assert "user" in tweet_keys
assert "user" in tweet
assert "joelgrus" in tweet_values

### 단어 빈도수 세기

#### 유형 1 : in 연산자 사용

In [48]:
document = ["data", "science", "from", "scratch"]

word_counts = {}
for word in document:
    if word in word_counts:
        word_counts[word] += 1
    else:
        word_counts[word] = 1

#### 유형 2 : 예외처리 방식

In [49]:
word_counts = {}
for word in document:
    try:
        word_counts[word] += 1
    except KeyError:
        word_counts[word] = 1

#### 유형 3 : get 함수 사용

In [50]:
word_counts = {}
for word in document:
    previous_count = word_counts.get(word, 0)
    word_counts[word] = previous_count + 1

### defaultdic
defaultdict를 사용하면 새로운 키에 대해 초기화를 할 필요 없다.

In [51]:
from collections import defaultdict

word_counts = defaultdict(int)          # int() produces 0
for word in document:
    word_counts[word] += 1

#### 빈 리스트로 초기화

In [52]:
dd_list = defaultdict(list)             # list() produces an empty list
dd_list[2].append(1)                    # now dd_list contains {2: [1]}

#### 빈 딕셔너리로 초기화

In [53]:
dd_dict = defaultdict(dict)             # dict() produces an empty dict
dd_dict["Joel"]["City"] = "Seattle"     # {"Joel" : {"City": Seattle"}}

#### 람다 함수로 초기화

In [54]:
dd_pair = defaultdict(lambda: [0, 0])
dd_pair[2][1] = 1                       # now dd_pair contains {2: [0, 1]}

## 9. 카운터 (Counter)

#### 시컨스 데이터를 이용해서 집계

In [55]:
from collections import Counter
c = Counter([0, 1, 2, 0])          # c is (basically) {0: 2, 1: 1, 2: 1}

# recall, document is a list of words
word_counts = Counter(document)

#### 빈도수대로 정렬해서 가져오기

In [56]:
# print the 10 most common words and their counts
for word, count in word_counts.most_common(10):
    print(word, count)

data 1
science 1
from 1
scratch 1


## 10. 집합 (Set)

###  집합 정의 (Set)

In [57]:
primes_below_10 = {2, 3, 5, 7}

s = set()
s.add(1)       # s is now {1}
s.add(2)       # s is now {1, 2}
s.add(2)       # s is still {1, 2}
x = len(s)     # equals 2
y = 2 in s     # equals True
z = 3 in s     # equals False

###  집합에 포함되었는지 확인하는 연산

In [58]:
y = 2 in s     # equals True
z = 3 in s     # equals False

###  리스트와 집합에서 in 연산 비교

In [59]:
hundreds_of_other_words = []  # required for the below code to run

stopwords_list = ["a", "an", "at"] + hundreds_of_other_words + ["yet", "you"]

"zip" in stopwords_list     # False, but have to check every element

stopwords_set = set(stopwords_list)
"zip" in stopwords_set      # very fast to check

False

###  중복 제거 연산

In [60]:
item_list = [1, 2, 3, 1, 2, 3]
num_items = len(item_list)                # 6
item_set = set(item_list)                 # {1, 2, 3}
num_distinct_items = len(item_set)        # 3
distinct_item_list = list(item_set)       # [1, 2, 3]

In [61]:
assert num_items == 6
assert item_set == {1, 2, 3}
assert num_distinct_items == 3
assert distinct_item_list == [1, 2, 3]

## 11. 제어문 (Control)

### 조건문 (conditional)

#### If문 구조

In [62]:
if 1 > 2:
    message = "if only 1 were greater than two..."
elif 1 > 3:
    message = "elif stands for 'else if'"
else:
    message = "when all else fails use else (if you want to)"

#### if 연산자 (한 줄 표현)

In [63]:
parity = "even" if x % 2 == 0 else "odd"

### 반복문 (loop)

#### while 문 구조

In [64]:
x = 0
while x < 10:
    print(f"{x} is less than 10")
    x += 1

0 is less than 10
1 is less than 10
2 is less than 10
3 is less than 10
4 is less than 10
5 is less than 10
6 is less than 10
7 is less than 10
8 is less than 10
9 is less than 10


#### for 문 구조

In [65]:
# range(10) is the numbers 0, 1, ..., 9
for x in range(10):
    print(f"{x} is less than 10")

0 is less than 10
1 is less than 10
2 is less than 10
3 is less than 10
4 is less than 10
5 is less than 10
6 is less than 10
7 is less than 10
8 is less than 10
9 is less than 10


###  Loop 제어 방식

In [66]:
for x in range(10):
    if x == 3:
        continue  # go immediately to the next iteration
    if x == 5:
        break     # quit the loop entirely
    print(x)

0
1
2
4


## 12. 부울 타입 (Boolean) 

### True, False

In [67]:
one_is_less_than_two = 1 < 2          # equals True
true_equals_false = True == False     # equals False

assert one_is_less_than_two
assert not true_equals_false

#### None : 값이 없는 상태를 표현

In [68]:
x = None
assert x == None, "this is the not the Pythonic way to check for None"
assert x is None, "this is the Pythonic way to check for None"

###  단축 평가 (short-circuit evaluation)

#### 문자열이 빈 문자열이면 그대로 전달하고 빈 문자열이 아니면  첫번째 글자를 반환해보자.

In [69]:
def some_function_that_returns_a_string():
    return ""

##### 유형 1 : if 문 사용

In [70]:
s = some_function_that_returns_a_string()
if s:
    first_char = s[0]
else:
    first_char = ""

##### 유형 2 : 단축 평가 방식 적용

In [71]:
first_char = s and s[0]

#### 변수 값이 None이면 0으로 반환하고 None이 아니면 그대로 반환하게 해보자.

In [72]:
safe_x = x or 0

##### 보다 가독성 있는 표현

In [73]:
safe_x = x if x is not None else 0

###  All, Any

#### all : 모든 항목이 True이어야 True

In [74]:
all([True, 1, {3}])   # True, all are truthy
all([True, 1, {}])    # False, {} is falsy

False

#### any : 모든 항목 중에 하나라도 True이면 True

In [75]:
any([True, 1, {}])    # True, True is truthy

True

#### 빈 리스트에 대한 all과 any의 결과

In [76]:
all([])               # True, no falsy elements in the list
any([])               # False, no truthy elements in the list

False

## 13. 정렬 

###  Sorted vs. Sort

#### 리스트 정렬

In [77]:
x = [4, 1, 2, 3]
y = sorted(x)     # y is [1, 2, 3, 4], x is unchanged
x.sort()          # now x is [1, 2, 3, 4]

###  정렬 기준 지정

#### Key와 reverse인자로 정렬 기준 지정

In [78]:
# sort the list by absolute value from largest to smallest
x = sorted([-4, 1, -2, 3], key=abs, reverse=True)  # is [-4, 3, -2, 1]

#### 예시 : 단어 빈도수 기준으로 정렬할 때

In [79]:
# sort the words and counts from highest count to lowest
wc = sorted(word_counts.items(),
            key=lambda word_and_count: word_and_count[1],
            reverse=True)

## 14. 리스트 컴프리헨션

###  리스트 컴프리헨션 (List Comprehension)

#### 리스트 변형 예시

In [80]:
even_numbers = [x for x in range(5) if x % 2 == 0]  # [0, 2, 4]
squares      = [x * x for x in range(5)]            # [0, 1, 4, 9, 16]
even_squares = [x * x for x in even_numbers]        # [0, 4, 16]

In [81]:
assert even_numbers == [0, 2, 4]
assert squares == [0, 1, 4, 9, 16]
assert even_squares == [0, 4, 16]

#### 딕셔너리와 집합 생성

In [82]:
square_dict = {x: x * x for x in range(5)}  # {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}
square_set  = {x * x for x in [1, -1]}      # {1}

#### 불필요한 변수는 _로 처리

In [83]:
zeros = [0 for _ in even_numbers]      # has the same length as even_numbers

assert zeros == [0, 0, 0]

###  다중 루프

#### 다중 for loop 표현

In [84]:
pairs = [(x, y)
         for x in range(10)
         for y in range(10)]   # 100 pairs (0,0) (0,1) ... (9,8), (9,9)

In [85]:
assert len(pairs) == 100

#### 상위 for loop 변수 사용 예시

In [86]:
increasing_pairs = [(x, y)                       # only pairs with x < y,
                    for x in range(10)           # range(lo, hi) equals
                    for y in range(x + 1, 10)]   # [lo, lo + 1, ..., hi - 1]

## 15. 자동 테스트 (assert)

#### 검증

In [87]:
assert 1 + 1 == 2
assert 1 + 1 == 2, "1 + 1 should equal 2 but didn't"

#### 함수 실행 결과 검증

In [88]:
def smallest_item(xs):
    return min(xs)

assert smallest_item([10, 20, 5, 40]) == 5
assert smallest_item([1, 0, -1, 2]) == -1

#### 함수의 인자 검증

In [89]:
def smallest_item(xs):
    assert xs, "empty list has no smallest item"
    return min(xs)

## 15. 객체 지향 프로그래밍 

###  클래스 선언

In [90]:
class CountingClicker:
    """A class can/should have a docstring, just like a function"""

    def __init__(self, count = 0):
        self.count = count

    def __repr__(self):
        return f"CountingClicker(count={self.count})"

    def click(self, num_times = 1):
        """Click the clicker some number of times."""
        self.count += num_times

    def read(self):
        return self.count

    def reset(self):
        self.count = 0

###  객체 생성

In [91]:
clicker = CountingClicker()
assert clicker.read() == 0, "clicker should start with count 0"
clicker.click()
clicker.click()
assert clicker.read() == 2, "after two clicks, clicker should have count 2"
clicker.reset()
assert clicker.read() == 0, "after reset, clicker should be back to 0"

###  서브 클래스 (subclass)

#### 서브 클래싱 및 메소드 오버라이드

In [92]:
# A subclass inherits all the behavior of its parent class.
class NoResetClicker(CountingClicker):
    # This class has all the same methods as CountingClicker

    # Except that it has a reset method that does nothing.
    def reset(self):
        pass

In [93]:
clicker2 = NoResetClicker()
assert clicker2.read() == 0
clicker2.click()
assert clicker2.read() == 1
clicker2.reset()
assert clicker2.read() == 1, "reset shouldn't do anything"

## 15. 제너레이터 (Generator)

###  제너레이터 정의 

#### for 문에서 제너레이터 사용

In [94]:
def generate_range(n):
    i = 0
    while i < n:
        yield i   # every call to yield produces a value of the generator
        i += 1
        
for i in generate_range(10):
    print(f"i: {i}")

i: 0
i: 1
i: 2
i: 3
i: 4
i: 5
i: 6
i: 7
i: 8
i: 9


#### 제너레이터 컴프리헨션

In [95]:
evens_below_20 = (i for i in generate_range(20) if i % 2 == 0)

#### 무한한 자연수 생성

In [96]:
def natural_numbers():
    """returns 1, 2, 3, ..."""
    n = 1
    while True:
        yield n
        n += 1

###  파이프라인 구성

In [97]:
# None of these computations *does* anything until we iterate
data = natural_numbers()
evens = (x for x in data if x % 2 == 0)
even_squares = (x ** 2 for x in evens)
even_squares_ending_in_six = (x for x in even_squares if x % 10 == 6)
# and so on

In [98]:
assert next(even_squares_ending_in_six) == 16
assert next(even_squares_ending_in_six) == 36
assert next(even_squares_ending_in_six) == 196

## 16. 이터러블 

### 인덱스 사용

#### for문에서 리스트의 인덱스를 사용하고 싶을 때

In [99]:
names = ["Alice", "Bob", "Charlie", "Debbie"]

#### 유형1 : range 사용

In [100]:
# not Pythonic
for i in range(len(names)):
    print(f"name {i} is {names[i]}")

name 0 is Alice
name 1 is Bob
name 2 is Charlie
name 3 is Debbie


#### 유형2 : 인덱스 변수 사용

In [101]:
# also not Pythonic
i = 0
for name in names:
    print(f"name {i} is {names[i]}")
    i += 1

name 0 is Alice
name 1 is Bob
name 2 is Charlie
name 3 is Debbie


#### 유형3. enumerate 사용 (권장)

In [102]:
# Pythonic
for i, name in enumerate(names):
    print(f"name {i} is {name}")

name 0 is Alice
name 1 is Bob
name 2 is Charlie
name 3 is Debbie


## 17. 난수 

### 의사 난수 (Pseudo random)

#### Radom 모듈을 사용한 난수 생성

In [103]:
import random
random.seed(10)  # this ensures we get the same results every time

four_uniform_randoms = [random.random() for _ in range(4)]

#### 의사 난수 (Pseudo random)

In [104]:
random.seed(10)         # set the seed to 10
print(random.random())  # 0.57140259469
random.seed(10)         # reset the seed to 10
print(random.random())  # 0.57140259469 again

0.5714025946899135
0.5714025946899135


### Randrange, Shuffle

#### 정수 범위에서 난수 생성

In [105]:
random.randrange(10)    # choose randomly from range(10) = [0, 1, ..., 9]
random.randrange(3, 6)  # choose randomly from range(3, 6) = [3, 4, 5]

4

#### 리스트를 임의로 섞기

In [106]:
up_to_ten = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
random.shuffle(up_to_ten)
print(up_to_ten)

[5, 6, 9, 2, 3, 7, 8, 4, 1, 10]


### 랜덤 샘플링 (random sampling)

#### 리스트에서 랜덤하게 선택하기

In [107]:
my_best_friend = random.choice(["Alice", "Bob", "Charlie"])     # "Bob" for me

#### 리스트에서 중복없이 랜덤 샘플링하기 (비복원 추출)

In [108]:
lottery_numbers = range(60)
winning_numbers = random.sample(lottery_numbers, 6)  # [16, 36, 10, 6, 25, 9]

#### 리스트에서 중복을 허용하며 랜덤 샘플링하기 (복원 추출)

In [109]:
four_with_replacement = [random.choice(range(10)) for _ in range(4)]
print(four_with_replacement)  # [9, 4, 4, 2]

[2, 9, 5, 6]


## 18. 정규 표현식 (regular expression)

### 표현식 re 패키지 사용법

In [110]:
import re

re_examples = [                        # all of these are true, because
    not re.match("a", "cat"),              #  'cat' doesn't start with 'a'
    re.search("a", "cat"),                 #  'cat' has an 'a' in it
    not re.search("c", "dog"),             #  'dog' doesn't have a 'c' in it
    3 == len(re.split("[ab]", "carbs")),   #  split on a or b to ['c','r','s']
    "R-D-" == re.sub("[0-9]", "-", "R2D2") #  replace digits with dashes
    ]

assert all(re_examples), "all the regex examples should be True"

## 19. 묶어주기 (Zip)와 언패킹

### 묶어주기 (Zip)

In [111]:
list1 = ['a', 'b', 'c']
list2 = [1, 2, 3]

# zip is lazy, so you have to do something like the following
[pair for pair in zip(list1, list2)]    # is [('a', 1), ('b', 2), ('c', 3)]

[('a', 1), ('b', 2), ('c', 3)]

### 언패킹 + 묶어주기 (Unpacking + Zip)

In [112]:
pairs = [('a', 1), ('b', 2), ('c', 3)]
letters, numbers = zip(*pairs)

In [113]:
letters, numbers = zip(('a', 1), ('b', 2), ('c', 3))

### 인자 언패킹 (Unpacking)

#### 함수 인자 전달 방식

In [114]:
def add(a, b): return a + b

In [115]:
add(1, 2)      # returns 3

3

#### 리스트로 인자를 주면 오류 발생

In [116]:
try:
    add([1, 2])
except TypeError:
    print("add expects two inputs")

add expects two inputs


#### 이럴 땐, 리스트를 언패킹 해서 전달

In [117]:
add(*[1, 2])   # returns 3

3

## 20. args와 kwargs

### doubler는 함수 f를 함수 g로 재정의해서 반환하는 함수

In [118]:
def doubler(f):
    # Here we define a new function that keeps a reference to f
    def g(x):
        return 2 * f(x)

    # And return that new function.
    return g


#### 인자가 1개인 함수 f1에 대해 doubler에 실행할 경우

In [119]:
def f1(x):
    return x + 1

In [120]:
g = doubler(f1)
assert g(3) == 8,  "(3 + 1) * 2 should equal 8"
assert g(-1) == 0, "(-1 + 1) * 2 should equal 0"

#### 함수의 인자가 2개 이상이라면?

In [121]:
def f2(x, y):
    return x + y

#### TypeError가 남

In [122]:
g = doubler(f2)
try:
    g(1, 2)
except TypeError:
    print("as defined, g only takes one argument")

as defined, g only takes one argument


#### args와 kwargs를 사용해서 가변 인자로 처리

In [123]:
def doubler_correct(f):
    """works no matter what kind of inputs f expects"""
    def g(*args, **kwargs):
        """whatever arguments g is supplied, pass them through to f"""
        return 2 * f(*args, **kwargs)
    return g

In [124]:
g = doubler_correct(f2)
assert g(1, 2) == 6, "doubler should work now"

#### 함수에서 args와 kwargs로 인자를 받으면 임의의 개수로 인자를 받을 수 있다.

In [125]:
def magic(*args, **kwargs):
    print("unnamed args:", args)
    print("keyword args:", kwargs)

magic(1, 2, key="word", key2="word2")

unnamed args: (1, 2)
keyword args: {'key': 'word', 'key2': 'word2'}


#### 함수 인자로 리스트와 딕셔너리 언패킹해서 전달하는 방식

In [126]:
def other_way_magic(x, y, z):
    return x + y + z

x_y_list = [1, 2]
z_dict = {"z": 3}
assert other_way_magic(*x_y_list, **z_dict) == 6, "1 + 2 + 3 should be 6"

## 21. 타입 어노테이션 (Type Annotation) 

### 타입이 명시되지 않는 함수 정의 방식

#### 오류가 나지 않는 경우

In [127]:
def add(a, b):
    return a + b

assert add(10, 5) == 15,                  "+ is valid for numbers"
assert add([1, 2], [3]) == [1, 2, 3],     "+ is valid for lists"
assert add("hi ", "there") == "hi there", "+ is valid for strings"

#### 오류가 나는 경우

In [128]:
try:
    add(10, "five")
except TypeError:
    print("cannot add an int to a string")

cannot add an int to a string


### 타입 어노테이션 타입 명시 방법

In [129]:
def add(a: int, b: int) -> int:
    return a + b

add(10, 5)           # you'd like this to be OK
add("hi ", "there")  # you'd like this to be not OK

'hi there'

### 타입 어노테이션 필요성

#### 1. 함수의 의미를 명확히 할 수 있다.

In [130]:
# This is not in the book, but it's needed
# to make the `dot_product` stubs not error out.
from typing import List
Vector = List[float]

def dot_product(x, y): ...

# we have not yet defined Vector, but imagine we had
def dot_product(x: Vector, y: Vector) -> float: ...

#### 2. 자동 타입 체크 툴을 활용해서 디버깅을 할 수 있다.

In [131]:
def add(x: int, y: int) -> int:
    return x + y

print(add('sad', ' machine'))

SyntaxError: invalid character in identifier (<ipython-input-131-605d365c802c>, line 1)

#### 3. 이해하기 쉬운 함수를 개발하게 된다.

In [132]:
from typing import Union

def secretly_ugly_function(value, operation): ...

def ugly_function(value: int, operation: Union[str, int, float, bool]) -> int:
    ...

#### 4. 에디터에서 제공하는 자동완성 기능을 활용할 수 있다.

### 타입 어노테이션 방법

#### 1. int, bool, float와 같은 기본 타입은 바로 명시한다.

#### 2. 리스트와 같은 시컨스 타입은 요소의 타입을 명시한다.

In [133]:
def total(xs: list) -> float:
    return sum(xs)

##### typing 모듈의 List로 정의 (요소가 float 타입임을 명시)

In [134]:
from typing import List  # note capital L

def total(xs: List[float]) -> float:
    return sum(xs)

#### 3. 변수를 선언할 때 타입 선언

##### 변수는 초기값으로 타입을 알 수 있다면 타입을 명시할 필요없다.

In [135]:
# This is how to type-annotate variables when you define them.
# But this is unnecessary; it's "obvious" x is an int.
x: int = 5

##### 하지만 이런 경우엔 변수 타입이 불명확하다.

In [136]:
values = []         # what's my type?
best_so_far = None  # what's my type?

##### 타입 명시

In [137]:
from typing import Optional

values: List[int] = []
best_so_far: Optional[float] = None  # allowed to be either a float or None

#### 4. Typing에서 제공하는 다양한 타입을 사용

In [138]:
from typing import Dict, Iterable, Tuple

##### 딕셔너리 (Dict)

In [139]:
# keys are strings, values are ints
counts: Dict[str, int] = {'data': 1, 'science': 2}

##### 이터러블 (Iterable)

In [140]:
lazy = True

# lists and generators are both iterable
if lazy:
    evens: Iterable[int] = (x for x in range(10) if x % 2 == 0)
else:
    evens = [0, 2, 4, 6, 8]

##### 튜플 타입 (Tuple)

In [141]:
# tuples specify a type for each element
triple: Tuple[int, float, int] = (10, 2.3, 5)

#### 5. 일급 함수(fist-class functions)에 대한 타입을 명시

In [142]:
from typing import Callable

# The type hint says that repeater is a function that takes
# two arguments, a string and an int, and returns a string.
def twice(repeater: Callable[[str, int], str], s: str) -> str:
    return repeater(s, 2)

In [143]:
def comma_repeater(s: str, n: int) -> str:
    n_copies = [s for _ in range(n)]
    return ', '.join(n_copies)

In [144]:
assert twice(comma_repeater, "type hints") == "type hints, type hints"

#### 6. 타입을 변수로 선언하면 타입을 재정의하는 효과가 생긴다.

In [145]:
Number = int
Numbers = List[Number]

def total(xs: Numbers) -> Number:
    return sum(xs)