# 2장 파이썬 속성 강좌 
## 2.1 기본기 다지기
### 2.1.1 파이썬 설치하기
책의 내용은 python2.7 기준으로 작성됨.
python3를 사용하여도 무방함.

### 2.1.2 The Zen of Python
> 무엇을 하든 그것을 할 수 있는 하나의, 가급적이면 단 하나의 당연한 방법이 존재해야 한다.

여기서 **당연한** 방식으로 쓰여진 코드를 **파이썬스럽다(Pythonic)**고 한다.

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### 2.1.3 들여쓰기
* 코드의 단락을 구분하는 데 중괄호(curly braces, {}) 대신 들여쓰기를 사용한다.
* 공백문자는 소괄호(parentheses, ())와 대괄호(brackets, [])안에서는 무시된다. 
    * 여러줄에 걸쳐 보기 좋게 expression을 작성할 경우 소괄호/ 대괄호로 expression을 묶거나 backslash 후 개행을 활용한다.

In [2]:
prefix = "    "
for i in [1, 2, 3, 4, 5]:
    print(i)
    for j in [1, 2, 3, 4, 5]:
        print(prefix + "[" + str(j) + "] " + str(i + j))
print("done looping")

1
    [1] 2
    [2] 3
    [3] 4
    [4] 5
    [5] 6
2
    [1] 3
    [2] 4
    [3] 5
    [4] 6
    [5] 7
3
    [1] 4
    [2] 5
    [3] 6
    [4] 7
    [5] 8
4
    [1] 5
    [2] 6
    [3] 7
    [4] 8
    [5] 9
5
    [1] 6
    [2] 7
    [3] 8
    [4] 9
    [5] 10
done looping


In [6]:
# 코드의 가독성을 높이기 위해
long_winded_computation = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12 + 
                           13 + 14 + 15 + 16 + 17 + 18 + 19 + 20)

list_of_lists = [[1, 2, 3], 
                 [4, 5, 6], 
                 [7, 8, 9]]

two_plus_three = 2 + \
                 3

# 빈 줄로 인한 오류 - python shell에서만 발생되는 문제. 지금도 그런가? - 잘되네요. -0-;
for i in [1, 2, 3, 4, 5]:
    
    # 빈 줄이 있다는 것을 확인
    print(i)
    

1
2
3
4
5


### 2.1.4 모듈

* 기본 모듈과 3rd party packages 사용을 위해 ```import```를 사용해야한다.
* 이름이 겹치거나 반복 타이핑을 용이하게 하기 위해 별칭(alias)를 사용할 수 있다.
* `from 모듈 import 기능[들]` 과 같이 필요한 기능만 불러올 수 있다.

In [8]:
# 정규표현식 사용을 위한 import
# import re as regex  #alias 사용
import re
#print(match)
my_regex = re.compile("[0-9]+", re.I)
my_regex

re.compile(r'[0-9]+', re.IGNORECASE|re.UNICODE)

In [None]:
# 모듈에서 특정 기능만 명시해서 불러올 수 있다
from collections import defaultdict, Counter
lookup = defaultdict(int)
my_counter = Counter()
lookup
#my_counter
#defaultdict

* `import X`
    * X 모듈을 현재의 namespace에 추가
    * `X.foo()` 와 같이 사용
    * X라는 이름의 충돌만 없다면 문제없음
* `from X import foo`
    * X 모듈의 foo를 현재의 namespace에 추가
    * `foo()` 와 같이 사용
    * foo라는 이름의 충돌만 없다면 문제없음
* `from X import *`
    * X 모듈에 정의된 모든 것을 현재의 namespace에 추가
    * `foo()` 와 같이 사용
    * 이름 충돌 발생할 가능성이 매우 높으며, 피해야하는 방법

In [None]:
# import가 기존 변수를 덮어쓸 수 있다. 피해야하는 사용법
match = 10
from re import *
print(match)

### 2.1.6 함수
```def```를 이용하여 함수를 정의함.

In [9]:
def double(x):
    """함수에 대한 설명"""
    return x * 2

In [10]:
double?

In [11]:
double("test") # 타입체킹 여부 확인 실패 -0-;

'testtest'

In [13]:
double() # TypeError 발생

TypeError: unsupported operand type(s) for *: 'NoneType' and 'int'

python의 함수들은 변수로 할당되거나 함수의 인자로 전달할 수 있다는 점에서 일급 함수(first-class)의 특성을 가진다.

In [15]:
def apply_to_one(f):
    """인자가 1인 함수 f를 호출"""
    return f(2)

my_double = double
x = apply_to_one(my_double)
x

4

In [None]:
# 짧은 익명의 람다 함수도 간편하게 만들 수 있다.
y = apply_to_one(lambda x: x + 4)
y

변수에 람다 함수를 담을 수도 있다. 그러나...
1. `def another_double(x): return 2 * x`
2. `another_double = lambda x: 2 * x       # 이 방법은 최대한 피하도록 하자. 왜???`

> The first form means that the name of the resulting function object is specifically ‘another_double’ instead of the generic ‘&lt;lambda>’. This is more useful for tracebacks and string representations in general. The use of the assignment statement eliminates the sole benefit a lambda expression can offer over an explicit def statement (i.e. that it can be embedded inside a larger expression)



In [16]:
# 인자에 기본값 할당
def my_print(message="my default message"):
    print(message)

my_print("hello")
my_print()

hello
my default message


In [17]:
# 인자의 이름을 명시해 주면 편리함
def subtract(a=0, b=0):
    return a - b

subtract(10, 5)
subtract(0, 5)
subtract(b=5)

-5

### 2.1.7 문자열
문자열(string)은 작은 따옴표(') 또는 큰 따옴표(")로 묶어 나타낸다. 

In [4]:
single_quoted_string = 'data science'
double_quoted_string = "data science"

In [18]:
# 일부 특수 문자를 인코딩할 때 역슬래시를 사용
tab_string = "\t"
len(tab_string)   #1

1

In [19]:
# 만약 역슬래시를 역스래시로 보이는 문자로 사용하고 싶다면 
# (특히 윈도우 디렉터리 이름이나 정규표현식에서 사용하고 싶을 때) 
# 문자열 앞에 r을 붙여 raw string이라고 명시하면 된다.
not_tab_string = r"\t"
len(not_tab_string)     #2

2

In [20]:
# 세 개의 따옴표를 사용하면 하나의 문자열을 여러 줄로 나눠서 나타낼 수 있다.
multi_line_string = """This is the first line.
    and this is the second line
    and this is third line"""
print(multi_line_string)

This is the first line.
    and this is the second line
    and this is third line


### 또 2.1.7 예외 처리
코드가 뭔가 잘못되었을 때 파이썬을 예외(exception)를 발생시킨다.   
예외를 제대로 처리해 주지 않으면 프로그램이 죽는데, 이를 방지하기 위해 사용할 수 있는 것이 `try`와 `except`이다.

In [24]:
try:
    print(0 / 0)
except ZeroDivisionError:
    print("cannot divide by zero")

cannot divide by zero


많은 프로그래밍 언어에서 예외 처리는 나쁜 것이라고 받아들여지지만(??? 금시초문)  
파이썬에서는 코드를 깔끔하게 작성하기 위해서라면 얼마든지 사용된다.

### 2.1.8 list
- 파이썬의 가장 기본적인 데이터 구조
- ordered collection (like array in other language)

In [25]:
integer_list = [1, 2, 3]
heterogeneous_list = ["string", 0.1, True]
list_of_lists = [ integer_list, heterogeneous_list, [] ]

list_length = len(integer_list)
print(list_length)
list_sum = sum(integer_list)
print(list_sum)

3
6


Python3에서 range는 list와 다르게 동작함.
* 아래 예제와 같이 `x[0] = -1`과 같이 assign이 동작하지 않음
* 따라서 list로 변환해줘야 함.
>The advantage of the range type over a regular list or tuple is that a range object will always take the same (small) amount of memory, no matter the size of the range it represents (as it only stores the start, stop and step values, calculating individual items and subranges as needed).

In [26]:
x = list(range(10)) # [0, 1, ..., 9] 형태의 list
zero = x[0]   
one = x[1]    
nine = x[-1]  
eight = x[-2]  
x[0] = -1
print("zero:", zero, ", one:", one, ", nine:", nine, ", eight:", eight)
print("x   :", x)
print()

first_three = x[:3]
three_to_end = x[3:]
one_to_four = x[1:5]
last_three = x[-3:]
without_first_and_last=x[1:-1]
copy_of_x = x[:]

print("first_three           :", first_three)
print("three_to_end          :", three_to_end)
print("one_to_four           :", one_to_four)
print("last_three            :", last_three)
print("without_first_and_last:", without_first_and_last)
print("copy_of_x             :", copy_of_x)

zero: 0 , one: 1 , nine: 9 , eight: 8
x   : [-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

first_three           : [-1, 1, 2]
three_to_end          : [3, 4, 5, 6, 7, 8, 9]
one_to_four           : [1, 2, 3, 4]
last_three            : [7, 8, 9]
without_first_and_last: [1, 2, 3, 4, 5, 6, 7, 8]
copy_of_x             : [-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [None]:
# `in` 연산자 :  list안에 항목의 존재 여부를 확인
# O(N) - 모든 항목을 순회
print(1 in [1, 2, 3])
print(0 in [1, 2, 3])

In [28]:
x = [1, 2, 3]
x.extend([4, 5, 6])
print(x)
y = x + [4, 5, 6] # x 수정없이 
print(y)

[1, 2, 3, 4, 5, 6]
[1, 2, 3, 4, 5, 6, 4, 5, 6]


In [29]:
x = [1, 2, 3]
x.append(0)
y = x[-1]
print(y)
z= len(x)
print(z)

0
4


In [30]:
# 리스트에 항목이 몇 개있는지 알고 있다면 unpack 사용 가능
x, y = [1, 2]  
# 하지만 양쪽 항목의 개수가 다르다면 ValueError 발생
_, y = [1, 2]
# 위와 같이 사용하지 않는 변수 생략가능
try:
    _, _, z = [1, 2]
except ValueError:
    print("ValueError occurred")


ValueError occurred


### 2.1.9 tuple
* **tuple은 변경할 수 없는 list**임.
* tuple은 대괄호 대신 괄호를 사용해서 (혹은 아무런 기호 없이) 정의한다.

In [31]:
my_list = [1, 2]
my_tuple = (1, 2)
other_tuple = 3, 4
my_list[1] = 3
print("my_list:", my_list)

try:
    my_tuple[1] = 3
except TypeError:
    print("cannot modify a tuple")

my_list: [1, 3]
cannot modify a tuple


In [32]:
# 함수에서 여러 값을 반환할 때 tuple을 사용
def sum_and_product(x, y):
    return (x + y), (x * y)
sp = sum_and_product(2, 3)
s, p = sum_and_product(5, 10)
print(sp, s, p)

(5, 6) 15 50


In [None]:
# tuple과 list는 다중 할당(multiple assignment)을 지원
x, y = 1, 2
x, y = y, x     # 가장 파이썬스럽게 swap
print("x:", x, ", y:", y)

### 2.1.10 dict
* dictionary는 unique한 key값에 연결되 value를 담는 container
* dict의 key는 수정할 수 없음
* list를 key로 사용할 수 없음
    * 만약 다양한 값으로 구성된 key가 필요하다면 tuple이나 문자열을 key로 사용


In [33]:
empty_dict = {}        # 가장 파이썬스럽게 dict 만드는 방법
empty_dict = dict()    # 덜 파이썬스럽게 dict를 만드는 방법
grades = { "Joel" : 80, "Tim" : 95 }
joels_grade = grades["Joel"]
print(joels_grade)

# dict에 존재하지 않는 key를 입력하면 KeyError발생
try:
    kates_grade = grades["Kate"]
except KeyError:
    print("no grade for Kate!")


80
no grade for Kate!


In [34]:
# 연산자 `in`을 사용하면 key의 존재 여부를 확인할 수 있음
joel_has_grade = "Joel" in grades   
kate_has_grade = "Kate" in grades
print(joel_has_grade, kate_has_grade)

# `get` 메서드를 사용하면 입력한 key가 dict에 없어도 에러를 반환하지 않고 기본값을 반환해 줌
joels_grade = grades.get("Joel", 0)
kates_grade = grades.get("Kate", 0)
no_ones_grade = grades.get("No One")  # 없을 때의 default 값은 None
print(joels_grade, kates_grade, no_ones_grade)

True False
80 0 None


#### defaultdict
* 존재하지 않은 key의 value를 조회 시, 자동으로 기본 value을 해당 key값에 추가해줌
* 자동으로 추가되는 기본값은 defaultdict 생성 시 인자로 넘어가는 default_factory

In [None]:
# 1. 단어 수를 세는 방법 : 키값 존재 여부 확인
document = ""
word_counts = {}
for word in document:
    if word in word_counts:
        word_counts[word] += 1
    else:
        word_counts[word] = 1

# 2. 예외 활용
word_counts = {}
for word in document:
    try:
        word_counts[word] += 1
    except KeyError:
        word_counts[word] = 1

# 3. get 사용
word_counts = {}
for word in document:
    previous_count = word_count.get(word, 0)
    word_counts[word] = previous_count + 1

In [None]:
# defaultdict 사용
from collections import defaultdict

word_counts = defaultdict(int)   # int()는 0을 생성
for word in document:
    word_counts[word] += 1
    
# list, dict 또는 직접 만든 함수를 인자(default_factory)로 넣을 수 있다.
dd_list = defaultdict(list)
dd_list[2].append(1)
print(dd_list)

dd_dict = defaultdict(dict) 
dd_dict["Joel"]["City"] = "Seattle"
print(dd_dict)

dd_pair = defaultdict(lambda: [0, 0])
dd_pair[2][1] = 1
print(dd_pair)

#### Counter
* Counter는 연속된 값을 `defaultdict(int)`와 유사한 객체로 변환해 주며, key와 value의 빈도를 연결시켜 준다. 
* 히스토그램 그릴 때 유용함

In [None]:
from collections import Counter
c = Counter([0, 1, 2, 0])
print(c)



In [None]:
document = ""

# 단어 수 셀 때도 유용함.
word_counts = Counter(document)

# Counter 객체에는 유용한 `most_common` 함수가 있음
#  가장 자주 나오는 단어  10개와 이 단어들의 빈도수를 출력
for word, count in word_counts.most_common(10):
    print(word, count)

### 2.1.11 set
* 집합을 나타내는 컨테이너
* 유니크한 항목을 가진다.
    * e.g. 중복된 원소를 제거
* `in` 오퍼레이션이 매우 빠르다. 통상적으로 O(1)
    * e.g. 수 많은 항목 중에서 특정 항목의 존재 여부 확인

일반적으로 `dict`나 `list`를 더 자주 사용

In [None]:
s = set()
s.add(1)
s.add(2)
s.add(2)
print(s)
x = len(s)
y = 2 in s
z = 3 in s
print(x, y, z)

In [None]:
import time
sample = """
It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. The point of using Lorem Ipsum is that it has a more-or-less normal distribution of letters, as opposed to using 'Content here, content here', making it look like readable English. Many desktop publishing packages and web page editors now use Lorem Ipsum as their default model text, and a search for 'lorem ipsum' will uncover many web sites still in their infancy. Various versions have evolved over the years, sometimes by accident, sometimes on purpose (injected humour and the like).
"""
text = ""
for i in range(10000000):
    text += sample

hundreds_of_other_words = text.split(" ")
stopwords_list = ["a", "an", "at"] + hundreds_of_other_words + ["yet", "you"]
start = time.clock()
print("zip" in stopwords_list)
end = time.clock()
print("list:", end - start)

stopwords_set = set(stopwords_list)
start = time.clock()
print("zip" in stopwords_set)
end = time.clock()
print("set:", end - start)

### 2.1.12 흐름제어
* `if` 
    * `if-[elif]-[else]`
    * `true_value` if condition else `false_value`
* `while`
* `for-in`
* `continue`, `break`

In [None]:
if 1 > 2:
    message = "if only 1 were greater than two..."
elif 1 > 3:
    message = "elif stands for 'else if'"
else:
    message = "when all else fails use else (if you want to)"

print(message)

In [None]:
# 3항 연산자처럼 사용할 수 있다.  `true_value` if condition else `false_value`
x = 0
parity = "even" if x % 2 == 0 else "odd"
print(parity)

In [None]:
# while
x = 0
while x < 10:
    print(x, "is less than 10")
    x += 1

In [None]:
# for-in
for x in range(10):
    print(x, "is less than 10")

In [None]:
# continue, break
for x in range(10):
    if x == 3:
        continue
    if x == 5:
        break
    print(x)

### 2.1.13 True와 False (Boolean)
* 항상 대문자로 시작 : `True`, `False`
* 존재하지 않는 값을 `None`으로 표기 (다른 언어의 null)
* 거짓을 의미하는 값들 (나머지 값은 참)
    * `False`
    * `None`
    * `[]` (빈 list)
    * `{}` (빈 dict)
    * ""
    * set()
    * 0
    * 0.0
* `and` 연산자 : 첫번째 값이 참이면 두 번째 값을 반환, 거짓이면 첫번째 값을 반환
* `or` 연산자 : 첫번째 값이 참이면 첫 번째 값을 반환, 거짓이면 두번째 값을 반환
* list관련 함수
    * all(list) : list의 모든 항목이 참이면 True
    * any(list) : list에 참인 항목이 하나라도 있으면 True    

In [None]:
one_is_less_than_two = 1 < 2
print(one_is_less_than_two)
true_equals_false = True == False
print(true_equals_false)

In [None]:
x = None
print(x == None) # 파이썬스럽지 않음
print(x is None) # 파이썬스러움

In [None]:
s = "some texts"
if s:
    first_char = s[0]
else:
    first_char = ""

# 위 코드는 다음과 같이 더욱 간단하게 표현할 수 있음
first_char = s and s[0]

# 만약 x가 숫자거나 None이라면 safe_x는 항상 숫자
safe_x = x or 0

In [None]:
all([True, 1, { 3 }])
all([True, 1, {}])
any([True, 1, {}])
all([])
any([])

## 2.2 기본기에서 한 걸음 나아가기
### 2.2.1 정렬
* list의 sort 메서드: 오름차순 정렬
    * 기존 list의 변경없이 정렬된 목록을 반환받으려면 `sorted` 메서드 사용
* 파라메터 `key`
    * 정렬하고자하는 값을 리턴하는 함수
* 파라메터 `reverse`
    * 기본은 오름차순, `reverse=True`하면 내림차순 정렬

In [None]:
x = [4, 1, 2, 3]
y = sorted(x)
print(x, y)
x.sort()
print(x, y)


In [1]:
# 절대값의 내림차순으로 정렬
x = sorted([-4, 1, -2, 3], key=abs, reverse=True)
print(x)

[-4, 3, -2, 1]


>python3에서는 lambda에서 소괄호()를 사용하여 arguments를 unpack하지 못한다.
 이유는 다음을 참고 [pep3113](https://www.python.org/dev/peps/pep-3113/)

In [None]:
from collections import Counter
document = """
It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. The point of using Lorem Ipsum is that it has a more-or-less normal distribution of letters, as opposed to using 'Content here, content here', making it look like readable English. Many desktop publishing packages and web page editors now use Lorem Ipsum as their default model text, and a search for 'lorem ipsum' will uncover many web sites still in their infancy. Various versions have evolved over the years, sometimes by accident, sometimes on purpose (injected humour and the like).
"""
word_counts = Counter(document)
print(word_counts.items())

# 빈도의 내림차순으로 단어와 빈도를 정렬
wc = sorted(word_counts.items(),
            key = (lambda pair: pair[1]),
            reverse=True)
print("sorted:", wc)

### 2.2.2 List Comprehension
* 기존의 List에서 특정 항목을 선택하거나 변환시깈 결과를 새로운 List에 저장해야하는 경우 list comprehension 사용하는 것이 파이썬스러움
* 이하 [python 3 patterns idioms](http://python-3-patterns-idioms-test.readthedocs.io/en/latest/Comprehensions.html)에서 발췌
* A list comprehension consists of the following parts:
    * An Input Sequence.
    * A Variable representing members of the input sequence.
    * An Optional Predicate expression.
    * An Output Expression producing elements of the output list from members of the Input Sequence that satisfy the predicate.
    * Say we need to obtain a list of all the integers in a sequence and then square them:
```python
a_list = [1, ‘4’, 9, ‘a’, 0, 4]
squared_ints = [ e**2 for e in a_list if type(e) == types.IntType ]
print squared_ints
# [ 1, 81, 0, 16 ]
```
![caption](listComprehensions.gif)

    * The iterator part iterates through each member e of the input sequence a_list.
    * The predicate checks if the member is an integer.
    * If the member is an integer then it is passed to the output expression, squared, to become a member of the output list.

In [None]:
even_numbers = [x for x in range(5) if x % 2 == 0]
squares = [x * x for x in range(5)]
even_squares = [x * x for x in even_numbers]
print("even_numbers:", even_numbers)
print("squares", squares)
print("even_squares:", even_squares)

In [None]:
# dict나 set로 변환도 가능
square_dict = { x : x * x for x in range(5)}
square_set = { x * x for x in [1, -1] }
print("square_dict:", square_dict)
print("square_set:", square_set)

In [None]:
# 리스트에서 불필요한 값은 밑줄로 표기
zeros = [0 for _ in even_numbers]
print(zeros)

In [None]:
# 중복 for문을 사용할 수 있음, 뒤에 나오는 for는 앞에 나온 결과에 대해 반복
pairs = [(x, y) 
        for x in range(10)
        for y in range(10)]
print("pairs:", pairs)
print()

increasing_pairs= [(x, y) 
                  for x in range(10)
                  for y in range(x + 1, 10)]
print("increasing_pairs:", increasing_pairs) # x < y인 경우

### 2.2.3 Generator와 iterator
* 아주 긴 list를 다뤄야할 때 사용
* Generator는 (주로 for문을 통해서) 반복할 수 있으며, generator의 각 항목은 필요한 순간에 그때 그때 생성됨
* python3에서는 range가 generator로 구현됨
* Generator 만드는 방법
    * 함수의 반환값을 `yield`를 사용하는 방법
    * 소괄호() 안에 for문을 추가하는 밥법으로도 generator 생성 가능
        * list comprehension과 비슷한 문법
* `dict`의 `items()`는 모든 key와 value를 반환함
    * 같은 기능의 generator 버전인 `iteritems()`를 더 자주 사용할 것임

In [None]:
# 함수와 yield 사용
def lazy_range(n):
    """range와 똑같은 기능을 하는 generator"""
    i = 0
    while i < n:
        yield i
        i += 1

for i in lazy_range(10):
    print(i)       # do_something_with(i)
    #if i == 5: break


In [None]:
# 괄호안의 for문 추가하여 generator 생성
lazy_evens_below_20 = (i for i in range(20) if i % 2 == 0)
print("lazy_even_below_20:", lazy_evens_below_20)

for i in lazy_evens_below_20:
    print(i)



### 2.2.4 난수 생성
* random 모듈 :  `import random`
* 주요 함수
    * `random()` : 0과 1 사이의 난수를 생성
    * `seed(int)` : 같은 시드 값을 적용하면 값은 random() 값을 얻을 수 있음 
    * `randomrange(int, [int])` 
        * 인자가 하나면 0에서 해당 숫자 사이의 난수 생성
        * 두 개면 그 사이값 [s, e) 범위의 난수 생성
    * `shuffle(list)` : list를 셔플
    * `choice(list)` : 임의의 함목 하나 선택
    * `sample(list, int)` : list에서 중복이 허용되지 않는 임의의 표본 list 생성
 

In [2]:
import random

four_uniform_randoms = [random.random() for _ in range(4)]
print(four_uniform_randoms)

[0.934209417575924, 0.3535656068515457, 0.1690685445403699, 0.9669142105202255]


In [4]:
# seed가 같을 때 난수는?
random.seed(10)
print(random.random())
random.seed(10)
print(random.random())

0.5714025946899135
0.5714025946899135


In [6]:
# 구간 안에서의 난수 생성
random_list1 = [random.randrange(10) for _ in range(5)]    # [0, 1, 2, ... 9] 사이
random_list2 = [random.randrange(3, 6) for _ in range(5)]  # [3, 4, 5] 사이
print(random_list1)
print(random_list2)

[0, 8, 7, 5, 1]
[3, 5, 4, 3, 4]


In [10]:
# list 항목 섞을 때 suffle()
up_to_ten = list(range(10))
random.shuffle(up_to_ten)
print(up_to_ten)

# list에서 임의의 항목 선택 choice()
my_best_friend = random.choice(["Alice", "Bob", "Charlie"])
print(my_best_friend)

# list에서 중복이 허용되지 않는 임의의 표본 list를 만들고 싶을 때 sample()
lottery_numbers = range(60)
winning_numbers = random.sample(lottery_numbers, 6)
print(winning_numbers)

[1, 4, 8, 2, 0, 6, 9, 7, 5, 3]
Alice
[26, 15, 2, 57, 31, 19]


In [None]:
# 중복이 허용되는 임의의 표본 list를 만들고 싶다면 random.choice() 여러번 사용
four_with_replacement = [random.choice(range(10))
                        for _ in range(4)]

### 2.2.5 정규표현식

In [30]:
import re

is_valid = all([
    not re.match("a", "cat"),
    re.search("a", "cat"),
    not re.search("c", "dog"),
    3 == len(re.split("[ab]", "carbs")),
    "R-D-" == re.sub("[0-9]", "-", "R2D2")
])

print(is_valid)

True


### 2.2.6 객체 지향 프로그래밍 
* `class`를 사용하면 데이터와 관련 함수를 하나로 묶어 줄 수 있음.
* 클래스의 멤버 함수(메서드)는 클래스의 이름뒤에 `.`을 찍어 사용할 수 있음.
* 클래스의 이름은 관습에 따라 파스칼케이스로 표기
    > Pascal case is a subset of Camel Case where the first letter is capitalized.
* 메서드의 첫 번째 인자는 `self`임 
* 생성자 함수 : `__init__(self, ...)`
* description 함수 : `__repr__(self)`

In [12]:
class Set:
    def __init__(self, values=None):
        """다음과 같이 사용할 수 있다.
        s1 = Set()
        s2 = Set([1,2,2,3])
        """
        
        self.dict = {}   # 모든 Set의 인스턴스는 자체적으로 dict를 유지
        
        if values is not None:
            for value in values:
                self.add(value)
                
    def __repr__(self):
        """파이썬 프롬프트에서 이 함수를 입력하거나 str()으로 보내 주면 
        Set 객체를 문자열로 표현해 줌"""
        return "Set: " + set(self.dict.keys())
    
    def add(self, value):
        self.dict[value] = True
    
    def contains(self, value):
        return value in self.dict
    
    def remove(self, value):
        del self.dict[value]
        
# 다음과 같이 사용할 수 있다.
s = Set([1, 2, 3])
s.add(4)
print(s.contains(4))
s.remove(3)
print(s.contains(3))
    

True
False


### 2.2.7 함수형 도구
* partial function application (currying)
    * 이미 존재하는 함수의 부분을 사용하여 새로운 함수를 만들 때
    * (practically) 2개 이상의 parameter를 갖는 함수의 일부 parameter에 기본값을 적용한 새로운 함수를 만드는 것
    * `functools.partial`를 사용함.

In [14]:
def exp(base, power):
    return base ** power

# base가 2인 함수 별도 구현
def two_to_the(power):
    return exp(2, power)

# functools.partial 사용
from functools import partial
two_to_the = partial(exp, 2)
print(two_to_the(3))

# 인자의 이름을 명시해 주면 뒤에 나오는 인자도 partial적용가능
square_of = partial(exp, power=2)
print(square_of(3))

8
9


* `list comprehension`의 대안으로 `map, reduce, filter`를 사용할 수 있다.
    * `map(tranform function, list)` : list의 각 요소에 transform을 적용하여 새로운 list 생성
    * `filter(condition function, list)` : list의 각 요소에 condition을 체크하여 참인 경우만 모아 새 list 생성
    * `reduce(reducer function, list)` : list의 각 요소를 순차적으로 합쳐 하나의 값으로 표현

In [16]:
def double(x):
    return 2 * x

xs = [1, 2, 3, 4]
twice_xs = [double(x) for x in xs]     # list comprehension
twice_xs2 = map(double, xs) 
list_doubler = partial(map, double)    # list의 결과를 2배로 만들어 주는 함수
twice_xs3 = list_doubler(xs)
print(twice_xs)
print(list(twice_xs2))
print(list(twice_xs3))

[2, 4, 6, 8]
[2, 4, 6, 8]
[2, 4, 6, 8]


In [19]:
# 여러 개의 list를 입력해 주면 인자가 여러 개인 함수에도 map적용 가능
def multiply(x, y): return x * y

products = map(multiply, [1, 2], [4, 5])    # [1, * 3, 2 * 5] = [4, 10]
print(list(products))

[4, 10]


In [26]:
# filter는 if가 포함된 list comprehension과 동일하다.
def is_even(x):
    """x가 짝수면 True, 홀수면 False"""
    return x % 2 == 0

x_evens = [x for x in xs if is_even(x)]   
x_evens2 = filter(is_even, xs)
list_evener = partial(filter, is_even)
x_evens3 = list_evener(xs)

print(x_evens)
print(list(x_evens2))
print(list(x_evens3))


[2, 4]
[2, 4]
[2, 4]


In [29]:
from functools import reduce
# reduce 
x_product = reduce(multiply, xs)
list_product = partial(reduce, multiply)
x_product2 = list_product(xs)
print(x_product)
print(x_product2)

24
24


### 2.2.8 enumerate
* list 반복하면서 list의 항목과 인덱스가 모두 필요한 경우
* list을 인덱스와 엮어 tuple을 만들어 주는 `enumerate`

In [31]:
documents = ["a", "b", "c"]
for i, document in enumerate(documents):
    print(i, document) # do_somtething(i, document)

# 만약 인덱스만 필요하다면 
for i, _ in enumerate(documents): print(i) #do_somthing(i)

0 a
1 b
2 c
0
1
2


### 2.2.9 zip과  argument unpacking
* 두 개 이사의 list를 서로 묶을 때 `zip(list1, list2)` 사용

* argument unpacking(인자 해체) : `*`


In [16]:
list1 = ['a', 'b', 'c', 'd', 'e']
list2 = [1, 2, 3]
zipped = zip(list1, list2)

#print(list(zipped))

In [17]:
# 묶인 list는 다음과 같은 트릭을 사용해 다시 풀어줄 수도 있음
#pairs = [('a', 1), ('b', 2), ('c', 3)]
pairs = list(zipped)
print(pairs)
letters, numbers = zip(*pairs)
print(letters)
print(numbers)


[('a', 1), ('b', 2), ('c', 3)]
('a', 'b', 'c')
(1, 2, 3)


In [None]:
# 인자 해제 기법
def add(a, b): return a + b

add(1, 2)
add([1, 2])
add(*[1, 2])

### 2.2.10 args와 kwargs
* 함수의 파라메터 선언을 유연하게 할 수 있게 해줌 (가변 파라메터)

In [20]:
# 특정함수 f를 입력하면 f의 결과를 두 배로 만드는 함수를 반환해 주는 고차 함수

# 파라메터가 1개일 때만 동작
def doubler(f):
    def g(x):
        return 2 * f(x)
    return g

def f1(x):
    return x + 1

g = doubler(f1)
print(g(3))
print(g(-1))

# 두 개 이상의 인자를 받는 함수의 경우에는 문제 발생
def f2(x, y):
    return x + y

g = doubler(f2)
print(g(1,2))

8
0


TypeError: g() takes 1 positional argument but 2 were given

In [22]:
# 임의의 수를 인자를 받는 함수 선언
# argument unpacking
def magic(*args, **kwargs):
    print("unnamed args:", args)
    print("keyword args:", kwargs)
    
magic(1, 2, key="word", key2="word2")


unnamed args: (1, 2)
keyword args: {'key': 'word', 'key2': 'word2'}


* `args` : 이름이 없는 인자로 구성된 `tuple`
* `kwargs` :  이름이 주어진 인자로 구성된 `dict`


In [24]:
# 반대로, 정해진 수의 인자가 있는 함수를 호출할 때도 `list`나 `dict`로 인자를 전달할 수 있다.
def other_way_magic(x, y, z):
    return x + y + z

x_y_list = [1, 2]
z_dict = { "z" :  3 }
print(other_way_magic(*x_y_list, **z_dict))

6


In [25]:
# 임의의 인자를 입력 받을 수 있는 고차 함수를 만들 때만 `args`, `kwargs`를 사용하자
def doubler_correct(f):
    """f의 인자에 상관없이 작동함"""
    def g(*args, **kwargs):
        """g의 인자가 무엇이든 간에 f로 보내줌"""
        return 2 * f(*args, **kwargs)
    return g

g = doubler_correct(f2)
print(g(1, 2))

6
