# list

## 순서가 있는 자료의 집합(collection)

In [1]:
integer_list = [1,2,3]

In [2]:
heterogeneous_list = ["string", 0.1, True]

In [3]:
list_of_lists = [integer_list, heterogeneous_list, []]

In [4]:
len(integer_list)

3

In [5]:
sum(integer_list)

6

In [6]:
x = range(10)

In [7]:
# 대괄호를 사용해 리스트의 n 번째 값 불러오기
zero = x[0]
zero

0

In [8]:
one = x[1]

In [9]:
nine = x[-1]

In [10]:
eight = x[-2]

In [11]:
x[0] = -1

In [12]:
x

[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [13]:
# 대괄호 사용하여 리스트 나누기
first_three = x[:3]
first_three

[-1, 1, 2]

In [14]:
three_to_end = x[3:]
three_to_end

[3, 4, 5, 6, 7, 8, 9]

In [15]:
one_to_four = x[1:5]

In [16]:
last_three = x[-3:]

In [17]:
without_first_and_last = x[1:-1]
without_first_and_last

[1, 2, 3, 4, 5, 6, 7, 8]

In [18]:
copy_of_x = x[:]
copy_of_x

[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [19]:
# 리스트 안의 존재여부
1 in [1,2,3]

True

In [20]:
0 in [1,2,3]

False

In [21]:
# 리스트 더하기
x = [1,2,3]

In [22]:
x.extend([4,5,6])

In [23]:
x

[1, 2, 3, 4, 5, 6]

In [24]:
x = [1,2,3]
y = x + [4,5,6]
y

[1, 2, 3, 4, 5, 6]

In [25]:
x = [1,2,3]
x.append(0)
y = x[-1]
z = len(x)

In [26]:
y

0

In [27]:
x

[1, 2, 3, 0]

In [28]:
z

4

In [29]:
# 리스트 unpack
x, y = [1,2]

In [30]:
x

1

In [31]:
y

2

In [32]:
_, y = [1,2]

In [33]:
y

2

In [34]:
x

1

# tuple

## 변경할 수 없는 리스트

In [35]:
my_list = [1,2]
my_tuple = (1,2)
other_tuple = 3,4
my_list[1] = 3

In [36]:
try:
    my_tuple[1] = 3
except TypeError:
    print "cannot modify a tuple"

cannot modify a tuple


In [37]:
# 함수에서 여러값을 반환할때 tuple 사용용이

def sum_and_product(x,y):
    return (x+y), (x* y)

sp = sum_and_product(2,3)

s, p = sum_and_product(5, 10)

In [38]:
sp

(5, 6)

In [39]:
s

15

In [40]:
p

50

In [41]:
# tuple과 list 는 다중할당을 지원함

x, y = 1,2
x, y = y, x

In [42]:
x

2

In [43]:
y

1

# dict

## 특정 값 (value)와 연관된 key를 연결해 주고 이를 사용해 value를 빠르게 검색할 수 있음

In [44]:
empty_dict = {}

In [45]:
empty_dict2 = dict()

In [46]:
grades = {"Joel" : 80, "Tim":95}

In [47]:
joels_grade = grades["Joel"]
joels_grade

80

In [48]:
# 존재하지 않는 키 입력시 KeyError 발생
try:
    kates_grade = grades["Kate"]
except KeyError:
    print "no grade for Kate!"

no grade for Kate!


In [49]:
# in을 사용한 key의 존재여부
joel_has_grade = "Joel" in grades
kate_has_grade = "Kate" in grades

In [51]:
kate_has_grade

False

In [50]:
joel_has_grade

True

In [55]:
# dict 에서 get 메서드를 이용하면 입력한 key 가 dict에없어도 에러를 반환하지 않고 기본값을 반환해줌
joels_grade = grades.get("Joel", 0)
kates_grade = grades.get("Kate", 0)

In [56]:
joels_grade

80

In [57]:
kates_grade

0

In [58]:
# 대괄호를 사용하여 key 와 value를 새로 지정해줄 수 있음
grades["Tim"] = 99
grades["Kate"] = 100
num_students = len(grades)

In [59]:
num_students

3

In [60]:
grades.keys()

['Tim', 'Joel', 'Kate']

In [61]:
grades.values()

[99, 80, 100]

In [62]:
grades.items()

[('Tim', 99), ('Joel', 80), ('Kate', 100)]

# defaultdict

## 존재하지 않는 key 가 주어진다면 defaultdict는 이 key와 인자에서 주어진 값으로 dict에 새로운 항목을 추가해줌

In [64]:
from collections import defaultdict

In [66]:
dd_list = defaultdict(list)
dd_list[2].append(1)

In [67]:
dd_list

defaultdict(list, {2: [1]})

In [68]:
dd_dict = defaultdict(dict)
dd_dict["Joel"]["City"] = "Seattle"

In [69]:
dd_dict

defaultdict(dict, {'Joel': {'City': 'Seattle'}})

In [70]:
dd_pair = defaultdict(lambda: [0,0])
dd_pair[2][1] = 1

In [71]:
dd_pair

defaultdict(<function __main__.<lambda>>, {2: [0, 1]})

In [72]:
# Counter
## 연속된 값을 defaultdict(int)와 유사한 객체로 변환해주며, key와 value의 빈도를 연결시켜준다
## 히스토그램에서 많이 사용됨

from collections import Counter
c = Counter({0, 1, 2, 0})

In [73]:
c

Counter({0: 1, 1: 1, 2: 1})

In [82]:
document = 'hi my name name is hi'
word_counts = Counter(document.split())

In [83]:
word_counts

Counter({'hi': 2, 'is': 1, 'my': 1, 'name': 2})

In [84]:
for word, count in word_counts.most_common(5):
    print word, count

hi 2
name 2
is 1
my 1


# Set
## 항복의 집합을 나타내는 자료구조

In [85]:
s = set()
s.add(1)
s.add(2)
s.add(2)

x = len(s)
y = 2 in s
z = 3 in s

In [86]:
x

2

In [87]:
y

True

In [88]:
z

False

In [92]:
# 장점1: in 이 빠름

# 장점2: 중복된 원소를 제거해줌
item_list = [1, 2, 3, 1, 2, 3]
len(item_list)


6

In [93]:
item_set = set(item_list)
len(item_set)

3

In [94]:
list(item_set)

[1, 2, 3]

# sorting

In [99]:
x = [4, 1, 3, 2]

In [100]:
y = sorted(x)

In [101]:
y

[1, 2, 3, 4]

In [103]:
x.sort()

In [104]:
x

[1, 2, 3, 4]

In [105]:
# 절대값의 내림차순으로 list 정렬
x = sorted([-4, 1, -2, 3] , key = abs, reverse = True)

In [106]:
x

[-4, 3, -2, 1]

In [108]:
# 빈도의 내림차순으로 단어와 빈도를 정렬
wc = sorted(word_counts.items(), key = lambda(word, count) : count, reverse=True)

In [109]:
wc

[('hi', 2), ('name', 2), ('is', 1), ('my', 1)]

## List Comprehension

#### 기존 리스트에서 특정 항목을 선택하거나 변환시킨 결과를 새로운 list에 저장할때 쓰이는 방법

In [1]:
even_numbers = [x for x in range(5) if x % 2 == 0]
squares = [x * x for x in range(5)]
even_squares = [x * x for x in even_numbers]

In [2]:
even_numbers

[0, 2, 4]

In [3]:
squares

[0, 1, 4, 9, 16]

In [5]:
even_squares

[0, 4, 16]

In [6]:
square_dict = {x : x * x for x in range(5)}
square_dict

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

In [7]:
square_set = {x * x for x in [1, -1]}
square_set

{1}

In [8]:
zeros = [ 0 for _ in even_numbers]

In [9]:
pairs = [(x, y) for x in range(10) for y in range(10)]
pairs

[(0, 0),
 (0, 1),
 (0, 2),
 (0, 3),
 (0, 4),
 (0, 5),
 (0, 6),
 (0, 7),
 (0, 8),
 (0, 9),
 (1, 0),
 (1, 1),
 (1, 2),
 (1, 3),
 (1, 4),
 (1, 5),
 (1, 6),
 (1, 7),
 (1, 8),
 (1, 9),
 (2, 0),
 (2, 1),
 (2, 2),
 (2, 3),
 (2, 4),
 (2, 5),
 (2, 6),
 (2, 7),
 (2, 8),
 (2, 9),
 (3, 0),
 (3, 1),
 (3, 2),
 (3, 3),
 (3, 4),
 (3, 5),
 (3, 6),
 (3, 7),
 (3, 8),
 (3, 9),
 (4, 0),
 (4, 1),
 (4, 2),
 (4, 3),
 (4, 4),
 (4, 5),
 (4, 6),
 (4, 7),
 (4, 8),
 (4, 9),
 (5, 0),
 (5, 1),
 (5, 2),
 (5, 3),
 (5, 4),
 (5, 5),
 (5, 6),
 (5, 7),
 (5, 8),
 (5, 9),
 (6, 0),
 (6, 1),
 (6, 2),
 (6, 3),
 (6, 4),
 (6, 5),
 (6, 6),
 (6, 7),
 (6, 8),
 (6, 9),
 (7, 0),
 (7, 1),
 (7, 2),
 (7, 3),
 (7, 4),
 (7, 5),
 (7, 6),
 (7, 7),
 (7, 8),
 (7, 9),
 (8, 0),
 (8, 1),
 (8, 2),
 (8, 3),
 (8, 4),
 (8, 5),
 (8, 6),
 (8, 7),
 (8, 8),
 (8, 9),
 (9, 0),
 (9, 1),
 (9, 2),
 (9, 3),
 (9, 4),
 (9, 5),
 (9, 6),
 (9, 7),
 (9, 8),
 (9, 9)]

In [10]:
increasing_pairs = [(x, y) for x in range(10) for y in range(x+1, 10)]

In [11]:
increasing_pairs

[(0, 1),
 (0, 2),
 (0, 3),
 (0, 4),
 (0, 5),
 (0, 6),
 (0, 7),
 (0, 8),
 (0, 9),
 (1, 2),
 (1, 3),
 (1, 4),
 (1, 5),
 (1, 6),
 (1, 7),
 (1, 8),
 (1, 9),
 (2, 3),
 (2, 4),
 (2, 5),
 (2, 6),
 (2, 7),
 (2, 8),
 (2, 9),
 (3, 4),
 (3, 5),
 (3, 6),
 (3, 7),
 (3, 8),
 (3, 9),
 (4, 5),
 (4, 6),
 (4, 7),
 (4, 8),
 (4, 9),
 (5, 6),
 (5, 7),
 (5, 8),
 (5, 9),
 (6, 7),
 (6, 8),
 (6, 9),
 (7, 8),
 (7, 9),
 (8, 9)]

## 난수생성

In [13]:
import random

# random.random() = 0과 1 사이의 난수 생성

four_uniform_randoms = [random.random() for _ in range(4)]
four_uniform_randoms

[0.34319955343962694,
 0.029545745679784408,
 0.30079283911837584,
 0.4767519573024779]

In [14]:
random.seed(10)
print random.random()

random.seed(10)
print random.random()

0.57140259469
0.57140259469


In [16]:
random.randrange(10)

2

In [17]:
random.randrange(3, 6)

5

In [18]:
# 리스트의 항목을 임의 순서로 재정렬

up_to_ten = range(10)
random.shuffle(up_to_ten)
print up_to_ten

[4, 0, 2, 6, 9, 7, 3, 1, 5, 8]


In [21]:
# 리스트에서 임의의 항목 선택

my_best_friend = random.choice(["Alice", "Bob", "Charlie"])
my_best_friend

'Bob'

In [22]:
# 중복되지 않는 임의의 표본 리스트 만들기

lottery_numbers = range(60)
winning_numbers = random.sample(lottery_numbers, 6)
winning_numbers

[22, 16, 39, 26, 38, 36]

In [23]:
# 중복이 허용되는 표본
four_with_replacement = [random.choice(range(10)) for _ in range(4)]
four_with_replacement

[1, 7, 9, 9]

## 정규표현식

In [25]:
import re

print all([
    not re.match("a", "cat"),
    re.search("a", "cat"),
    not re.search("c", "dog"),
    3 == len(re.split("[ab]", "carbs")),
    
    "R-D-" == re.sub("[0-9]", "-", "R2D2")
])

True


## 객체 지향 프로그래밍

#### 클래스를 사용하여 데이터와 관련 함수를 하나로 묶음

In [30]:
class Set:
    def __init__(self, values=None):
        # constructor
        s1 = Set()
        s2 = Set([1,2,2,3])
        
        self.dict = {}
        
        if values is not None:
            for value in values:
                self.add(value)
    
    # set 객체를 문자열로 표현
    def __repr__(self):
        return "Set: " + str(self.dict.keys())
    
    # 항목과 True를 각각 key 와 value로 사용하여 set안에존재하는 항목을 표현
    def add(self, value):
        self.dict[value] = True
    
    # 만약 항목이 dict의 key라면 항목은 set 안에 존재함
    def contains(self, value):
        return value in self.dict
    
    def remove(self, value):
        del self.dict[value]

In [31]:
s = Set([1,2,3])
s.add(4)
print s.contains(4)
s.remove(3)
print s.contains(3)

RuntimeError: maximum recursion depth exceeded

## 함수형 도구

#### 한 함수의 특정 부분을 사용해서 새로운 함수를 만들고 싶을때 사용

In [33]:
 def exp(base, power):
        return base ** power

In [34]:
def two_to_the(power):
    return exp(2, power)

In [35]:
from functools import partial
two_to_the = partial(exp, 2)
print two_to_the(3)

8


In [37]:
square_of = partial(exp, power=2)
print square_of(3)

9


In [38]:
def double(x):
    return 2 * x

xs = [1, 2, 3, 4]
twice_xs = [double(x) for x in xs]

twice_xs


[2, 4, 6, 8]

In [39]:
twice_xs = map(double, xs)
twice_xs


[2, 4, 6, 8]

In [41]:
list_doubler = partial(map, double)
list_doubler


<functools.partial at 0x44a3098>

In [42]:
twice_xs = list_doubler(xs)

twice_xs

[2, 4, 6, 8]

In [43]:
def multiply(x,y):
    return x*y

products = map(multiply, [1,2], [4,5])
products

[4, 10]

In [44]:
def is_even(x):
    return x % 2 == 0

x_evens = [x for x in xs if is_even(x)]
x_evens

[2, 4]

In [45]:
x_evens = filter(is_even, xs)
x_evens

[2, 4]

In [46]:
list_evener = partial(filter, is_even)
list_evener

<functools.partial at 0x44a3408>

In [48]:
x_evens = list_evener(xs)
x_evens

[2, 4]

In [49]:
x_product = reduce(multiply, xs)
list_product = partial(reduce, multiply)
x_product = list_product(xs)

In [50]:
x_product

24

## zip & argument unpacking

#### 두개이상의 리스트를 서로 묶을때 사용

In [52]:
list1 = ['a', 'b', 'c']
list2 = [1, 2, 3]
zip(list1, list2)

# 첫번째 리스트가 끝나면 멈춤

[('a', 1), ('b', 2), ('c', 3)]

In [53]:
pairs = [('a', 1), ('b', 2), ('c', 3)]
letters, numbers = zip(*pairs)

In [54]:
letters

('a', 'b', 'c')

In [55]:
numbers

(1, 2, 3)

In [56]:
def add(a, b): return a + b

In [57]:
add(1, 2)

3

In [58]:
add([1,2])

TypeError: add() takes exactly 2 arguments (1 given)

In [59]:
add(*[1, 2])

3

## args & kwars

In [60]:
def doubler(f):
    def g(x):
        return 2 * f(x)
    return g

In [61]:
def f1(x):
    return x + 1

In [62]:
g = doubler(f1)

In [63]:
print g(3)   #(3+1)*2

8


In [64]:
print g(-1)   #(-1+1)*2

0


In [65]:
# 두개의 인자를 받는 함수의 경우 문제 발생

def f2(x, y):
    return x + y

g = doubler(f2)
print g(1, 2)

TypeError: g() takes exactly 1 argument (2 given)

In [66]:
# 해결법 : 임의의 수의 인자를 받는 함수를 만들어 줘야 함 (argument unpacking 사용)

def magic(*args, **kwargs):
    print "unnamed args:", args
    print "keyword args:", kwargs
    
    
magic(1, 2, key = "word", key2 = "word2")
# args는 이름이 없는 인자로 구성된 tuple
# kwargs는 이름이 주어진 인자로 구성된 dict

unnamed args: (1, 2)
keyword args: {'key2': 'word2', 'key': 'word'}


In [67]:
def other_way_magic(x, y, z):
    return x + y + z

x_y_list = [1,2]
z_dict = {"z" : 3}
print other_way_magic(*x_y_list, **z_dict)

6


In [68]:
def doubler_correct(f):
    # f의 인자에 상관없이 작동함
    def g(*args, **kwargs):
        # g의 인자가 무엇이든 간에 f로 보내줌
        return 2 * f(*args, **kwargs)
    
    return g

g = doubler_correct(f2)
print g(1,2)

6
