# OverView

In [1]:
colors = ['red','blue','green','yellow']
result = ''
for s in colors:
    result += s

In [2]:
result

'redbluegreenyellow'

In [3]:
colors = ['red','blue','green','yellow']
result = ''.join(colors)
result

'redbluegreenyellow'

Pythonic Code
- split & join / string 핸들링
- List Comprehension / 리스트 구문을 사용해서 for문 핸들링
- Enumerate & Zip / 데이터들을 뽑아낼 때 쓰는 스킬

Supplement Materials

* Fluent Python - 전문가를 위한 파이썬 (한빛미디어, 2016)
* Effective Python - 파이썬 코딩의 기술 (길벗, 2016)
* 파이썬을 여행하는 히치하이커를 위한 안내서

## Split & Join

In [8]:
items = 'zero one two three'.split()
print(items)

['zero', 'one', 'two', 'three']


In [9]:
example = 'python, jquery, javascript'
example.split(",")

['python', ' jquery', ' javascript']

In [10]:
a,b,c = example.split(",") 
#리스트에 있는 각 값을 a,b,c 변수로 unpacking

In [6]:
example = 'cs50.gachon.edu'

In [7]:
subdomain, domain, tld = example.split('.')

In [15]:
colors = ['red','blue','green','yellow']
result = ''.join(colors)
result

'redbluegreenyellow'

In [17]:
result = ' '.join(colors)
result

'red blue green yellow'

In [18]:
result = ', '.join(colors)
result

'red, blue, green, yellow'

In [19]:
result = '-'.join(colors)
result

'red-blue-green-yellow'

## List comprehensions

- 기존 List 사용하여 간단히 다른 List를 만드는 기법
- 포괄적인 List, 포함되는 리스트라는 의미로 사용됨
- 파이썬에서 가장 많이 사용되는 기법 중 하나
- 일반적으로 for + append 보다 속도가 빠름

In [20]:
result = []
for i in range(10):
    result.append(i)
result

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [21]:
result = [i for i in range(10)]
result

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [23]:
result = [i for i in range(10) if i % 2 == 0]
result

[0, 2, 4, 6, 8]

In [11]:
word_1 = "Hello"
word_2 = "World"
result = [i+j for i in word_1 for j in word_2]
    #Nested For loop
result
# list 연속적으로 쓰면 one demensional list

['HW',
 'Ho',
 'Hr',
 'Hl',
 'Hd',
 'eW',
 'eo',
 'er',
 'el',
 'ed',
 'lW',
 'lo',
 'lr',
 'll',
 'ld',
 'lW',
 'lo',
 'lr',
 'll',
 'ld',
 'oW',
 'oo',
 'or',
 'ol',
 'od']

In [26]:
case_1 = ["A","B","C"]
case_2 = ["D","E","A"]
result = [i+j for i in case_1 for j in case_2]
result

['AD', 'AE', 'AA', 'BD', 'BE', 'BA', 'CD', 'CE', 'CA']

In [29]:
result = [i+j for i in case_1 for j in case_2 if not(i==j)]
result

['AD', 'AE', 'BD', 'BE', 'BA', 'CD', 'CE', 'CA']

In [31]:
result.sort()
result

['AD', 'AE', 'BA', 'BD', 'BE', 'CA', 'CD', 'CE']

In [13]:
words = 'The quick brown fox jumps over the lazy dog'.split()
print(words)

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']


In [14]:
stuff = [[w.upper(),w.lower(),len(w)] for w in words]
stuff
# two dimensional list

[['THE', 'the', 3],
 ['QUICK', 'quick', 5],
 ['BROWN', 'brown', 5],
 ['FOX', 'fox', 3],
 ['JUMPS', 'jumps', 5],
 ['OVER', 'over', 4],
 ['THE', 'the', 3],
 ['LAZY', 'lazy', 4],
 ['DOG', 'dog', 3]]

In [16]:
case_1 = ["A","B","C"]
case_2 = ["D","E","A"]
result = [i+j for i in case_1 for j in case_2]
result

['AD', 'AE', 'AA', 'BD', 'BE', 'BA', 'CD', 'CE', 'CA']

In [17]:
result = [[i+j for i in case_1] for j in case_2] 
# 바깥 코드(for문)가 고정되서 실행됨
result

[['AD', 'BD', 'CD'], ['AE', 'BE', 'CE'], ['AA', 'BA', 'CA']]

## Enumerate & Zip

Enumerate
- List의 element를 추출할 때 번호를 붙여서 추출

In [18]:
for i,v in enumerate(['tic','tac','toe']):
    print(i,v)
# list에 있는 index와 값을 unpacking

0 tic
1 tac
2 toe


In [41]:
mylist = ["a","b","c","d"]
list(enumerate(mylist))

[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]

In [21]:
{i:j for i,j in enumerate('Gachon University is an academic institue located in South Korea.'.split())}

{0: 'Gachon',
 1: 'University',
 2: 'is',
 3: 'an',
 4: 'academic',
 5: 'institue',
 6: 'located',
 7: 'in',
 8: 'South',
 9: 'Korea.'}

Zip
- 두 개의 list의 값을 병렬적으로 추출함

In [43]:
alist = ['a1','a2','a3']
blist = ['b1','b2','b3']
for a,b in zip(alist,blist):
    print(a,b)

a1 b1
a2 b2
a3 b3


In [44]:
a,b,c = zip((1,2,3),(10,20,30),(100,200,300))

In [45]:
[sum(x) for x in zip((1,2,3),(10,20,30),(100,200,300))]

[111, 222, 333]

Enumerate & Zip

In [47]:
alist = ['a1','a2','a3']
blist = ['b1','b2','b3']

for i,(a,b) in enumerate(zip(alist,blist)):
    print(i,a,b)

0 a1 b1
1 a2 b2
2 a3 b3


## Lambda & MapReduce

Lambda 
- 함수 이름 없이, 함수처럼 쓸 수 있는 익명함수
- 수학의 람다 대수에서 유래함

In [48]:
f = lambda x,y : x+y
print(f(1,4))

5


In [49]:
f = lambda x: x**2
print(f(3))

9


In [50]:
f = lambda x : x/2
print(f(3))

1.5


In [51]:
print((lambda x: x+1)(5))

6


Map function
- sequence 자료형 각 element에 동일한 function을 적용함

In [22]:
ex = [1,2,3,4,5]
f = lambda x : x ** 2
print(list(map(f,ex))) 
# map 앞에 list 반드시 써야함!
# map만 쓰면 위치만 나옴

[1, 4, 9, 16, 25]


In [23]:
ex = [1,2,3,4,5]
f = lambda x,y : x+y
print(list(map(f, ex, ex)))
# zip함수랑 같은 효과?를 낼 수 있음

[2, 4, 6, 8, 10]


In [24]:
list(map(lambda x : x**2 if x % 2 == 0 else x, ex))
# 필터 쓸 수 있음! 단, else를 꼭 써줘야함
# 조건이 만족하지 않으면 어떻게 할지 알려줘야 함

[1, 4, 3, 16, 5]

In [25]:
[value ** 2 for value in ex]
# 굳이 lambda나 map을 안써도 되니까 list comprehension을 쓰라고 함

[1, 4, 9, 16, 25]

In [56]:
ex = [1,2,3,4,5]
print(list(map(lambda x : x+x, ex)))

[2, 4, 6, 8, 10]


In [58]:
print((map(lambda x : x+x, ex))) #list 꼭 붙여줘야함

<map object at 0x0000025A5D5CB9B0>


In [61]:
f = lambda x : x ** 2
print(map(f,ex))
for i in map(f,ex):
    print(i)
#list 안쓸거면 for문을 써줘야 결과값이 나옴

<map object at 0x0000025A5D5CB6D8>
1
4
9
16
25


Reduce function
- map function과 달리 list에 똑같은 함수를 적용해서 통합

In [62]:
from functools import reduce
print(reduce(lambda x,y : x+y, [1,2,3,4,5]))

15


In [64]:
def factorial(n):
    return reduce(lambda x,y:x*y, range(1,n+1))

factorial(5)

120

Summary
- Lambda, map, reduce는 간단한 코드로 다양한 기능을 제공
- 그러나 코드의 직관성이 떨어져서 lambda나 reduce는 python3에서
사용을 권장하지 않음
- Legacy library나 다양한 머신러닝 코드에서 여전히 사용중

## Asterisk

- 흔히 알고 있는 *를 의미함
- 단순 곱셈, 제곱연산, 가변 인자 활용 등 다양하게 사용됨

In [65]:
def asterisk_test(a,*args):
    print(a,args)
    print(type(args))
    
asterisk_test(1,2,3,4,5,6)
# 몇 개일지 모르는 인자 받을 때 사용

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [66]:
def asterisk_test(a, **kargs):
    print(a, kargs)
    print(type(kargs))
    
asterisk_test(1, b=2,c=3,d=4,e=5,f=6)
# 몇 개일지 모르는 키워드 인자 받을 때 dict타입으로 받음

1 {'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
<class 'dict'>


Asterisk - unpacking a container
- tuple, dict 등 자료형에 들어가 있는 값을 unpacking
- 함수의 입력값, zip 등에 유용하게 사용가능

In [71]:
def asterisk_test(a,*args):
    print(a,args[0])
    print(type(args))
    
asterisk_test(1,(2,3,4,5,6))
# unpacking해서 넣어주고 싶으면 앞에 *를 붙이면 됨

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [26]:
def asterisk_test(a,*args):
    print(a,args)
    print(type(args))
    
asterisk_test(1,(2,3,4,5,6))
# 튜플타입으로 들어온 것을 볼 수 있음
# [0]을 안해주면 two demensional로 보임

1 ((2, 3, 4, 5, 6),)
<class 'tuple'>


In [74]:
def asterisk_test(a,args):
    print(a,*args)
    print(type(args))
    
asterisk_test(1,(2,3,4,5,6))
# 처음엔 하나의 변수로 들어갔지만 print에 
# *를 써서 unpacking을 해줌

1 2 3 4 5 6
<class 'tuple'>


In [75]:
def asterisk_test(a,*args):
    print(a,args)
    print(type(args))
    
asterisk_test(1,*(2,3,4,5,6))

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [76]:
a,b,c = ([1,2],[3,4],[5,6])
print(a,b,c)

[1, 2] [3, 4] [5, 6]


In [77]:
data = ([1,2],[3,4],[5,6])
print(*data)

[1, 2] [3, 4] [5, 6]


In [78]:
def asterisk_test(a,b,c,d):
    print(a,b,c,d)
data = {"b":1, "c":2, "d":3}
asterisk_test(10, **data)

# **를 보내주면 뜯어줘서 들어감

10 1 2 3


In [79]:
for data in zip(*([1,2],[3,4],[5,6])):
    print(data)

(1, 3, 5)
(2, 4, 6)


In [81]:
for data in zip(*([1,2],[3,4],[5,6])):
    print(sum(data))

9
12


In [85]:
def asterisk_test(a,b,c,d,e=0):
    print(a,b,c,d,e)
    
data = {"d":1,"c":2,"b":3,"e":56}
asterisk_test(10,**data)

10 3 2 1 56


## <참고> Data Structure - Collections

Collections
- List, Tuple, Dict에 대한 Python Built-in 확장 자료 구조 (모듈)
- 편의성, 실행 효율 등을 사용자에게 제공함
- 아래의 모듈이 존재함
* from collections import deque
* from collections import Counter
* from collections import OrderedDict
* from collections import defaultdict
* from collections import namedtuple

deque
- Stack과 Queue를 지원하는 모듈
- List에 비해 효율적인 자료 저장 방식을 지원함

In [2]:
from collections import deque

deque_list = deque()
for i in range(5):
    deque_list.append(i)
print(deque_list)

deque([0, 1, 2, 3, 4])


In [3]:
deque_list.appendleft(10)
print(deque_list)

deque([10, 0, 1, 2, 3, 4])


- rotate,reverse등 Linked List의 특성을 지원함
- 기존 list형태의 함수를 모두 지원함

In [4]:
deque_list.rotate(2)
print(deque_list)

deque([3, 4, 10, 0, 1, 2])


In [5]:
deque_list.rotate(2)
print(deque_list)

deque([1, 2, 3, 4, 10, 0])


In [6]:
deque_list.extend([5,6,7])
print(deque_list)

deque([1, 2, 3, 4, 10, 0, 5, 6, 7])


In [7]:
deque_list.extendleft([5,6,7])
print(deque_list)

deque([7, 6, 5, 1, 2, 3, 4, 10, 0, 5, 6, 7])


In [9]:
print(deque(reversed(deque_list)))

deque([7, 6, 5, 0, 10, 4, 3, 2, 1, 5, 6, 7])


- deque는 기존 list보다 효율적인 자료구조를 제공
- 효율적 메모리 구조로 처리 속도 향상

In [11]:
#deque
from collections import deque
import time

start_time = time.clock()
deque_list = deque()
#Stack
for i in range(1000):
    for i in range(1000):
        deque_list.append(i)
        deque_list.pop()
print(time.clock()-start_time, "seconds")

0.8777447999999879 seconds


In [12]:
import time

start_time = time.clock()
just_list = []
for i in range(1000):
    for i in range(1000):
        just_list.append(i)
        just_list.pop()
print(time.clock() - start_time,"seconds")

2.666900400000003 seconds


OrderedDict
- Dict와 달리, 데이터를 입력한 순서대로 dict를 반환함

In [13]:
d = {}
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k,v in d.items():
    print(k,v)

x 100
y 200
z 300
l 500


In [16]:
from collections import OrderedDict
d = OrderedDict() # 순서대로 저장하게 해줌
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k,v in d.items():
    print(k,v)

x 100
y 200
z 300
l 500


- Dict type의 값을, value 또는 key 값으로 정렬할 때 사용 가능

In [19]:
for k,v in OrderedDict(sorted(d.items(), 
                              key=lambda t:t[0])).items():
    print(k,v)

l 500
x 100
y 200
z 300


In [20]:
for k,v in OrderedDict(sorted(d.items(), 
                              key=lambda t:t[1])).items():
    print(k,v)

x 100
y 200
z 300
l 500


defaultdict
- Dict type의 값에 기본 값을 지정, 신규값 생성시 사용하는 방법

In [21]:
d = dict()
print(d["first"])

KeyError: 'first'

In [22]:
from collections import defaultdict
d = defaultdict(object)
d = defaultdict(lambda:0)
print(d["first"])
# 초기값 없을 때 사용하면 편리함

0


In [27]:
from collections import OrderedDict
word_count = defaultdict(object)
word_count = defaultdict(lambda : 1)

for word in text:
    word_count[word] += 1

for i,v in OrderedDict(sorted(
        word_count.items(),key=lambda t:t[1],
        reverse=True)).items():
    print(i,v)
# value값으로 정렬이 됨

NameError: name 'defaultdict' is not defined

In [None]:
word_count = {}
for word in text:
    if word in word_count.keys():
        word_count[word] += 1
    else:
        word_count[word] = 0
print(word_count)

Counter
- Sequence type의 data element들의 갯수를 dict 형태로 반환

In [29]:
from collections import Counter

c = Counter()
c = Counter('gallahad')
print(c)
# count + sorting

Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})


namedtuple
- Tuple 형태로 Data 구조체를 저장하는 방법
- 저장되는 data의 variable을 사전에 지정해서 저장함

In [30]:
from collections import namedtuple
Point = namedtuple('Point',['x','y'])
p = Point(11,y=22)
print(p[0]+p[1])

33


In [31]:
x,y = p
print(x,y)
print(p.x+p.y)
print(Point(x=11, y=22))

11 22
33
Point(x=11, y=22)
