# Pythonic Code Overview

학습 목표

- Pythonic Code는 간단하게, 다른 사람의 코드를 잘 이해하기 위해서 파이썬 특유의 문법을 활용하여 효율적으로 코드를 표현하는 기법을 말합니다.

이번 챕터에서는 Pythonic Code 를 작성하는 방법과, Matrices와 Vector 의 연산을 Pythonic Code 로 구현하는 방법을 배웁니다.

In [1]:
# 일반 코드

colors = ["a", "b", "c", "d", "e"]
result = ""

for s in colors:
    result += s

print(result)

abcde


In [2]:
# pythonic code

colors = ["red", "blue", "green", "yellow"]
result = "".join(colors)

print(result)

redbluegreenyellow


# Pythonic Code

- Split & Join
- List Comprehension
- Enumerate & Zip
- Lambda & MapReduce
- Asterisk

## Split & Join

### Split
- String Type의 값을 나눠서 List 형태로 변환

In [3]:
# 빈칸을 기준으로 문자열 나누기
items = 'zero one two three'.split()

print(items)

['zero', 'one', 'two', 'three']


In [4]:
# ','을 기준으로 문자열 나누기
example = 'python,jquery,javascript'

print(example.split(','))

['python', 'jquery', 'javascript']


In [6]:
# 리스트의 각 값을 a, b, c 변수로 unpacking
example = 'python,jquery,javascript'

a, b, c = example.split(',')

### Join
- String List를 합쳐 하나의 String으로 반환할 때 사용

In [8]:
colors = ["red", "blue", "green", "yellow"]
result = "".join(colors)
print(result)

colors = ["red", "blue", "green", "yellow"]
result = " ".join(colors)   # 연결 시 빈칸 1칸으로 연결
print(result)

redbluegreenyellow
red blue green yellow


## List Comprehensions
- 기존 List 사용하여 간단히 다른 List를 만드는 기법
- 포괄적인 List, 포함되는 리스트라는 의미로 사용됨
- 파이썬에서 가장 많이 사용되는 기법 중 하나
- 일반적으로 for + append 보다 속도가 빠름

In [9]:
# for loop + append
result = []

for i in range(10):
    result.append(i)

print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [10]:
# List Comprehension
result = [i for i in range(10)]
print(result)

result = [i for i in range(10) if i % 2 == 0]
print(result)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 2, 4, 6, 8]


In [12]:
# Nested For loop
word_1 = "Hello"
word_2 = "World"
result = [i + j for i in word_1 for j in word_2]

print(result)

['HW', 'Ho', 'Hr', 'Hl', 'Hd', 'eW', 'eo', 'er', 'el', 'ed', 'lW', 'lo', 'lr', 'll', 'ld', 'lW', 'lo', 'lr', 'll', 'ld', 'oW', 'oo', 'or', 'ol', 'od']


In [13]:
# Nested For loop + if 문
case_1 = ["A", "B", "C"]
case_2 = ["D", "E", "A"]

result = [i + j for i in case_1 for j in case_2]
print(result)

# if 문 추가 (i와 j가 같으면 추가하지 않음)
result = [i + j for i in case_1 for j in case_2 if not(i == j)]
result.sort()

print(result)

['AD', 'AE', 'AA', 'BD', 'BE', 'BA', 'CD', 'CE', 'CA']
['AD', 'AE', 'BA', 'BD', 'BE', 'CA', 'CD', 'CE']


In [16]:
# Split + List Comprehension
words = 'The quick brown fox jumps over the lazy dog'.split()
print(words)    # 문장을 빈칸 기준으로 나눠 List로 반환

# List의 각 elements들을 대문자, 소문자, 길이로 변환하여 two dimensional list로 변환
stuff = [[w.upper(), w.lower(), len(w)] for w in words]
print(stuff)

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']
[['THE', 'the', 3], ['QUICK', 'quick', 5], ['BROWN', 'brown', 5], ['FOX', 'fox', 3], ['JUMPS', 'jumps', 5], ['OVER', 'over', 4], ['THE', 'the', 3], ['LAZY', 'lazy', 4], ['DOG', 'dog', 3]]


In [17]:
for i in stuff:
    print(i)

['THE', 'the', 3]
['QUICK', 'quick', 5]
['BROWN', 'brown', 5]
['FOX', 'fox', 3]
['JUMPS', 'jumps', 5]
['OVER', 'over', 4]
['THE', 'the', 3]
['LAZY', 'lazy', 4]
['DOG', 'dog', 3]


## Enumerate & Zip

### Enumerate
- List의 element를 추출할 때 번호를 붙여서 추출

In [19]:
for i, v in enumerate(['tic', 'tac', 'toe']) :
    # list에 있는 index와 value를 unpacking
    print(i, v)

0 tic
1 tac
2 toe


In [20]:
mylist = ['a', 'b', 'c', 'd']
list(enumerate(mylist))

[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]

In [21]:
# 리스트의 인덱스와 값을 언패킹하여 딕셔너리로 변환
{i : j for i, j in enumerate(mylist)}

{0: 'a', 1: 'b', 2: 'c', 3: 'd'}

### Zip
- 두 개의 list의 값을 병렬적으로 추출함

In [22]:
alist = ['a1', 'a2', 'a3']
blist = ['b1', 'b2', 'b3']

for a, b, in zip(alist, blist) :
    print(a, b)

a1 b1
a2 b2
a3 b3


In [23]:
# list comprehension + zip
a, b, c = zip((1, 2, 3), (10, 20, 30), (100, 200, 300))
print(a, b, c)

print([sum(x) for x in zip((1, 2, 3), (10, 20, 30), (100, 200, 300))])

(1, 10, 100) (2, 20, 200) (3, 30, 300)
[111, 222, 333]


In [24]:
# enumerate + zip
alist = ['a1', 'a2', 'a3']
blist = ['b1', 'b2', 'b3']

for i, (a, b) in enumerate(zip(alist, blist)):
    print(i, a, b)

0 a1 b1
1 a2 b2
2 a3 b3


## Lambda & MapReduce

### Lambda
- 함수 이름 없이, 함수처럼 쓸 수 있는 익명함수
- 수학의 람다 대수에서 유래함

In [25]:
# General Function
def f(x, y) :
    return x + y

print(f(1, 4))

# Lambda Function
f = lambda x, y : x + y
print(f(1, 4))

5
5


### Map & Reduce

### Map
- Sequence 자료형 각 element에 동일한 function을 적용함

In [28]:
ex = [1, 2, 3, 4, 5]
f = lambda x : x ** 2
print(list(map(f, ex)))

ex = [1, 2, 3, 4, 5]
f = lambda x, y : x + y
print(list(map(f, ex, ex)))

[1, 4, 9, 16, 25]
[2, 4, 6, 8, 10]


### Reduce
- map과 달리 list에 똑같은 함수를 적용해서 통합

In [29]:
from functools import reduce
print(reduce(lambda x, y : x + y, [1, 2, 3, 4, 5]))

15


In [31]:
def factorial(n) :
    return reduce(lambda x, y : x * y, range(1, n + 1))

print(factorial(5))

120


## Asterisk
- 흔히 알고 있는 * 를 의미함
- 단순 곱셈, 제곱연산, 가변 인자 활용 등 다양하게 사용됨

In [32]:
def asterisk_test(a, *args) :
    print(a, args)
    print(type(args))

asterisk_test(1, 2, 3, 4, 5, 6)

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [35]:
def asterisk_test(a, **kargs) :
    print(a, kargs)
    print(type(kargs))

asterisk_test(1, b = 2, c = 3, d = 4, e = 5, f = 6)

1 {'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
<class 'dict'>


In [36]:
def asterisk_test(a, *args):
    print(a, args[0])
    print(type(args))

asterisk_test(1, (2, 3, 4, 5, 6))

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [37]:
# 함수 내부에서 *를 사용하면 unpacking 된 형태로 출력된다.
def asterisk_test(a, args):
    print(a, *args)     # unpacking
    print(type(args))

asterisk_test(1, (2,3,4,5,6))

1 2 3 4 5 6
<class 'tuple'>


In [38]:
a, b, c = ([1, 2], [3, 4], [5, 6])
print(a, b, c)

data = ([1, 2], [3, 4], [5, 6])
print(*data)

[1, 2] [3, 4] [5, 6]
[1, 2] [3, 4] [5, 6]


In [39]:
for data in zip(*([1, 2], [3, 4], [5, 6])):
    print(sum(data))

9
12


In [46]:
def asterisk_test(a, b, c, d, e=0):
    print(a, b, c, d, e)
    
data = {'d' : 1 , 'c' : 2, 'b' : 3} # 키워드 인자에 없는 값을 넣으면 오류난다.
asterisk_test(10, **data)

10 3 2 1 0


# Data Structure - Collections
- list, tuple, dict에 대한 python built-in 확장 자료 구조
- 편의성, 실행 효율 등을 사용자에게 제공함
- 아래의 모듈이 존재함
    - from collections import deque, Counter, OrderedDict, defaultdict, namedtuple

## deque
- Stack과 Queue를 지원하는 모듈
- 리스트에 비해 효율적인 자료 저장 방식을 지원함

In [47]:
from collections import deque
deque_list = deque()
for i in range(5) :
    deque_list.append(i)
print(deque_list)

deque([0, 1, 2, 3, 4])


In [48]:
deque_list.appendleft(10)
print(deque_list)

deque([10, 0, 1, 2, 3, 4])


## OrderedDict
- Dict와 달리, 데이터를 입력한 순서대로 dict를 반환함

In [50]:
from collections import OrderedDict
d = OrderedDict()
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k, v in d.items() :
    print(k, v)

x 100
y 200
z 300
l 500


In [54]:
# Dict type의 값을 value 또는 key 값으로 정렬할 때 사용 가능
# key 기준 정렬
for k, v in OrderedDict(sorted(d.items(), key = lambda t : t[0])).items() :
    print(k, v)

l 500
x 100
y 200
z 300


In [55]:
# value 기준 정렬
for k, v in OrderedDict(sorted(d.items(), key = lambda t : t[1])).items() :
    print(k, v)

x 100
y 200
z 300
l 500


## defaultdict
- dict type의 값에 기본 값을 지정, 신규값 생성시 사용하는 방법

In [59]:
from collections import defaultdict
d = defaultdict(object) # Default dictionary를 생성
d = defaultdict(lambda : 0) # Default 값을 0으로 설정함
print(d['first'])

0


## Counter
- Sequence type의 data element들의 갯수를 dict 형태로 반환

In [61]:
from collections import Counter

c = Counter()                           # a new, empty counter
c = Counter('gallahad')                 # a new counter from an iterable
print(c)

c = Counter({'red': 4, 'blue': 2})      # a new counter from a mapping
print(c)
print(list(c.elements()))

c = Counter(cats=4, dogs=8)             # a new counter from keyword args
print(c)
print(list(c.elements()))

c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d)  # c- d
print(c)

c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
print(c + d)
print(c & d)
print(c | d)

Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})
Counter({'red': 4, 'blue': 2})
['red', 'red', 'red', 'red', 'blue', 'blue']
Counter({'dogs': 8, 'cats': 4})
['cats', 'cats', 'cats', 'cats', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs']
Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})
Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2})
Counter({'b': 2, 'a': 1})
Counter({'a': 4, 'd': 4, 'c': 3, 'b': 2})


## namedtuple
- Tuple 형태로 Data 구조체를 저장하는 방법
- 저장되는 data의 variable을 사전에 지정해서 저장함

In [60]:
from collections import namedtuple

# Basic example
Point = namedtuple('Point', ['x', 'y'])
p = Point(11, y=22)
print(p[0] + p[1])

x, y = p
print(x, y)
print(p.x + p.y)
print(Point(x=11, y=22))

33
11 22
33
Point(x=11, y=22)


# Linear Algebra

## Vector representation of python
- Vector를 파이썬으로 표시하는 다양한 방법 존재
- 최선의 방법은 없음
- 값의 변경 유무, 속성값 유무에 따라 선택할 수 있음
- 본 수업에서는 기본적으로 list로 vector 연산 실시


In [62]:
# vector의 계산 (기본)
u = [2, 2]
v = [2, 3]
z = [3, 5]
result = []
for i in range(len(u)):
    result.append(u[i] + v[i] + z[i])
print(result)

[7, 10]


In [63]:
# Pythonic code를 사용한 계산
u = [2, 2]
v = [2, 3]
z = [3, 5]
result = [sum(t) for t in zip(u, v, z)]
print (result)


[7, 10]


In [64]:
# Vector의 계산 : Scalar-Vector product
u = [1, 2, 3]
v = [4, 4, 4]
alpha = 2
result = [alpha * sum(t) for t in zip(u, v)]
print(result)   # 2([1, 2, 3] + [4, 4, 4]) = 2[5, 6, 7] = [10, 12, 14]

[10, 12, 14]


## Matrix representation of python
- Matrix 역시 Python으로 표시하는 다양한 방법이 존재
- 특히 dict로 표현할 때는 무궁무진한 방법이 있음
- [[1번째row], [2번째row], [3번째row]]


In [65]:
# Matrix의 계산 : Matrix addition
matrix_a = [[3, 6], [4, 5]]
matrix_b = [[5, 8], [6, 7]]
result = [[sum(row) for row in zip(*t)] for t in zip(matrix_a, matrix_b)]
print(result)

[[8, 14], [10, 12]]


In [66]:
# Matrix의 계산 : Scalar-Matrix Product
matrix_a = [[3, 6], [4, 5]]
alpha = 4
result = [[alpha * element for element in t] for t in matrix_a]
print(result)

[[12, 24], [16, 20]]


In [67]:
# Matrix의 계산 : Matrix Transpose
matrix_a = [[1, 2, 3], [4, 5, 6]]
result = [ [element for element in t] for t in zip(*matrix_a) ]
print (result)

[[1, 4], [2, 5], [3, 6]]


In [68]:
# Matrix의 계산 : Matrix Product
matrix_a = [[1, 1, 2], [2, 1, 1]]
matrix_b = [[1, 1], [2, 1], [1, 3]]
result = [[sum(a * b for a, b in zip(row_a, column_b)) \
for column_b in zip(*matrix_b)] for row_a in matrix_a]
print(result)

[[5, 8], [5, 6]]
