# 학습 목표
Pythonic Code 는 간단하게, 다른 사람의 코드를 잘 이해하기 위해서 파이썬 특유의 문법을 활용하여 효율적으로 코드를 표현하는 기법
이번 챕터에서는 Pythonic Code를 작성하는 방법과, Matrices와 Vector의 연산을 Pythonic Code로 구현하는 방법을 배웁니다.

- Split & Join
- List Comprehension
- Enumerate & Zip

In [6]:
# 여러 단어를 하나로 붙일 때

colors = ['red', 'blue', 'green', 'yellow']

# ' '.join(colors)
' '.join(colors).split()

['red', 'blue', 'green', 'yellow']

# Why Pythonic Code?

- 남 코드에 대한 이해도
    - 많은 개발자들이 python 스타일로 코딩한다.


- 효율
    - 단순 for loop append보다 list 가 조금 더 빠르다.
    - 익숙해지면 코드도 짧아진다.


- 간지
    - 쓰면 왠지 코드 잘 짜는 거처럼 보인다.

# Split & Join
- 학습목표
    - Split 과 Join 을 사용하여 String Type의 값을 List 형태로 변환하고, List Type의 값을 String Type의 값으로 변환하는 Pythonic Code 작성법을 알아봅시다.
    
    
- 핵심키워드
    - Split
    - Join
    - String
    - List
    - Unpacking

## Split 함수

In [8]:
items = 'zero one two three'.split()
items

['zero', 'one', 'two', 'three']

In [9]:
example = 'python,jquery,javascript'
example.split(",")

['python', 'jquery', 'javascript']

In [11]:
a, b, c = example.split(",")
a, b, c

('python', 'jquery', 'javascript')

In [13]:
example = 'cs50.gachon.edu'
subDomain, domain, tld = example.split('.')
subDomain, domain, tld

('cs50', 'gachon', 'edu')

## Join 함수
- String List를 합쳐 하나의 String으로 반환할 때 사용

In [14]:
colors = ['red', 'blue', 'green', 'yellow']
result = ''.join(colors)
result

'redbluegreenyellow'

In [15]:
result = ' '.join(colors)
result

'red blue green yellow'

In [16]:
result = ', '.join(colors)
result

'red, blue, green, yellow'

In [17]:
result = '-'.join(colors)
result

'red-blue-green-yellow'

# List Comprehension
- 학습목표
    - 파이썬에서 가장 많이 사용되는 기법 중에 하나인 List Comprehension을 사용하여 Pythonic Code를 작성하는 방법 학습
    
    
- 핵심키워드
    - List Comprehension
    - Nested For loop

In [1]:
# 일반적인 방법

result = []
for i in range(10):
    result.append(i)
result

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [3]:
# List Comprehension 사용(1/4)

result = [i for i in range(10)]
result

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [4]:
# List Comprehension 사용(2/4)

result = [i for i in range(10) if not i % 2]
result

[0, 2, 4, 6, 8]

In [14]:
# List Comprehension 사용(3/4)

word_1 = 'Hello'
word_2 = 'World'

# result = []
# for i in word_1:
#     for j in word_2:
#         result.append(i+j)

result = [i + j for i in word_1 for j in word_2] # Nested For Loop
result

['HW',
 'Ho',
 'Hr',
 'Hl',
 'Hd',
 'eW',
 'eo',
 'er',
 'el',
 'ed',
 'lW',
 'lo',
 'lr',
 'll',
 'ld',
 'lW',
 'lo',
 'lr',
 'll',
 'ld',
 'oW',
 'oo',
 'or',
 'ol',
 'od']

In [17]:
# List Comprehension 사용(3/4)

case_1 = ['A', 'B', 'C']
case_2 = ['D', 'E', 'A']

result = [i + j for i in case_1 for j in case_2]
result

result = [i + j for i in case_1 for j in case_2 if not (i==j)]
result

result.sort()
result

['AD', 'AE', 'BA', 'BD', 'BE', 'CA', 'CD', 'CE']

In [23]:
# List Comprehension 사용(4/4)

words = 'The quick brown fox jumps over the lazy dog'.split() # 문장을 띄어쓰기 기준으로 나눠준다.
print(words)
print()

# 2차원 배열이 생성된다.
stuff = [ [w.upper(), w.lower(), len(w)] for w in words]
stuff 

for i in stuff:
    print(i)

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']

['THE', 'the', 3]
['QUICK', 'quick', 5]
['BROWN', 'brown', 5]
['FOX', 'fox', 3]
['JUMPS', 'jumps', 5]
['OVER', 'over', 4]
['THE', 'the', 3]
['LAZY', 'lazy', 4]
['DOG', 'dog', 3]


# Enumerate & Zip
- 학습목표
    - 리스트 값을 추출할때 인덱스도 함께 추출할 수 있는 방법으로 이용되는 Enumerate
    - 두 개이상의 list값을 병렬적으로 추출할 수 있는 zip 함수를 사용
    
    
- 핵심키워드
    - enumerate()
    - zip()

## Enumerate

In [32]:
temp = ['tic', 'tac', 'toc']
for idx, val in enumerate(temp):
    print(idx, val)

mylist = ['a', 'b', 'c', 'd']
print( list(enumerate(mylist)) )

{ i:j for i, j in enumerate('Gacheon University is an academic institute located in South Korea.'.split()) }

0 tic
1 tac
2 toc
[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]


{0: 'Gacheon',
 1: 'University',
 2: 'is',
 3: 'an',
 4: 'academic',
 5: 'institute',
 6: 'located',
 7: 'in',
 8: 'South',
 9: 'Korea.'}

## Zip

In [41]:
alist = ['a1', 'a2', 'a3']
blist = ['b1', 'b2', 'b3']
for a, b in zip(alist, blist):
    print(a,b)
print()
    
a, b, c = zip((1,2,3), (10, 20, 30), (100, 200, 300)) # 각 tuple의 같은 index끼리 묶음
print(a, b, c)

[sum(x) for x in zip((1,2,3), (10,20,30), (100,200,300))]

a1 b1
a2 b2
a3 b3

(1, 10, 100) (2, 20, 200) (3, 30, 300)


[111, 222, 333]

In [42]:
alist = ['a1', 'a2', 'a3']
blist = ['b1', 'b2', 'b3']

for i, (a, b) in enumerate(zip(alist, blist)):
    print(i, a, b)

0 a1 b1
1 a2 b2
2 a3 b3


# Lambda & MapReduce
- 학습목표
    - 익명함수 lambda 와 Sequence 자료형의 데이터에서 함수를 적용하는 방법인 Map 과 Ruduce 에 대해서 실습
    

- 핵심키워드
    - Lambda
    - Map Function
    - Reduce Function

## Lambda

In [1]:
# 일반적인 함수 생성방법

def f(x, y):
    return x + y

f(1, 4)

5

In [3]:
# Lambda 사용

f = lambda x, y: x+y
f(1, 4)

5

In [7]:
f = lambda x, y: x + y
print(f(1, 4))

f = lambda x: x ** 2
print(f(3))

f = lambda x: x / 2
print(f(3))

print((lambda x: x+1)(5))

5
9
1.5
6


## Map Function

In [22]:
# Sequence 자료형 각 element에 동일한 function을 적용함
# map(적용할 함수, 시퀀스자료형)

ex = [1,2,3,4,5]

f = lambda x: x**2
print(list(map(f, ex)))
# print([val**2 for val in ex])

f = lambda x, y: x + y
print(list(map(f, ex, ex))) # zip 함수와 비슷한 효과를 낸다.

list(map(lambda x: x**2 if x % 2 == 0 else x, ex)) # 짝수면 제곱, 홀수면 그대로 출력

[1, 4, 9, 16, 25]
[1, 4, 9, 16, 25]
[2, 4, 6, 8, 10]


[1, 4, 3, 16, 5]

## Reduce function
- map function과 달리 list에 똑같은 함수를 적용해서 통합

In [24]:
from functools import reduce

print(reduce(lambda x,y: x+y, [1,2,3,4,5]))

15


In [39]:
def factorial(n):
    return reduce(lambda x, y: x*y, range(1, n+1))

factorial(4)

24

In [50]:
# Recursive Function (재귀함수)
def factorial(n):
    if n <= 0:
        return print('1이상의 수를 인자로 넣어주세요.')
    
    if n == 1:
        return 1
    else:
        return n * factorial(n-1)
    
factorial(-2)

1이상의 수를 인자로 넣어주세요.


# Asterisk
- 학습목표
    - 이번강의에서는 단순 곱셈, 제곱연산, 가변인자 활용 등 여러 부분에서 다양하게 사용되는 Asterisk(*) 의 사용법 학습
    
    
- 핵심키워드
    - Asterisk

In [51]:
# args (가변인자)
def asterisk_test(a, *args):
    print(a, args)
    print(type(args))

asterisk_test(1,2,3,4,5,6)

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [52]:
# kwargs (키워드인자)
def asterisk_test(a, **kwargs):
    print(a, kwargs)
    print(type(kwargs))

asterisk_test(1, b=2, c=3, d=4, e=5, f=6)

1 {'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
<class 'dict'>


In [54]:
# Unpacking a container
# tuple, dict 등 자료형에 들어가 있는 값을 Unpacking
# 함수의 입력값, zip 등에 유용하게 사용가능
temp = [1,2,3,4,5]
print(*temp)

1 2 3 4 5


In [57]:
def asterisk_test(a, *args):
    print(a, args)
    print(type(args))
    
asterisk_test(1, *(2,3,4,5,6))

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [58]:
def asterisk_test(a, args):
    print(a, *args)
    print(type(args))

asterisk_test(1, (2,3,4,5,6))

1 2 3 4 5 6
<class 'tuple'>


In [62]:
a, b, c = ([1, 2], [3, 4], [5, 6])
print(a, b, c)

data = ([1, 2], [3, 4], [5, 6])
print(*data)

[1, 2] [3, 4] [5, 6]
[1, 2] [3, 4] [5, 6]


In [69]:
def asterisk_test(a, b, c, d):
    print(a, b, c, d)

data = {'b':1, 'c':2, 'd':3}
asterisk_test(10, *data) # dict 타입을 Unpacking 할때 [* key, ** value] 로 된다.
asterisk_test(10, **data)

10 b c d
10 1 2 3


In [70]:
for data in zip(*([1, 2], [3, 4], [5, 6])):
    print(data)

(1, 3, 5)
(2, 4, 6)


# Data Structure - Collections
- 학습목표
    - tuple, dict에 대한 확장 데이터 구조를 제공하는 Collections 안에 포함된 모듈을 이용하여 Data Structure의 기본 개념을 이해하고 사용하는 방법을 알아봅니다.
    
    
- 핵심 키워드
    - Collections
    - Data Structure (자료구조)
    - deque
    - Counter
    - orderedDict
    - defaultdict
    - namedtuple


## Collections
- List, Tuple, Dict에 대한 Python Built-in 확장 자료 구조(모듈)
- 편의성, 실행 효율 등을 사용자에게 제공함
- 아래의 모듈이 존재한다.

In [72]:
from collections import deque, Counter, OrderedDict, defaultdict, namedtuple

from collections import deque
from collections import Counter
from collections import OrderedDict
from collections import defaultdict
from collections import namedtuple

### deque
- Stack과 Queue를 지원하는 모듈
- List에 비해 효율적인 자료 저장 방식을 지원함
- rotate, reverse등 Linked List의 특성을 지원함
- 기존 list 형태의 함수를 모두 지원함

In [86]:
from collections import deque

deque_list = deque() # 객체생성
for i in range(5):
    deque_list.append(i)
    
print(deque_list)

deque_list.appendleft(10)
print(deque_list)

deque([0, 1, 2, 3, 4])
deque([10, 0, 1, 2, 3, 4])


In [87]:
deque_list.rotate(2)
print(deque_list)
deque_list.rotate(2)
print(deque_list)

deque([3, 4, 10, 0, 1, 2])
deque([1, 2, 3, 4, 10, 0])


In [88]:
deque_list.extend([5, 6, 7])
print(deque_list)
deque_list.extendleft([5, 6, 7]) # 주의
print(deque_list)

deque([1, 2, 3, 4, 10, 0, 5, 6, 7])
deque([7, 6, 5, 1, 2, 3, 4, 10, 0, 5, 6, 7])


In [89]:
print(deque_list)
print(deque(reversed(deque_list)))

deque([7, 6, 5, 1, 2, 3, 4, 10, 0, 5, 6, 7])
deque([7, 6, 5, 0, 10, 4, 3, 2, 1, 5, 6, 7])


In [93]:
deque(reversed([1,2,3,4,5]))

deque([5, 4, 3, 2, 1])

### OrderedDict
- Dict와 달리, 데이터를 입력한 순서대로 dict를 반환함

In [109]:
from collections import OrderedDict

In [110]:
d = dict()
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k, v in d.items():
    print(k, v)

x 100
y 200
z 300
l 500


In [111]:
d = OrderedDict()
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k, v in d.items():
    print(k ,v)

x 100
y 200
z 300
l 500


In [114]:
for k, v in OrderedDict(sorted(d.items(), key=lambda t: t[0])).items():
    print(k, v)

print()

for k, v in OrderedDict(sorted(d.items(), key=lambda t: t[1])).items():
    print(k, v)

l 500
x 100
y 200
z 300

x 100
y 200
z 300
l 500


### defaultdict
- Dict type의 값에 기본 값을 지정, 신규값 생성시 사용하는 방법
- 파이썬 내장 Dict와 다르게 Key Error가 발생할 일이 없음, 없으면 기본값으로 생성하기 때문에

In [124]:
from collections import defaultdict

In [125]:
# 기존 dict - first라는 키값이 없어서 에러
d = dict()
print(d['first'])

KeyError: 'first'

In [126]:
d = defaultdict(object) # Default 값을 object로 설정
print(d['first'])

<object object at 0x7f8959d7bc50>


In [127]:
d = defaultdict(lambda: 0) # Default 값을 0으로 설정
print(d['first'])

0


In [145]:
# word_count 단어 빈도수 세기
text = 'word count hi hi word monkey'.split()

# 방법1
word_count = {}
for word in text:
    if word in word_count.keys():
        word_count[word] += 1
    else:
        word_count[word] = 1
print(dict(sorted(word_count.items(), key=lambda x:x[1], reverse=True)))

# 방법2
word_count = defaultdict(object)
word_count = defaultdict(lambda: 0)

for word in text:
    word_count[word] += 1

for i, v in OrderedDict(sorted(word_count.items(), key=lambda t: t[1], reverse=True)).items():
    print(i, v)

{'word': 2, 'hi': 2, 'count': 1, 'monkey': 1}
word 2
hi 2
count 1
monkey 1


### Counter
- Sequence type의 data element들의 갯수를 dict 형태로 반환

In [175]:
from collections import Counter

In [181]:
c = Counter()

# 카운터객체를 생성할때, 생성자로 Sequence 자료형을 주면, 그 갯수를 세어준다.
c = Counter(hamlet)
print(c)



### namedtuple
- Tuple 형태로 Data 구조체를 저장하는 방법
- 저장되는 data의 variable을 사전에 지정해서 저장함

In [197]:
from collections import namedtuple

In [201]:
Point = namedtuple('Point', ['x', 'y'])
p = Point(11, y=22)
print(p[0] + p[1])

33


In [204]:
x, y = p
print(x, y)
print(p.x, p.y)
print(Point(x=11, y=22))

11 22
11 22
Point(x=11, y=22)


# [번외] - 햄릿 소설의 단어 빈도수 카운트 하기

In [186]:
# 1. hamlet.txt 파일주소
import requests
res = requests.get('https://raw.githubusercontent.com/KennethJHan/blogdata/master/hamlet.txt')

# 2. 요청보낸 결과를 str으로 꺼내서 리스트로 전환하기
hamlet = res.text.lower().strip().split()

# 3. 단어 빈도수 세기
word_count = {}
for word in hamlet:
    if word in word_count:
        word_count[word] += 1
    else:
        word_count[word] = 1
        
# 4. 많이 나온 단어 순으로 정렬하여 다시 dict 형태로 변환하기
word_count = dict(sorted(word_count.items(), key=lambda x:x[1], reverse=True))

# 5. 출력
print(word_count)



In [196]:
# 방법2
from collections import Counter
# print(Counter(hamlet))
sorted(Counter(hamlet).items(), key=lambda x:x[1], reverse=True)[:10]

[('the', 1083),
 ('and', 939),
 ('to', 727),
 ('of', 670),
 ('a', 540),
 ('i', 523),
 ('my', 519),
 ('you', 433),
 ('in', 420),
 ('ham.', 358)]