## Pythonic Code

#### ◽파이썬 스타일의 코딩 기법
#### ◽파이썬 특유의 문법을 활용하여 효율적으로 코드를 표현함
#### ◽고급 코드를 작성할 수록 더 많이 필요해짐

<br>
<br>

- 여러 단어들을 하나로 붙일 때 일반적으로 다음과 같이 사용 

In [1]:
colors = ['red','blue','green','yellow']
result = ''

for s in colors:
    result += s

In [2]:
result

'redbluegreenyellow'

- 파이썬에서는 join을 통해 하나로 합칠 수 있음 

In [3]:
colors = ['red','blue','green','yellow']
result = ''.join(colors)

result

'redbluegreenyellow'

## ◽Split & Join
## ◽List Comprehension
## ◽Enumerate & Zip

#### split 함수 
- String type의 값을 나눠서 list 형태로 변환 

In [5]:
items = 'zero one two trhee'.split()  # 빈칸을 기준으로 문자열 나누기
print(items)

['zero', 'one', 'two', 'trhee']


In [6]:
example = 'python,jquery,javascript'
example.split(',')  # ','을 기준으로 문자열 나누기 

['python', 'jquery', 'javascript']

In [7]:
a,b,c = example.split(',')   # 리스트에 있는 각 값을 a,b,c 변수로 unpacking

In [8]:
print(a)
print(b)
print(c)

python
jquery
javascript


In [9]:
example = 'cs50.gachon.edu'

In [11]:
subdomain, domain, tld = example.split('.') # '.'을 기준으로 문자열 나누기 unpacking

In [13]:
print(subdomain)
print(domain)
print(tld)

cs50
gachon
edu


#### join 함수 
- String list를 합쳐 하나의 string으로 반환할 때 사용 

In [15]:
colors = ['red','blue','green','yellow']
result = ''.join(colors)  # 매개변수로 list 입력 
result

'redbluegreenyellow'

In [16]:
result = ' '.join(colors)  # 연결 시 빈칸 1개로 연결
result

'red blue green yellow'

In [17]:
result = ', '.join(colors)  # 연결 시 ', '로 연결
result

'red, blue, green, yellow'

In [18]:
result = '-'.join(colors)  # 연결 시 '-'로 연결
result

'red-blue-green-yellow'

#### List comprehension 함수 
- 기존 List 사용해서 간단히 다른 List를 만드는 기법
- 포괄적인 list, 포함되는 리스트라는 의미로 사용됨
- 파이썬에서 가장 많이 사용되는 기법 중 하나 
- 일반적으로 for + append 보다 속도가 빠름 

In [20]:
# 일반적인 for append 방식

result = []
for i in range(10):
    result.append(i)

result

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [22]:
# 파이썬의 list comprehension 방식 

result = [i for i in range(10)]  # 변수 지정 후 한 줄로 for문 작성 
result

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [23]:
result = [i for i in range(10) if i % 2 ==0]  # 짝수만 출력하는 필터
result

[0, 2, 4, 6, 8]

In [25]:
# nested for loop 이용해서 1 Dimension 구조 생성 

word_1 = 'hello'
word_2 = 'world'

result = [i+j for i in word_1 for j in word_2]   # for문 안에 for문 넣기
result 

['hw',
 'ho',
 'hr',
 'hl',
 'hd',
 'ew',
 'eo',
 'er',
 'el',
 'ed',
 'lw',
 'lo',
 'lr',
 'll',
 'ld',
 'lw',
 'lo',
 'lr',
 'll',
 'ld',
 'ow',
 'oo',
 'or',
 'ol',
 'od']

In [26]:
case_1 = ['A','B','C']
case_2 = ['D','E','A']

result = [i+j for i in case_1 for j in case_2 if not (i==j)] # i랑 j가 같으면 list 추가 안함 
result

['AD', 'AE', 'BD', 'BE', 'BA', 'CD', 'CE', 'CA']

In [27]:
result.sort()
result

['AD', 'AE', 'BA', 'BD', 'BE', 'CA', 'CD', 'CE']

In [29]:
# 빈칸으로 나누어 리스트 만들기 

words = 'The quick brown fox jumps over the lazy dog'.split()
print(words)

['The', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']


In [32]:
# list의 각 element들을 대문자, 소문자, 길이로 변환하여 
# two dimension의 list로 변환 

stuff = [[w.upper(), w.lower(),len(w)] for w in words] # for문 앞에 [] 를 만들어 줌으로 two dimension 생성 가능

In [34]:
stuff  # 리스트 element가 [대문자, 소문자, 문자길이] 로 이루어진 list

[['THE', 'the', 3],
 ['QUICK', 'quick', 5],
 ['BROWN', 'brown', 5],
 ['FOX', 'fox', 3],
 ['JUMPS', 'jumps', 5],
 ['OVER', 'over', 4],
 ['THE', 'the', 3],
 ['LAZY', 'lazy', 4],
 ['DOG', 'dog', 3]]

In [35]:
for i in stuff:
    print(i)

['THE', 'the', 3]
['QUICK', 'quick', 5]
['BROWN', 'brown', 5]
['FOX', 'fox', 3]
['JUMPS', 'jumps', 5]
['OVER', 'over', 4]
['THE', 'the', 3]
['LAZY', 'lazy', 4]
['DOG', 'dog', 3]


In [38]:
stuff_ele = [print(i) for i in stuff]

['THE', 'the', 3]
['QUICK', 'quick', 5]
['BROWN', 'brown', 5]
['FOX', 'fox', 3]
['JUMPS', 'jumps', 5]
['OVER', 'over', 4]
['THE', 'the', 3]
['LAZY', 'lazy', 4]
['DOG', 'dog', 3]


In [41]:
case_1 = ['A','B','C']
case_2 = ['D','E','F']

result = [a+b for a in case_1 for b in case_2]
print(result)

result2 = [[a+b for a in case_1] for b in case_2]  # 뒤에 있는 for문이 고정되어 한 list로 출력
print(result2)

['AD', 'AE', 'AF', 'BD', 'BE', 'BF', 'CD', 'CE', 'CF']
[['AD', 'BD', 'CD'], ['AE', 'BE', 'CE'], ['AF', 'BF', 'CF']]


#### Enumerate  
- list의 element를 추출할 때 번호를 붙여서 추출 

In [42]:
for i, v in enumerate(['tic','tac','toe']):
    # list의 있는 index와 값을 unpacking
    print(i,v)

0 tic
1 tac
2 toe


- list에 있는 값을 index 값과 unpacking하여 (,)구조의 리스트로 저장 

In [44]:
mylist = ['a','b','c','d']
list(enumerate(mylist))

[(0, 'a'), (1, 'b'), (2, 'c'), (3, 'd')]

- 문장을 빈칸으로 split하고 index 값과 unpacking하여 dict으로 저장 

In [46]:
# 단어들의 위치를 뽑을 때 아래같이 사용하곤 함 

{i:j for i,j in enumerate('Gachon University is an academic institute located in South Korea'.split())}

{0: 'Gachon',
 1: 'University',
 2: 'is',
 3: 'an',
 4: 'academic',
 5: 'institute',
 6: 'located',
 7: 'in',
 8: 'South',
 9: 'Korea'}

#### Zip  
- 두 개의 list의 값을 병렬적으로 추출함 

In [47]:
alist = ['a1','a2','a3']
blist = ['b1','b2','b3']

# 병렬적으로 값을 추출 
for a,b in zip(alist, blist):
    print(a,b)


a1 b1
a2 b2
a3 b3


In [49]:
# 각 tuple의 같은 index 끼리 묶음 
a,b,c = zip((1,2,3),(10,20,30),(100,200,300)) 

a,b,c

((1, 10, 100), (2, 20, 200), (3, 30, 300))

In [50]:
# 각 tuple의 같은 index를 묶어 합을 list로 변환 
# 위에서 zip된 a,b,c를 각각 더한 값이 출력됨 
# 벡터를 계산할 때 쉽게 할 수 있음 

[sum(x) for x in zip((1,2,3),(10,20,30),(100,200,300))]

[111, 222, 333]

- Enumerate & Zip

In [52]:
alist = ['a1','a2','a3']
blist = ['b1','b2','b3']

for i, (a,b) in enumerate(zip(alist,blist)):
    print(i,a,b)  # index, alist[index], blist[index] 표시

0 a1 b1
1 a2 b2
2 a3 b3


#### Lambda 
- 함수 이름 없이, 함수처럼 쓸 수 있는 익명함수
- 수학의 람다 대수에서 유래함 

In [54]:
# 일반적인 방식 

def f(x,y):
    return x+y 
print(f(1,4))

# Lambda 방식 

f = lambda x,y: x+y
print(f(1,4))

5
5


In [55]:
f = lambda x,y: x+y
print(f(1,4))

5


In [56]:
f = lambda x: x**2
print(f(3))

9


In [57]:
f = lambda x: x/2
print(f(3))

1.5


In [58]:
# f로 지정하지 않아도 사용할 수 있음 

print((lambda x: x+1)(5))

6


#### Map function 
- Sequence 자료형 각 element에 동일한 function을 적용함 
(* sequence 자료형 : list, tuple)
- map(fuction_name,list_data) 

In [60]:
ex = [1,2,3,4,5]
f = lambda x: x**2

print(list(map(f,ex)))   # list(map(람다함수, 적용할 리스트))  list 꼭 붙이기

[1, 4, 9, 16, 25]


In [62]:
f = lambda x,y : x+y        # lambda 함수의 인자가 2개 
print(list(map(f,ex,ex)))   # lambda 함수 인자에 맞춰, 리스트도 2개 입력 

[2, 4, 6, 8, 10]


In [63]:
list(map(lambda x : x**2 if x % 2 == 0 else x, ex)) # lambda에 필터 넣을 때, else 필수

[1, 4, 3, 16, 5]

In [64]:
[value ** 2 for value in ex] 

[1, 4, 9, 16, 25]

In [66]:
ex = [1,2,3,4,5]

print(list(map(lambda x : x+x, ex)))
print((map(lambda x :x+x, ex)))   # list를 안붙이면 값이 안나오고 형식이 출력됨

[2, 4, 6, 8, 10]
<map object at 0x0000016E4CC64550>


In [68]:
# list를 안쓰고 iterater를 만들어서 쓸 수도 있다 

f = lambda x : x**2
print(map(f,ex))

for i in map(f,ex):
    print(i)

<map object at 0x0000016E4CC6BE20>
1
4
9
16
25


#### Reduce function 
- map function과 달리 list에 똑같은 함수를 적용해서 통합

In [70]:
from functools import reduce

print(reduce(lambda x,y: x+y,[1,2,3,4,5]))

# 1+2 = 3 
# + 3 = 6
# + 4 = 10
# + 5 = 15    x+y 순서대로 누적 합계 

15


In [71]:
def factorial(n):
    return reduce(lambda x,y : x*y, range(1, n+1))  # range에서 순서대로 생성

factorial(5)   # 5! = 5*4*3*2*1

120

In [72]:
5*4*3*2*1

120

#### Asterisk 
- 흔히 알고 있는 * 를 의미함 
- 단순 곱셈, 제곱연산, 가변 인자 활용 등 다양하게 사용됨

In [1]:
# *args

def asterisk_test(a, *args):
    print(a,args)
    print(type(args))

asterisk_test(1,2,3,4,5,6)

# 몇개의 인자를 받을 수 있을지 모를 때, *를 사용함 (가변인자)
# 가장 앞에 있는 1만 a에 대입되고, 나머지는 args로 tuple로 대입됨 

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [2]:
# **kargs

def asterisk_test(a, **kargs):
    print(a, kargs)
    print(type(kargs))

asterisk_test(1, b=2, c=3, d=4, e=5, f=6)

# 키워드 인자를 한 번에 넣어줄 때, ** 를 두개 사용 
# 키워드 인자는 a=1, b=2와 같은 인자를 뜻함, kargs에 dict타입으로 대입됨 

1 {'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}
<class 'dict'>


#### Asterisk - unpacking a container
- tuple, dict 등 자료형에 들어가 있는 값을 unpacking
- 함수의 입력값, zip 등에 유용하게 사용가능

In [None]:
def asterisk_test(a, *args):
    print(a, args[0])   # [0]를 입력안해주면, ((),) 형태로 출력됨 
    print(type(args))

asterisk_test(1, (2,3,4,5,6)) # 괄호를 넣어서 인수가 1개로 쳐짐

In [3]:
def asterisk_test(a, *args):
    print(a, args)
    print(type(args))

asterisk_test(1, *(2,3,4,5,6)) # 괄호를 넣어서 인수가 1개로 쳐짐

1 (2, 3, 4, 5, 6)
<class 'tuple'>


In [5]:
def asterisk_test(a, args):
    print(a, *args)    # unpacking 효과 발휘됨 
    print(type(args))

asterisk_test(1, (2,3,4,5,6))

1 2 3 4 5 6
<class 'tuple'>


In [16]:
a,b,c = ([1,2],[3,4],[5,6])
print(a,b,c)               # a,b,c 에 각 인자가 unpacking되어 대입됨

data = ([1,2],[3,4],[5,6])
print(type(data))  # data의 type은 tuple 
print(data)        # data 튜플 전체가 출력
print(*data)       # data의 각 인자가 unpacking되어 출력 

[1, 2] [3, 4] [5, 6]
<class 'tuple'>
([1, 2], [3, 4], [5, 6])
[1, 2] [3, 4] [5, 6]


In [22]:
def asterisk_test(a,b,c,d,):
    print(a,b,c,d)

data = {"b":1, "c":2, "d":3}

asterisk_test(10, **data)  # asterisk_test의 인자와 동일한 key를 가진 dict의 값을 호출 

10 1 2 3


In [23]:
for data in zip(*([1,2],[3,4],[5,6])):
    print(data)

(1, 3, 5)
(2, 4, 6)


In [25]:
for data in zip([1,2],[3,4],[5,6]):
    print(data)

(1, 3, 5)
(2, 4, 6)


In [26]:
for data in zip(([1,2],[3,4],[5,6])):
    print(data)

([1, 2],)
([3, 4],)
([5, 6],)


In [31]:
def asterisk_test(a,b,c,d,e=0):
    print(a,b,c,d,e) 

data = {"d":1, "c":2, "b":3, "e":56}
asterisk_test(10, **data)

10 3 2 1 56


#### Data Structure - Collections
- List, Tuple, Dict에 대한 Python Built-in 확장 자료 구조(모듈)
- 편의성, 실행 효율 등을 사용자에게 제공함
- 아래의 모듈이 존재함

- ◽from collections import deque
- ◽from collections import Counter
- ◽from collections import OrderedDict
- ◽from collections import defaultdict
- ◽from collections import namedtuple

#### deque 
- Stack과 Queue를 지원하는 모듈
- List에 비해 효율적인 자료 저장 방식을 지원함 

In [33]:
from collections import deque

deque_list = deque()

for i in range(5):
    deque_list.append(i)

print(deque_list)

deque([0, 1, 2, 3, 4])


In [34]:
deque_list.appendleft(10)  # 스택에서 왼쪽으로 값이 들어감
print(deque_list)

deque([10, 0, 1, 2, 3, 4])


- rotate, reverse 등 Linked List의 특성을 지원함
- 기존 list 형태의 함수를 모두 지원함 

In [35]:
deque_list.rotate(2)
print(deque_list)

deque([3, 4, 10, 0, 1, 2])


In [36]:
deque_list.rotate(2)
print(deque_list)

deque([1, 2, 3, 4, 10, 0])


In [37]:
print(deque_list)
print(deque(reversed(deque_list)))

deque([1, 2, 3, 4, 10, 0])
deque([0, 10, 4, 3, 2, 1])


In [38]:
deque_list.extend([5,6,7])
print(deque_list)

deque([1, 2, 3, 4, 10, 0, 5, 6, 7])


In [40]:
deque_list.extendleft([5,6,7])  # 대입될 때는 왼쪽에 5먼저, 그 다음 6, 7로 실제 값은 765순
print(deque_list)

deque([7, 6, 5, 7, 6, 5, 1, 2, 3, 4, 10, 0, 5, 6, 7])


- deque 는 기존 list보다 효율적인 자료구조를 제공
- 효율적 메모리 구조로 처리 속도 향상 

In [45]:
## deque 

from collections import deque
import time

start_time = time.process_time()
deque_list = deque()

#Stack 
for i in range(10000):
    for i in range(10000):
        deque_list.append(i)
        deque_list.pop()

print(time.process_time() - start_time, "seconds")

2.1875 seconds


In [46]:
## general list 

import time

start_time = time.process_time()
just_list = []

for i in range(10000):
    for i in range(10000):
        just_list.append(i)
        just_list.pop()

print(time.process_time() - start_time, "seconds")

5.78125 seconds


#### OrderedDict 
- Dict와 달리, 데이터를 입력한 순서대로 dict를 반환함

In [48]:
from collections import OrderedDict

d = {}
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k,v in d.items():
    print(k,v)

x 100
y 200
z 300
l 500


In [49]:
d = OrderedDict()
d['x'] = 100
d['y'] = 200
d['z'] = 300
d['l'] = 500

for k,v in d.items():
    print(k,v)

x 100
y 200
z 300
l 500


- Dict type의 값을, vlaue 또는 key 값으로 정렬할 때 사용 가능 

In [50]:
for k,v in OrderedDict(sorted(d.items(), key=lambda t:t[0])).items():
    print(k,v)

l 500
x 100
y 200
z 300


In [51]:
for k,v in OrderedDict(sorted(d.items(), key=lambda t:t[1])).items():
    print(k,v)

x 100
y 200
z 300
l 500


#### defalutdict
- Dict type의 값에 기본 값을 지정, 신규값 생성시 사용하는 방법 

In [53]:
d = dict()
print(d["first"])    # 기존 dict는 값이 없이 dict를 선언한 뒤, first를 먹이면 에러가 남 

KeyError: 'first'

In [54]:
from collections import defaultdict
d = defaultdict(object)    # default dictionary를 생성 
d = defaultdict(lambda: 0) # default 값을 0으로 설정함 

print(d['first'])

0


In [59]:
text = """A press release is the quickest and easiest way to get free publicity. If well written, a press release can result in multiple published articles about your firm and its products. And that can mean new prospects contacting you asking you to sell to them. Talk about low-hanging fruit!
What's more, press releases are cost effective. If the release results in an article that (for instance) appears to recommend your firm or your product, that article is more likely to drive prospects to contact you than a comparable paid advertisement.
However, most press releases never accomplish that. Most press releases are just spray and pray. Nobody reads them, least of all the reporters and editors for whom they're intended. Worst case, a badly-written press release simply makes your firm look clueless and stupid.
For example, a while back I received a press release containing the following sentence: "Release 6.0 doubles the level of functionality available, providing organizations of all sizes with a fast-to-deploy, highly robust, and easy-to-use solution to better acquire, retain, and serve customers."
Translation: "The new release does more stuff." Why the extra verbiage? As I explained in the post "Why Marketers Speak Biz Blab", the BS words are simply a way to try to make something unimportant seem important. And, let's face it, a 6.0 release of a product probably isn't all that important.
As a reporter, my immediate response to that press release was that it's not important because it expended an entire sentence saying absolutely nothing. And I assumed (probably rightly) that the company's marketing team was a bunch of idiots.""".lower().split()

print(text)

# defaultdict를 사용하지 않는 경우 
word_count = {}

for word in text:
    if word in word_count.keys():
        word_count[word] += 1
    else:
        word_count[word] = 0
    
print(word_count)

['a', 'press', 'release', 'is', 'the', 'quickest', 'and', 'easiest', 'way', 'to', 'get', 'free', 'publicity.', 'if', 'well', 'written,', 'a', 'press', 'release', 'can', 'result', 'in', 'multiple', 'published', 'articles', 'about', 'your', 'firm', 'and', 'its', 'products.', 'and', 'that', 'can', 'mean', 'new', 'prospects', 'contacting', 'you', 'asking', 'you', 'to', 'sell', 'to', 'them.', 'talk', 'about', 'low-hanging', 'fruit!', "what's", 'more,', 'press', 'releases', 'are', 'cost', 'effective.', 'if', 'the', 'release', 'results', 'in', 'an', 'article', 'that', '(for', 'instance)', 'appears', 'to', 'recommend', 'your', 'firm', 'or', 'your', 'product,', 'that', 'article', 'is', 'more', 'likely', 'to', 'drive', 'prospects', 'to', 'contact', 'you', 'than', 'a', 'comparable', 'paid', 'advertisement.', 'however,', 'most', 'press', 'releases', 'never', 'accomplish', 'that.', 'most', 'press', 'releases', 'are', 'just', 'spray', 'and', 'pray.', 'nobody', 'reads', 'them,', 'least', 'of', 'all',

In [61]:
word_count = defaultdict(object)   # default dictionary를 생성
word_count = defaultdict(lambda:1) # default 값을 1으로 설정함

# word에서 text를 가져와서 바로 써버림
for word in text:
    word_count[word] += 1

for i,v in OrderedDict(sorted(word_count.items(), key=lambda t: t[1], reverse=True)).items():
    print(i,v)

# ordereddict를 사용해서 입력된 순서대로 출력 


a 13
to 11
the 10
and 10
press 9
release 9
that 8
of 6
your 5
in 4
firm 4
you 4
releases 4
are 4
all 4
i 4
is 3
way 3
if 3
can 3
about 3
new 3
prospects 3
an 3
article 3
more 3
most 3
for 3
simply 3
6.0 3
as 3
important. 3
was 3
quickest 2
easiest 2
get 2
free 2
publicity. 2
well 2
written, 2
result 2
multiple 2
published 2
articles 2
its 2
products. 2
mean 2
contacting 2
asking 2
sell 2
them. 2
talk 2
low-hanging 2
fruit! 2
what's 2
more, 2
cost 2
effective. 2
results 2
(for 2
instance) 2
appears 2
recommend 2
or 2
product, 2
likely 2
drive 2
contact 2
than 2
comparable 2
paid 2
advertisement. 2
however, 2
never 2
accomplish 2
that. 2
just 2
spray 2
pray. 2
nobody 2
reads 2
them, 2
least 2
reporters 2
editors 2
whom 2
they're 2
intended. 2
worst 2
case, 2
badly-written 2
makes 2
look 2
clueless 2
stupid. 2
example, 2
while 2
back 2
received 2
containing 2
following 2
sentence: 2
"release 2
doubles 2
level 2
functionality 2
available, 2
providing 2
organizations 2
sizes 2
with 2
fast-t

#### Counter
- Sequence type의 data element 들의 갯수를 dict 형태로 반환 

In [62]:
from collections import Counter

c = Counter()
c = Counter('gallahad')
print(c)

Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})


- Dict type, keyword parameter 등도 모두 처리 가능 

In [63]:
c = Counter({'red':4, 'blue':2})
print(c)
print(list(c.elements()))

Counter({'red': 4, 'blue': 2})
['red', 'red', 'red', 'red', 'blue', 'blue']


In [64]:
c = Counter(cats=4, dogs=8)
print(c)
print(list(c.elements()))

Counter({'dogs': 8, 'cats': 4})
['cats', 'cats', 'cats', 'cats', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs', 'dogs']


#### namedtuple
- Tuple 형태로 Data 구조체를 저장하는 방법
- 저장되는 data의 variable을 사전에 지정해서 저장함 

In [65]:
from collections import namedtuple

Point = namedtuple('point', ['x','y'])
p = Point(11, y=22)
print(p[0]+p[1])

33


In [66]:
x,y=p
print(x,y)
print(p.x + p.y)
print(Point(x=11, y=22))

11 22
33
point(x=11, y=22)
