<a href="https://colab.research.google.com/github/changyong93/KaggleStruggle/blob/main/210610_pythonic_coding.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Why Pythonic Code:
1. 남 코드에 대한 이해도
2. 효율
---
- split & join
- list comprehension
- enumerate & zip
- lambda & map & reduce
  - 단, PEP8에서 lambda,map ,reduce 함수를 지양하는 것을 권장함
  - lambda -> def로 대체, map -> list comprehension,
    - 어려운 문법, 테스트의 어려움, 문서의 docstring 지원 미비, 코드 해석의 어려움, 이름이 존재하지 않는 함수의 출현
    - 문제는 여전히 많이 쓰임
  - reduce : map func과 달리 list에 똑같은 함수를 적용해서 통합
    - 평소에는 잘 안쓰이나, 대용량의 데이터(ex, deep learning) 핸들링 시 사용
- generator
  - iterable object를 특수한 형태로 사용해주는 함수
    - iterables object
      -for i in [a,b,c]: 의 경우 a,b,c가 하나씩 꺼내져오는 이터러블 오브젝트인데, 내부적으로 __iter__, __next__ 가 사용됨
      - 즉 [a,b,c]를 iter([a,b,c])로 변수에 선언한 다음, next(변수명)를 출력할 때마다 순서대로 값이 출력됨
      - 단 데이터를 iter() -> next()를 불러오는 방식은 itertools.cycle()로 변수를 변환 후 next()로 가져오는 방식과 같음
  - element가 사용되는 시점에 값을 메모리에 반환하고 그 전에는 주소값만 가지고 있음
  - 결국 출력하기 전엔 주소값만 가지고 있으므로 데이터 용량을 상당히 절약할 수 있음
- asterisk(*)
  - 3*3 : 곱하기 연산 -> 9
  - 3**3 : 제곱연산 => 27
  - *args, **args : 함수의 args
    - *args : 함수에서 입력 데이터의 타입은 동일하나 개수가 정해지지 않은 경우
    - **args : parameter의 이름을 따로 지정하지 않고 사용하는 방법
      - 입력된 값은 dict type으로 사용 가능(ex, 크롤링 시 header 값)
  - 어떤 데이터의 *[] : unpacking
    - ex) test = [[1,2],[2,3],[3,4]]를 zip으로 해서 출력해도 list안의 list이므로 1,2 / 2,3등이 따로 출력되지 않음
    - 이 경우, for a,b in zip(*test)로 에스더리스크를 붙여서 쓰면 최외곽 괄호가 언패킹 됨
    - **data의 경우 dict type 언패킹 시 사용(키워드언패킹)


In [None]:
f = lambda x,y : x + y
f(10,50)

In [None]:
(lambda x,y : x+y)(10,50)

In [None]:
def f(x,y):
  return x + y
f(10,50)

In [None]:
li = [1,2,3,4,5]
print(list(map(lambda x : x**2, li)))

print([n**2 for n in li])

In [None]:
from functools import reduce
li = [1,2,3,4,5]

for i in range(1,len(li)+1):
  print("li의 i번째 idx까지 합",reduce(lambda x,y: x + y, li[:i]))

In [None]:
from itertools import cycle
li = cycle([1,2,3,4,5])

In [None]:
li = [1,2,3,4,5]
cy_li = iter(li)

In [None]:
next(cy_li)

In [None]:
def general_list(value):
  # result = [i in range(value)]
  result = []
  for i in range(value):
    result.append(i)
  return result

def generator_list(value):
  for i in range(value):
    yield i

In [None]:
import sys
general_li = general_list(10)
print("데이터 크기: ",sys.getsizeof(general_li),"|| 데이터: ", general_li)

generator_li = generator_list(10)
print("데이터 크기: ",sys.getsizeof(generator_li),"|| 데이터: ", generator_li)
#generator는 평소에는 값을 메모리에 안올려놓고 주소값만 가지고 있다가 print를 할 경우 yield가 값을 반환함
# 단 한 번만 print로 호출할 수 있음
for a in generator_li:
  print(a)

In [None]:
print("아무것도 호출 안됨")
for a in generator_li:
  print(a)

In [None]:
generator_li = generator_list(10)
generator_list = list(generator_li)
print("데이터 크기: ",sys.getsizeof(generator_list),"|| 데이터: ", generator_list)
print("generator로 생성한 것을 list로 해주면 값을 가지고 있떤 list형태보다 메모리는 작아짐")


## generator comprehension

In [None]:
gen_ex = (n*n for n in range(10))
type(gen_ex)

In [None]:
for i in gen_ex:
  print(i)

In [None]:
data = {"c":1, "d":2}
def asterisk_data(a,b,c,d):
  print(a,b,c,d)
asterisk_data(10,20, **data)  

In [None]:
data = {"a":1, "b":2}
def asterisk_data(a,b,c,d):
  print(a,b,c,d)
asterisk_data(c = 10,d = 20,**data)  