# 효율적인 코딩 및 파이썬 기능 활용 ( 함수, 이터레이터, 제너레이터)
---
## 1. __변수 대입 방법__
#### 1) 언패킹
##2. __함수__
#### 1) 클로저
##3. __컴프리헨션 및 제너레이터__
#### 1) 컴프리헨션
#### 2) 제너레이터

## 1. 변수 대입 방법
---
### 1) 언패킹

* 패킹 : 여러 개의 데이터를 컬렉션으로 묶어 변수에 대입하는 것 <br>
 ex) numbers = [1,2,3,4,5]

* 언패킹 : 컬렉션 속의 요소들을 여러 개의 변수에 나누어 대입 <br>
 ex) a,b,c,d,e = numbers        # a,b,c,d,e = [1,2,3,4,5]
<br><br>
* 대입하고 싶지 않은 요소는 관례적으로 _ 변수로 설정 <br>
 ex) a,b,c,_,d = [5,6,7,8,9] <br>
   print(a,b,c,d) <br>
   -> 5,6,7,9
<br><br>
* 언패킹을 사용하는 경우 임시 변수를 정의하지 않고도 값을 바꿀 수 있음 <br>
 ex) a[i]와 a[i-1]을 바꾸고 싶은 경우 <br>
 temp = a[i] <br>
 a[i] = a[i-1] <br>
 a[i-1] = temp <br>
 ↓ <br>
 a[i-1],a[i] = a[i], a[i-1]

In [None]:
%%time
snacks = [('베이컨', 350), ('도넛', 240), ('머핀', 190)]

for i in range(len(snacks)):
    item = snacks[i]
    name = item[0]
    calories = item[1]
    print(f'#{i+1}: {name} 은 {calories} 칼로리입니다.')

#1: 베이컨 은 350 칼로리입니다.
#2: 도넛 은 240 칼로리입니다.
#3: 머핀 은 190 칼로리입니다.
CPU times: user 1.65 ms, sys: 183 µs, total: 1.83 ms
Wall time: 18.3 ms


* 같은 기능을하는 함수를 enumerate 함수와 언패킹을 사용하여 만든 결과 코드길이와 수행시간 짧아졌음 <br>
 +) enumerate를 사용하는 경우 해당 변수의 인자들을 하나씩 접근할 수 있게 만들어줌

In [None]:
%%time
for rank, (name, calories) in enumerate(snacks, 1):
    print(f'#{rank}: {name} 은 {calories} 칼로리입니다.')

#1: 베이컨 은 350 칼로리입니다.
#2: 도넛 은 240 칼로리입니다.
#3: 머핀 은 190 칼로리입니다.
CPU times: user 1.91 ms, sys: 0 ns, total: 1.91 ms
Wall time: 1.9 ms


<br><br>

## 2. 함수
---
### 1) 클로저

* 파이썬에서 함수는 일급 객체로서, 변수에 할당할 수 있고 매개변수로 전달할 수 있으며, 리턴값으로도 사용될 수 있음<br><br>
* 클로저 : 어떤 함수의 내부 함수가 외부 함수의 변수를 참조할 때, 외부 함수가 종료된 후에도 내부 함수가 외부 함수의 변수를 참조할 수 있도록 어딘가에 저장하는 함수를 의미<br><br>

* 클로저는 다음 조건을 충족해야함<br>
 1. 어떤 함수의 내부 함수일 것
 2. 그 내부 함수가 외부 함수의 변수를 참조할 것
 3. 외부 함수가 내부 함수를 리턴할 것

In [None]:
def hello(msg):
    message = "Hi, " + msg
    def say():
        print(message)
    return say

f = hello("Fox") # => f=say
f()

Hi, Fox


* 수행과정<br>
 1. hello 함수에 “Fox”를 매개 변수 값으로 넘겨주며 실행
 2. message 변수에 매개변수를 이용하여 “Hi, Fox”라는 문자열 저장
 3. say 함수가 message를 참조
 4. say 함수 리턴
 5. f 변수가 say 함수 참조
 6. f 변수 실행(say함수 실행)
 7. f 변수는 message 변수를 출력

> 4단계에서 hello 함수는 역할을 마치고 종료되었고 메모리에서도 삭제되었음
내부 변수인 message도 함께 삭제 되어야 하지만 6,7 단계에서 message 변수를 참조해서 출력

>> 클로저가 생성되었기 때문에 가능 : 중첩 함수인 say 함수가 외부 함수인 hello의 변수 message를 참조하기때문에 message 변수와 say의 환경을 저장하는 클로저가 동적으로 생성되었고 f 가 실행될 때는 해당 클로저를 참조하여 message 값을 출력할 수 있는 것. 해당 클로저는 f 변수에 say 함수가 할당될 때 생성됨.

In [None]:
dir(f) # f에 존재하는 변수명, 함수명, 클래스 이름을 출력

['__annotations__',
 '__builtins__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

*  '__closure__' 튜플은 모든 함수 객체가 가지고 있지만 조건을 만족하지 않아 클로저가 생성되지 않으면 그 값은 None으로 고정

In [None]:
import inspect
inspect.getclosurevars(f).nonlocals    # 함수 f의 클로저가 참조하는 외부 범위의 변수들에 대한 정보 확인

{'message': 'Hi, Fox'}

In [None]:
def sort_priority(values, group):
    def helper(x):
        if x in group:
            return (0, x)
        return (1, x)
    values.sort(key=helper)


numbers = [8, 3, 1, 2, 5, 4, 7, 6]
group = {2, 5, 3, 7}
sort_priority(numbers, group)
print(numbers)

[2, 3, 5, 7, 1, 4, 6, 8]


> 의도한 대로 잘 작동하는 이유 <br>
 1. 파이썬이 클로저를 지원 : 클로저란 자신이 정의된 영역 밖의 변수를 참조하는 함수, 이로 인해 helper함수가 sort_priority의 group 인자에 접근 가능  <br><br>
 2. 파이썬에서 함수는 일급 객체로서, 변수에 할당할 수 있고, 매개 변수로 전달할 수 있으며 리턴값으로도 사용가능 <br><br>
 3.파이썬에서 시퀀스를 비교할 때 0번 인덱스 값을 비교한 뒤 이 값이 같은 경우 다시 1번 인덱스에 있는 값을 비교

* 장점 : <br>무분별한 전역변수 사용을 방지할 수 있음 -
클로저 대신 전역변수를 선언하여 사용할 수는 있으나 이렇게 되면 변수가 섞일 수도 있고 변수의 책임범위를 명확하게 할 수 없는 문제가 발생할 수 있음 <br><br>
외부 함수의 실행이 종료되더라도 클로저가 참조하는 변수들이 사라지지 않고 유지되므로, 이후에 클로저가 호출될 때에도 변수들에 접근할 수 있음. 이는 필요한 상태만 유지하면서 메모리 사용을 최소화<br><br>

## 3. 컴프리헨션 및 제너레이터
---
### 1) 컴프리헨션

* 컴프리헨션 : 파이썬의 자료구조에 데이터를 좀 더 쉽고 간결하게 담기 위한 문법<br>
* 사용법 : 리스트의 경우, 대괄호([ ])로 감싼 뒤 내부에 for 문과 if 문을 사용하여 조건에 만족하는 값만 리스트로 생성
* 장점 : 직관적, 코드 길이, 동작 속도 감소

In [None]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [None]:
# 리스트 컴프리헨션 사용하지 않는 경우
%%time
squares = []
for x in a:
    squares.append(x**2)
print(squares)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
CPU times: user 1.07 ms, sys: 4 µs, total: 1.07 ms
Wall time: 1.08 ms


In [None]:
# 리스트 컴프리헨션 사용하는 경우
%%time
squares = [x**2 for x in a]
print(squares)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
CPU times: user 939 µs, sys: 0 ns, total: 939 µs
Wall time: 948 µs


* 컴프리헨션문 안에는 여러 개의 for문, if문이 올 수 있음 (중첩 가능)

In [None]:
data = []
for i in range(1, 11):
    if i % 2 == 0:
        data.append(i)

# 컴프리헨션 사용하여 작성
data = [i for i in range(1, 11) if i % 2 == 0]

In [None]:
data2 = []
for i in range(1,6):
    for j in range(1,4):
        data2.append((i,j))

# 컴프리헨션 사용하여 작성
data2 = [(i,j) for i in range(1,6) for j in range(1,4)]

In [None]:
# 번외 : 간단한 나열의 경우 range 이용하여 리스트 생성 가능 <- 조건 및 함수 적용이 제한적
list(range(5))

[0, 1, 2, 3, 4]

* 딕셔너리 컴프리헨션, 집합 컴프리헨션, 제너레이터 컴프리헨션은 다음과 같이 작성 가능

In [None]:
even_squares_dict = {x: x**2 for x in a if x % 2 == 0}
threes_cubed_set = {x**3 for x in a if x % 3 == 0}
print(even_squares_dict)
print(threes_cubed_set)

# +) 제너레이터 컴프리헨션도 존재
simple_generator = (i+10 for i in range(10))
print(simple_generator)

{2: 4, 4: 16, 6: 36, 8: 64, 10: 100}
{216, 729, 27}
<generator object <genexpr> at 0x7bd720e89fc0>


* 입력의 길이가 긴 상황에서 리스트 컴프리헨션을 사용하는 경우, 메모리를 상당히 많이 사용하고 그로 인해 프로그램이 중단 될 수 있음 -> 제너레이터 컴프리헨션을 쓰는 것이 더 효율적이다.

<br><br>

### 2) 제너레이터

* 제너레이터 : 이터레이터(반복자)를 만드는 함수

* 이터레이터 : 객체가 가진 각 요소에 순차적으로 접근 할 수 있게 해주는 도구

* 어떤 함수의 결과를 시퀀스 형태로 나타내고 싶을 때 사용하는 가장 간단한 방법은 리스트를 이용하여 반환하는 것

In [None]:
# 문자열에서 찾은 단어의 인덱스를 반환
def index_words(text):
    result = []
    if text:
        result.append(0)
    for index, letter in enumerate(text):
        if letter == ' ':
            result.append(index + 1)
    return result

text = '컴퓨터(영어: Computer, 문화어: 콤퓨터, 순화어:전산기)는 진공관'
result = index_words(text)
print(result[:10])

[0, 8, 18, 23, 28, 38]


* 그러나 이와 같은 방식으로 동작을 수행하는 경우의 문제점 2가지가 존재함<br>
 1. 코드의 가독성이 떨어짐 <br>
 2. 반환하기 전에 리스트에 모든 결과를 append 및 저장 <br> -> 입력이 매우 크면 프로그램이 메모리를 소진해서 중단될 수 있음<br><br>
* 이를 개선하기 위한 방법으로 제너레이터를 사용

In [None]:
# text 한줄을 대상으로 작성한 코드 (return 대신 yield 사용)
def index_words_iter(text):
    if text:
        yield 0
    for index, letter in enumerate(text):
        if letter == ' ':
            yield index + 1

# text가 여러줄을 가진 파일을 대상을 작성한 코드 -> 작업 메모리가 입력 중 가장 긴 줄의 길이로 제한
def index_file(handle):
    offset = 0
    for line in handle:
        if line:
            yield offset
        for letter in line:
            offset += 1
            if letter == ' ':
                yield offset

# 일반적인 방법
# def traditional_method(handle):
#     lines = [handle.split('\n')]
#     for line in lines:
#         ...

* 해당 함수가 호출되는 경우 제너레이터 함수가 실제로 실행되지 않고 즉시 이터레이터를 반환

* 해당 이터레이터가 next 함수를 호출할 때마다 이터레이터는 제너레이터 함수를 다음 yield 식 까지 진행시킴 <br>
함수가 끝나는 경우 StopIteration 예외를 발생시킴

* iterable : 반복 가능한 객체 (제너레이터의 인자)<br>
 iterator : next 함수를 사용하여 차례대로 값을 꺼낼 수 있는 객체 (제너레이터의 출력값)

In [None]:
text = '컴퓨터(영어: Computer, 문화어: 콤퓨터, 순화어:전산기)는 진공관'
it = index_words_iter(text)
print(it)
print(next(it))
print(next(it))

# 제너레이터가 반환하는 이터레이터를 리스트 함수에 넣으면 제너레이터를 쉽게 리스트로 변환 가능
# result = list(index_words_iter(address))
# print(result[:10])

<generator object index_words_iter at 0x7bd6e2f97bc0>
0
8


In [None]:
print(list(it))
print(list(it))

[18, 23, 28, 38]
[]


* 제너레이터의 장점<br>
1. 제너레이터는 큰 크기를 갖는 데이터를 대상으로 동작을 실행할 때 메모리 용량을 적게 사용함

In [None]:
import sys
test_num = 10000000
generator1 = (i for i in range(test_num))
list1 = list(range(test_num))

print('generator1의 용량 :', sys.getsizeof(generator1))  # 메모리 사이즈 반환
print('list1의 용량 :', sys.getsizeof(list1))

generator1의 용량 : 104
list1의 용량 : 80000056


* 단점<br>
1. 제너레이터는 일방향으로 진행되기 때문에 이전 변수를 참조하기 어려움 <br>
2. 계산 속도가 일반적으로 느림

+) 추가적으로 iter 함수를 사용하여 이터레이터를 만들 수 있음

In [None]:
# iter 함수를 사용 (리스트, 튜플, 딕셔너리에서 사용 가능)
list1 = [1,2,3,4,5]
i=iter(list1)
print(next(i))
print(next(i))
print(next(i))

* 이터레이션 프로토콜 <br>
파이썬의 for 루프나 그와 연관된 식들이 컨테이너 타입의 내용을 방문할 때 사용하는 절차를 의미 <br><br>
for x in foo 와 같은 구문 사용하면, 실제로 foo.\_\_iter__라는 특별 메서드를 호출하여 이터레이터 객체가 데이터를 소진할 떄까지 next 내장 함수를 호출 <br><br>
'\_\_iter__', '\_\_next__' 메서드를 사용하여 이터레이터 생성 가능

In [None]:
class Counter:
    def __init__(self, stop):
        self.current = 0
        self.stop = stop

    def __iter__(self):
        return self

    def __next__(self):
        if self.current < self.stop:
            r = self.current
            self.current += 1
            return r
        else:
            raise StopIteration

for i in Counter(3):
    print(i, end=' ')

# it = Counter(3)
# next(it)
# next(it)
# next(it)

0 1 2 

* 여러 제너레이터를 함께 사용하는 경우 yield 대신 yield from을 사용하면 코드 가독성과 성능이 향상됨

In [None]:
def move(period, speed):
    for _ in range(period):
        yield speed

def pause(delay):
    for _ in range(delay):
        yield 0

# yield 사용
def animate():
    for delta in move(4, 5.0):
        yield delta
    for delta in pause(3):
        yield delta
    for delta in move(2, 3.0):
        yield delta

# yield from 사용
def animate_composed():
    yield from move(4, 5.0)
    yield from pause(3)
    yield from move(2, 3.0)

In [None]:
def code1():
    for x in animate():
        pass

%timeit code1()

1.21 µs ± 248 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [None]:
def code2():
    for x in animate_composed():
        pass

%timeit code2()

1.18 µs ± 237 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
