# 컴프리헨션(comprehension)

컴프리헨션(comprehension)은 하나 이상의 이터레이터로부터 파이썬의 자료구조를 만드는 콤팩트한 방법이다. 

##### 컴프리헨션은 비교적 간편한 구문으로 반복문과 조건 테스트를 결합할 수 있도록 해준다. 

# 리스트 컴프리헨션

일반적으로 리스트를 만드는 방식은 아래와 같다. 

In [1]:
# list()함수와 append()함수를 사용.
number_list = list()
number_list.append(1)
number_list.append(2)
number_list.append(3)

print(number_list)

[1, 2, 3]


In [2]:
# 이터레이터와 range()함수를 사용하여 만든다. 
number_list = []

for number in range(1,4):
    number_list.append(number)
    
print(number_list)

[1, 2, 3]


In [3]:
# 리스트에 직접 range()를 넣어서 결과를 반환할 수 있다. 
number_list = list(range(1,4))

print(number_list)

[1, 2, 3]


이러한 방식은 유효하며 가능하지만 리스트 컴프리헨션을 사용해서 리스트를 만드는 것이 조금 더 파이써닉한 방식이다. 

#### [표현식 for 항목 in 순회 가능한 객체]

In [6]:
# 첫번째 number는 실제 list에 들어갈 number이다. 두 번째 number는 for문의 일부이다. 마지막으로 range(1,4) 는 실제 순회가능한 객체이다.
number_list = [number for number in range(1,4)]
print(number_list)

[1, 2, 3]


### 조건식과 함께 있는 리스트 컴프리헨션

#### [표현식 for 항목 in 순회가능한 조건 if 조건]

In [7]:
even_list = [number for number in range(1,11) if number % 2 == 0]
print(even_list)

[2, 4, 6, 8, 10]


### 중첩 리스트 컴프리헨션

리스트 컴프리헨션을 중첩으로 사용하면 아래와 같은 코드를 훨씬 짧게 파이써닉하게 사용할 수 있다. 

앞쪽에 위치할 for문일 수록 바깥쪽에 위치한 for문이다. 

In [8]:
fruits = ['apple', 'banana', 'peach']
drinks = ['coffee', 'tea', 'sprite']

for fruit in fruits:
    for drink in drinks:
        print(fruit, drink)

apple coffee
apple tea
apple sprite
banana coffee
banana tea
banana sprite
peach coffee
peach tea
peach sprite


In [9]:
# 중첩 리스트 컴프리헨션 사용하기.
[(fruit, drink) for fruit in fruits for drink in drinks]

[('apple', 'coffee'),
 ('apple', 'tea'),
 ('apple', 'sprite'),
 ('banana', 'coffee'),
 ('banana', 'tea'),
 ('banana', 'sprite'),
 ('peach', 'coffee'),
 ('peach', 'tea'),
 ('peach', 'sprite')]

In [10]:
# 세개로 해보기.
desserts = ['cake', 'ice_cream', 'jelly']

for fruit in fruits:
    for drink in drinks:
        for dessert in desserts:
            print(fruit, drink, dessert)

apple coffee cake
apple coffee ice_cream
apple coffee jelly
apple tea cake
apple tea ice_cream
apple tea jelly
apple sprite cake
apple sprite ice_cream
apple sprite jelly
banana coffee cake
banana coffee ice_cream
banana coffee jelly
banana tea cake
banana tea ice_cream
banana tea jelly
banana sprite cake
banana sprite ice_cream
banana sprite jelly
peach coffee cake
peach coffee ice_cream
peach coffee jelly
peach tea cake
peach tea ice_cream
peach tea jelly
peach sprite cake
peach sprite ice_cream
peach sprite jelly


In [11]:
[(fruit, drink, dessert) for fruit in fruits for drink in drinks for dessert in desserts]

[('apple', 'coffee', 'cake'),
 ('apple', 'coffee', 'ice_cream'),
 ('apple', 'coffee', 'jelly'),
 ('apple', 'tea', 'cake'),
 ('apple', 'tea', 'ice_cream'),
 ('apple', 'tea', 'jelly'),
 ('apple', 'sprite', 'cake'),
 ('apple', 'sprite', 'ice_cream'),
 ('apple', 'sprite', 'jelly'),
 ('banana', 'coffee', 'cake'),
 ('banana', 'coffee', 'ice_cream'),
 ('banana', 'coffee', 'jelly'),
 ('banana', 'tea', 'cake'),
 ('banana', 'tea', 'ice_cream'),
 ('banana', 'tea', 'jelly'),
 ('banana', 'sprite', 'cake'),
 ('banana', 'sprite', 'ice_cream'),
 ('banana', 'sprite', 'jelly'),
 ('peach', 'coffee', 'cake'),
 ('peach', 'coffee', 'ice_cream'),
 ('peach', 'coffee', 'jelly'),
 ('peach', 'tea', 'cake'),
 ('peach', 'tea', 'ice_cream'),
 ('peach', 'tea', 'jelly'),
 ('peach', 'sprite', 'cake'),
 ('peach', 'sprite', 'ice_cream'),
 ('peach', 'sprite', 'jelly')]

# 딕셔너리 컴프리헨션

리스트 못지않게 딕셔너리 또한 컴프리헨션이 있다. 

#### {키_표현식 : 값_표현식 for 표현식 in 순회 가능한 객체}

In [12]:
word = 'letters'

letter_count = {letter : word.count(letter) for letter in word}
print(letter_count)

{'l': 1, 'e': 2, 't': 2, 'r': 1, 's': 1}


In [13]:
# 하지만 위와 같은 경우 letters에는 총 5개의 알파벳이 사용되지만 중첩된 t와 e도 한번 더 순회를 해서 총 7번 순회된다. 그러므로, 
# set()함수를 사용하여 좀 더 압축시켜보자. 

In [14]:
# 위 딕셔너리와 다르게 정렬이 된다. 왜냐하면, set()함수에서 변수를 가져오기 때문이다. 
letter_count = {letter : word.count(letter) for letter in set(word)}
print(letter_count)

{'l': 1, 't': 2, 's': 1, 'r': 1, 'e': 2}


# 셋 컴프리헨션
set또한 컴프리헨션을 가지고 있다. 

#### {표현식 for 표현식 in 순회가능한 객체}

In [15]:
a_set = {number for number in range(1,6) if number % 3 == 1}
print(a_set)

{1, 4}


# 제너레이터 컴프리헨션

튜플은 아쉽게도 컴프리헨션이 없다. 아마 리스트 컴프리헨션을 생성할 때 대괄호[] 대신 소괄호()를 사용하면 튜플이 생성될꺼라고 착각하기 쉽다. 

하지만, 괄호 안의 내용은 튜플이 아니라
#### 제너레이터 컴프리헨션이다!

그리고 이것은 제너레이터 객체를 반환한다. 

In [17]:
number_thing = (number for number in range(1,6))
print(number_thing)
print(type(number_thing))

<generator object <genexpr> at 0x000002A28F2F8570>
<class 'generator'>


제너레이터는 이터레이터에 데이터를 제공하는 하나의 방법이다. 

그래서 다음과 같이 제너레이터 객체를 바로 순회할 수 있다. 

In [19]:
for number in number_thing:
    print(number)

1
2
3
4
5


혹은 리스트 컴프리헨션처럼 만들기 위해 제너레이터 컴프리헨션에 list() 호출을 랩핑(wrapping)할 수 있다. 

In [21]:
number_thing = list(number_thing)
print(number_thing)

[]


### 중요한 점! number_thing을 리스트로 wrapping하고 출력한 결과 왜 빈 리스트가 왜 나왔을까?

#### 리스트, 셋, 문자열, 딕셔너리는 메모리에 존재하지만 제너레이터는 즉석에서 그 값을 생성하고, 이터레이터를 통해서 한 번에 값을 하나씩 처리한다. 제너레이터는 이 값을 기억하지 않으므로 다시 시작하거나 제너레이터를 백업할 수 없다!