## Comprehension in python 

Comprehension이란 iterable한 오브젝트를 생성하기 위한 방법중 하나로 파이썬에서 사용할 수 있는 유용한 기능중 하나이다.

파이썬에는 다음과 같은 크게 네 가지 종류의 Comprehension이 있다.

- List Comprehension (LC)
- Set Comprehension (SC)
- Dict Comprehension (DC)
- Generator Expression (GE)
    - Generator의 경우 comprehension과 형태는 동일하지만 특별히 expression이라고 부른다.

그럼 이제 각각의 경우에 대해 간단히 살펴보자. (iterable과 generator에 대해서는 이 포스팅을 참고하길 바란다.)



### List Comprehension

In [2]:
evens = [x*2 for x in range(11)]
print(evens)

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20]


In [4]:

# 리스트의 모든 원소값을 정규화 시킨 후 상수값을 더하는 LC
vals = [32, 12, 96, 42, 32, 93, 31, 23, 65, 43, 76]
amount = sum(vals)
norm_and_move = [(x/amount) + 1 for x in vals]
print(norm_and_move)

[1.0587155963302752, 1.0220183486238532, 1.1761467889908257, 1.0770642201834861, 1.0587155963302752, 1.1706422018348623, 1.0568807339449542, 1.0422018348623854, 1.1192660550458715, 1.0788990825688074, 1.1394495412844037]


In [6]:
# 100 이하의 제곱수가 아닌 수를 찾는 LC
from math import sqrt
non_squars = [x for x in range(101) if sqrt(x)**2 !=x]
print(non_squars)

[2, 3, 5, 6, 7, 8, 10, 12, 13, 15, 18, 19, 20, 23, 24, 26, 28, 29, 31, 32, 37, 38, 40, 43, 45, 48, 50, 51, 52, 58, 59, 60, 61, 63, 65, 66, 72, 73, 75, 76, 77, 78, 80, 82, 87, 89, 92, 94, 95, 96, 97]


In [9]:
# 두 리스트의 원소들의 모든 조합을 찾는 LC
epithets = ['sweet', 'annoying', 'cool', 'grey-eyed']
names = ['john', 'alice', 'james']
epithet_names = [(e,n) for e in epithets 
                       for n in names]
print(epithet_names)

[('sweet', 'john'), ('sweet', 'alice'), ('sweet', 'james'), ('annoying', 'john'), ('annoying', 'alice'), ('annoying', 'james'), ('cool', 'john'), ('cool', 'alice'), ('cool', 'james'), ('grey-eyed', 'john'), ('grey-eyed', 'alice'), ('grey-eyed', 'james')]


#### a^2 + b^2 = c^2 (a < b < c)를 만족하는 피타고라스 방정식의 해를 찾는 LC


In [11]:
solutions = [(x,y,z) for x in range(1,30)
                     for y in range(x,30)
                     for z in range(y,30)
                         if x**2 + y**2 ==z**2]
print(solutions)

[(3, 4, 5), (5, 12, 13), (6, 8, 10), (7, 24, 25), (8, 15, 17), (9, 12, 15), (10, 24, 26), (12, 16, 20), (15, 20, 25), (20, 21, 29)]


#### 단어에서 모음을 제거하는 LC

In [13]:
word =  'mathematics'
without_vowels = ''.join([c for c in word 
                            if c not in ['a','i','e','o','u']])
                        #c 를 join 할건데 c는 word 에서 가져오고
                        # c 의 조건은 단, 모음 리스트ㅡ에 없을 때
print(without_vowels)

mthmtcs


#### 행렬을 일차원화 시키기


In [14]:
matrix = [
  [1, 2, 3, 4],
  [5, 6, 7, 8],
  [9, 10, 11, 12],
]

flatten = [e for r in matrix 
             for e in r]
        
        
print(flatten)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]


## Set Comprehension
결과가 set 이라는 것만 제와하고는 list와 동일하다

In [15]:
# 다음의 LC는 중복된 값들을 포함한다
no_primes = [j for i in range(2, 9) for j in range(i * 2, 50, i)]
# [4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 10, 15, 20, 25, 30, 35, 40, 45, 12, 18, 24, 30, 36, 42, 48, 14, 21, 28, 35, 42, 49, 16, 24, 32, 40, 48]

# SC를 사용하면 중복값이 없는 집합을 얻을 수 있다
no_primes = {j for i in range(2, 9) for j in range(i * 2, 50, i)}
# {4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30, 32, 33, 34, 35, 36, 38, 39, 40, 42, 44, 45, 46, 48, 49}

## Dict Comprehension
LC와 동일하나 dict 를 생성한다. 

#### 두 리스트를 하나의 dict 로 합치는 DC. 하나는 key 또하나는 value 로 사용한다. 

In [16]:
subjects = ['math', 'history', 'english', 'computer engineering']
scores = [90, 80, 95, 100]
score_dict = {key:value for key, value in zip(subjects, scores)}

#### 튜플 리스트를 dict 형태로 반환하는 DC

In [17]:

score_tuples = [('math', 90), ('history', 80), ('english', 95), ('computer engineering', 100)]
score_dict = {t[0]:t[1] for t in score_tuples}
print(score_dict)

{'math': 90, 'history': 80, 'english': 95, 'computer engineering': 100}


## Generator Expression
특별한 형태으이 comprehension 

#### 제곱수를 만들어내는 generator

In [1]:
gen = (x**2 for x in range(10))
print(gen)

<generator object <genexpr> at 0x0000020582D596D0>


In [2]:
print(next(gen))

0


In [3]:
print(next(gen))

1


In [4]:
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))
print(next(gen))


4
9
16
25
36
49
64
81


In [5]:
print(next(gen))


StopIteration: 

In [7]:

# Yes, it is an just generator. You can sum the yielding values.
# GE로 생성한 Generator도 yield를 가진 함수로 생성한 것과 동일한 Generator이기 때문에, 똑같이 sum을 사용할 수 있다. (iterable 객체)
gen = (x**2 for x in range(10))
sum_of_squares = sum(gen)
print(sum_of_squares)
# 285

285
