# Comprehension

Python: List Comprehensions by Joe James 
[youtube](https://www.youtube.com/watch?v=XSTmAtoUWXo) 
[github](https://github.com/joeyajames/Python)

[Comprehensions - How they work and why you should be using them by Corey Schafer](https://www.youtube.com/watch?v=3dt4OGnU5sM&list=PL-osiE80TeTt2d9bfVyTiXJA-UTHn6WwU&index=19)

<a href="#List-Comprehension,-List-Constructor-using-Compact-For-Loop">List Comprehension, List Constructor using Compact For Loop</a>

<a href="#List-Comprehension-using-if-else-Statement">List Comprehension using if-else Statement</a>

<a href="#Nested-List-Comprehension">Nested List Comprehension</a>

<a href="#List-Comprehension-is-Fater-and-uses-Less-Memory">List Comprehension is Fater and uses Less Memory</a>

<a href="#Tuple-Comprehension">Tuple Comprehension</a>

<a href="#Dict-Comprehension">Dict Comprehension</a>

<a href="#Set-Comprehension">Set Comprehension</a>

<a href="#Generator-Comprehension">Generator Comprehension</a>

# List Comprehension, List Constructor using Compact For Loop

리스트 컴프리헨션은 for loop를 이용하여 리스트를 만드는 것과 동일한 작업을 하는 리스트 컨스트럭터이다.
하지만 for loop를 이용하는 것에 비하여 네가지 장점이 있다. 

> 4 Simple Syntax

> 3 One Liners

> 2 English-like Commands

> 1 Fast

먼저 0부터 9까지의 정수로 이루어진 리스트를 for loop를 이용 만들어 보자.

In [1]:
under_10 = []
for i in range(10):
    under_10.append(i)
print(under_10)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


같은 작업을 리스트 컴프리핸션을 이용하여 수행하자.
리스트 컴프리핸션은 다음과 같은 양식으러 사용한다. 

> [transform sequence [common filter]]

In [2]:
under_10 = [i for i in range(10)]    # transform - i
                                     # sequence  - for i in range(10) 
print(under_10)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


0부터 9까지의 정수를 제곱하여 리스트를 만드는데 for loop를 이용하는 방법과 리스트 컴프리헨션을 비교하자.

In [3]:
temp = []
for i in under_10:
    temp.append(i**2)
temp

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [4]:
temp = [i**2 for i in under_10]    # transform - i**2
                                   # sequence  - for i in under_10
temp

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

0부터 9까지의 정수중 짝수인 정수를 제곱하여 리스트를 만드는데 for loop를 이용하는 방법과 리스트 컴프리헨션을 비교하자.

In [5]:
temp = []
for i in under_10:
    if i%2 == 0:
        temp.append(i**2)
print(temp)

[0, 4, 16, 36, 64]


In [6]:
temp = [i**2 for i in under_10 if i%2 == 0]    # transform - i**2
                                               # sequence  - for i in under_10
                                               # filter    - if i%2 == 0 
print(temp)

[0, 4, 16, 36, 64]


(letter, num) pair for each letter in abcd and each number in 0123를 for loop를 이용 구성하여 보자.

In [7]:
my_list = []
for letter in 'abcd':
    for num in range(4):
        my_list.append((letter, num))
my_list

[('a', 0),
 ('a', 1),
 ('a', 2),
 ('a', 3),
 ('b', 0),
 ('b', 1),
 ('b', 2),
 ('b', 3),
 ('c', 0),
 ('c', 1),
 ('c', 2),
 ('c', 3),
 ('d', 0),
 ('d', 1),
 ('d', 2),
 ('d', 3)]

같은 작업을 리스트 컴프리헨션을 쓰면 다음과 같다.

In [8]:
my_list = [(letter, num) for letter in 'abcd' for num in range(4)]
my_list

[('a', 0),
 ('a', 1),
 ('a', 2),
 ('a', 3),
 ('b', 0),
 ('b', 1),
 ('b', 2),
 ('b', 3),
 ('c', 0),
 ('c', 1),
 ('c', 2),
 ('c', 3),
 ('d', 0),
 ('d', 1),
 ('d', 2),
 ('d', 3)]

스트링에 들어있는 숫자들만 필터링하여 리스트를 만들어보자.

In [9]:
s = 'I love 2 go t0 the caffe 7 times a w3ek.'
nums = [i for i in s if i.isnumeric()]    # transform - i
                                          # sequence  - for i in s
                                          # filter    - if i.isnumeric() 
print(nums)

['2', '0', '7', '3']


리스트에서 특정 아이템이 차지하는 인덱스를 리스트 컴프리헨션을 이용 찿아보자.
아이템이 여럿 있을 수 있는데, 이 때에는 처음 나오는 인덱스를 찿자.
이 보기에서는 Math를 찿는데 세곳에서 발견된다.
처음 발생하는 인덱스를 리포트하자.

In [10]:
Courses = ['Math', 'History', 'Physics', 'Music', 'Math', 'Math']
idx = [i for i, v in enumerate(Courses) if v == 'Math']
print('index = {}'.format(str(idx[0])))

index = 0


스트링에서 특정 알파벳을 리스트 컴프리헨션을 이용 제거해 보자.

In [11]:
s = 'I love to go to the caffe 7 times a week.'
s_without_e = [i for i in s if i != 'e']    # transform - i
                                            # sequence  - for i in s
                                            # filter    - if i != 'e' 
new_s = ''
for i in s_without_e:
    new_s += i
print(new_s)

I lov to go to th caff 7 tims a wk.


[<a href="#Comprehension">Back to top</a>]

# List Comprehension using if-else Statement 

리스트 컴프리핸션을 사용할 때 필터는 보통 마지막에 붙는다.
하지만 필터가 if-else statement면, 이 필터는 중앙에 위치한다.

> [transform sequence [common filter]]

> [transform [if-else filter] sequence]

0부터 9까지의 정수중 짝수인 정수는 제곱하고
홀수인 정수는 부호를 바꾸어 리스트를 만드는데 for loop를 이용하는 방법과 리스트 컴프리헨션을 비교하자.

In [12]:
temp = []
for i in under_10:
    if i%2 == 0:
        temp.append(i**2)
    else:
        temp.append(-i)
print(temp)

[0, -1, 4, -3, 16, -5, 36, -7, 64, -9]


In [13]:
temp = [i**2 if i%2 == 0 else -i for i in under_10]    # transform - i**2, -i
                                                       # sequence  - for i in under_10
                                                       # filter    - if i%2 == 0, else 
print(temp)

[0, -1, 4, -3, 16, -5, 36, -7, 64, -9]


[<a href="#Comprehension">Back to top</a>]

# Nested List Comprehension

In [14]:
a = [[1,2], [3,4]]

temp = []
for i in a:               # first i=[1,2]
                          # second i=[3,4] 
    for j in i:
        temp.append(j)
print(temp)

[1, 2, 3, 4]


In [15]:
a = [[1,2], [3,4]]
x = [j for i in a for j in i]    # for i in a            - (above) for i in a:
                                 # for i in a for j in i - (above) for i in a:    
                                 #                                     for j in i:
print(x)

[1, 2, 3, 4]


[<a href="#Comprehension">Back to top</a>]

# List Comprehension is Fater and uses Less Memory

In [16]:
n = 10

In [17]:
def first_method(n):
    temp = []
    for i in range(n):
        temp.append(i)
    return temp

In [18]:
first_method(n)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [19]:
def second_method(n):
    return [i for i in range(n)]

In [20]:
second_method(n)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [21]:
n = 1000000

In [22]:
%timeit first_method(n)

10 loops, best of 3: 110 ms per loop


In [23]:
%timeit second_method(n)

10 loops, best of 3: 71.2 ms per loop


In [24]:
%load_ext memory_profiler

In [25]:
%memit first_method(n)

peak memory: 71.23 MiB, increment: 27.02 MiB


In [26]:
%memit second_method(n)

peak memory: 68.54 MiB, increment: 23.76 MiB


[<a href="#Comprehension">Back to top</a>]

# Tuple Comprehension

In [27]:
under_10 = (i for i in range(10))    # transform - i
                                     # sequence  - for i in range(10) 
print(under_10)

<generator object <genexpr> at 0x1044dd258>


[<a href="#Comprehension">Back to top</a>]

# Dict Comprehension

In [28]:
numbers = [0, 1, 2, 3, 4]
even_numbers_square = {x: x ** 2 for x in numbers if x % 2 == 0}

print(even_numbers_square)  # Prints "{0: 0, 2: 4, 4: 16}"

{0: 0, 2: 4, 4: 16}


In [29]:
names = ['Bruce', 'Clark', 'Peter', 'Logan', 'Wade']
heros = ['Batman', 'Superman', 'Spiderman', 'Wolverine', 'Deadpool']

In [30]:
zip(names, heros)

<zip at 0x1045964c8>

I want a dict{'name': 'hero'} for each name, hero in zip(names, heros).
for loop를 이용하면 다음과 같다.

In [31]:
my_dict = {}
for name, hero in zip(names, heros):
    my_dict[name] = hero
my_dict

{'Bruce': 'Batman',
 'Clark': 'Superman',
 'Logan': 'Wolverine',
 'Peter': 'Spiderman',
 'Wade': 'Deadpool'}

같은 작업을 딕션너리 컴프리헨션을 쓰면 다음과 같다.

In [32]:
my_dict = {name: hero for name, hero in zip(names, heros)}
my_dict

{'Bruce': 'Batman',
 'Clark': 'Superman',
 'Logan': 'Wolverine',
 'Peter': 'Spiderman',
 'Wade': 'Deadpool'}

Peter의 히어로 Spiderman은 제외하고, 같은 작업을 딕션너리 컴프리헨션을 쓰면 다음과 같다.

In [33]:
my_dict = {name: hero for name, hero in zip(names, heros) if name != 'Peter'}
my_dict

{'Bruce': 'Batman',
 'Clark': 'Superman',
 'Logan': 'Wolverine',
 'Wade': 'Deadpool'}

[<a href="#Comprehension">Back to top</a>]

# Set Comprehension

In [34]:
import numpy as np
a = {int(np.sqrt(x)) for x in range(30)}
print(a)  

{0, 1, 2, 3, 4, 5}


In [35]:
nums = [1, 1, 2, 1, 3, 4, 3, 4, 5, 5, 6, 7, 8, 7, 9, 9]

In [36]:
my_set = set()
for n in nums:
    my_set.add(n)
my_set

{1, 2, 3, 4, 5, 6, 7, 8, 9}

In [37]:
my_set = {n for n in nums}
my_set

{1, 2, 3, 4, 5, 6, 7, 8, 9}

[<a href="#Comprehension">Back to top</a>]

# Generator Comprehension

In [38]:
nums = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

I want to yield n*n for each n in nums.
for loop를 이용하면 다음과 같다.

In [39]:
def gen_func(nums):
    for n in nums:
        yield n*n

my_gen = gen_func(nums)

for i in my_gen:
    print(i)

1
4
9
16
25
36
49
64
81
100


같은 작업을 제너레이터 컴프리헨션을 쓰면 다음과 같다.

In [40]:
my_gen = (n*n for n in nums)
for i in my_gen:
    print(i)

1
4
9
16
25
36
49
64
81
100


[<a href="#Comprehension">Back to top</a>]