<a href="https://colab.research.google.com/github/Maiven/medium_and_blog/blob/main/Python/python_comprehension.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# List_Comprehenssion

In [None]:
class List_Comprehenssion(object):
    def __repr__(self):
        string = str(f"Bad Way:  {self.bad_way()}\n"
                     f"Easy Way: {self.easy_way()}\n")
        return string


    def bad_way(self):
        evens = []
        for i in range(10):
            if i % 2 == 0:
                evens.append(i)
        return evens


    def easy_way(self):
        evens = [i for i in range(10) if i % 2 == 0]
        return evens
    

if __name__ == "__main__":
    print(List_Comprehenssion())


Bad Way:  [0, 2, 4, 6, 8]
Easy Way: [0, 2, 4, 6, 8]



In [None]:
words = ['goodbye', 'cruel', 'world']
words

['goodbye', 'cruel', 'world']

In [None]:
lengths = [len(x) for x in words]
lengths

[7, 5, 5]

In [None]:
lengths = []
for word in words:
    lengths.append(len(word))
lengths

[7, 5, 5]

In [None]:
#Dictionary comprehension

data = {word: len(word) for word in words}
data

{'cruel': 5, 'goodbye': 7, 'world': 5}

In [None]:
# Bonus: another useful trick for creating dictionaries is to zip two lists together.
words = ["hello", "old", "friend"]
lengths = [len(word) for word in words]
data = dict(zip(words, lengths))
data

{'friend': 6, 'hello': 5, 'old': 3}

In [None]:
# Filtering
words = ['deified', 'radar', 'guns']
palindromes = [word for word in words if word == word[::-1]]
palindromes

['deified', 'radar']

In [None]:
words = ["not", "on", "my", "watch"]
data = {w: w[::-1] for w in words if len(w) < 5}
data

{'my': 'ym', 'not': 'ton', 'on': 'no'}

In [None]:
# Level 1: Just Replace For-loops
full_name = "Yang Zhou"
characters = [char for char in full_name]
print(full_name)
print(characters)

Yang Zhou
['Y', 'a', 'n', 'g', ' ', 'Z', 'h', 'o', 'u']


In [None]:
full_name = "Yang Zhou"
characters = []
for char in full_name:
    characters.append(char)
print(full_name)
print(characters)

Yang Zhou
['Y', 'a', 'n', 'g', ' ', 'Z', 'h', 'o', 'u']


In [None]:
Matrix = [[2, 1, 5],
          [5, 99, 0],
          [33, 2, 4]]
row_max = [max(row) for row in Matrix]
print(row_max)

[5, 99, 33]


In [None]:
# Level 2: Use the If Condition Smartly

Genius = ["Yang", "Tom", "Jerry", "Jack", "tom", "yang"]
L1 = [name for name in Genius if name.startswith('Y')]
L2 = [name for name in Genius if name.startswith('Y') or len(name) < 4]
L3 = [name for name in Genius if len(name) < 4 and name.islower()]
print(L1, L2, L3)

['Yang'] ['Yang', 'Tom', 'tom'] ['tom']


In [None]:
# Level 3: Use a More Complex Expression

Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [name.capitalize() for name in Genius]
print(L1)

['Jerry', 'Jack', 'Tom', 'Yang']


In [None]:

Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [name if name.startswith('y') else 'Not Genius' for name in Genius]
print(L1)

['Not Genius', 'Not Genius', 'Not Genius', 'yang']


In [None]:
a = 1
b = 2 if a>0 # SyntaxError: invalid syntax

b = 2 if a > 0 else -1  
# b==2,ternary conditional operator works 
b

2

In [None]:
# Level 4: Use Nested For-Loops to Handle Nested Iterables


Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [char for name in Genius for char in name]
print(L1)

['J', 'e', 'r', 'r', 'y', 'J', 'a', 'c', 'k', 't', 'o', 'm', 'y', 'a', 'n', 'g']


In [None]:
Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = []
for name in Genius:
    for char in name:
        L1.append(char)
print(L1)

['J', 'e', 'r', 'r', 'y', 'J', 'a', 'c', 'k', 't', 'o', 'm', 'y', 'a', 'n', 'g']


In [None]:
Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = [char for name in Genius if len(name) < 4 for char in name]
print(L1)

['t', 'o', 'm']


In [None]:
# Level 5: Avoid Higher Order Functions for Readability

Genius = ["Jerry", "Jack", "tom", "yang"]
L1 = filter(lambda a: len(a) < 4, Genius)
print(list(L1))
# ['tom']
L2 = [a for a in Genius if len(a) < 4]
print(L2)
# ['tom']

['tom']
['tom']


In [None]:
# Level 6: Use Generator Expressions to Reduce Memory Costs

large_list = [x for x in range(1_000_000)]
large_list_g = (x for x in range(1_000_000))
print(large_list.__sizeof__())
print(large_list_g.__sizeof__())

8697440
64


# Level 7: Understand the Philosophy Behind the List Comprehension

The intuitive reason to use the list comprehension is to make our code more neat and elegant. Furthermore, it’s a good practice of the functional programming paradigm. One of the functional programming philosophy is avoiding control flows. List comprehension can shift programmers’ focus from the control flow to the data collection itself. In other words, it’s a mentally shift from thinking of how a for-loop works to what the list is. It can help you think about the logic of the entire program more easily.


In [None]:
numbers = [1, 2, 3, 4]
squares = []

for n in numbers:
  squares.append(n**2)

print(squares) 

[1, 4, 9, 16]


In [None]:

numbers = [1, 2, 3, 4]
squares = [n**2 for n in numbers]

print(squares) 

[1, 4, 9, 16]


In [None]:

list_a = [1, 2, 3, 4]
list_b = [2, 3, 4, 5]

common_num = []

for a in list_a:
  for b in list_b:
    if a == b:
      common_num.append(a)
      
print(common_num)

[2, 3, 4]


In [None]:

list_a = [1, 2, 3, 4]
list_b = [2, 3, 4, 5]

common_num = [a for a in list_a for b in list_b if a == b]

print(common_num)

[2, 3, 4]


In [None]:

list_a = [1, 2, 3]
list_b = [2, 7]

different_num = [(a, b) for a in list_a for b in list_b if a != b]

print(different_num) 

[(1, 2), (1, 7), (2, 7), (3, 2), (3, 7)]


In [None]:

list_a = ["Hello", "World", "In", "Python"]

small_list_a = [str.lower() for str in list_a]

print(small_list_a) 

['hello', 'world', 'in', 'python']


In [None]:
 list_a = [1, 2, 3]

square_cube_list = [ [a**2, a**3] for a in list_a]

print(square_cube_list)

[[1, 1], [4, 8], [9, 27]]


In [None]:
s = []
lst = [0,1,2,3,4]
for i in lst:
  s.append(i*2)
s

[0, 2, 4, 6, 8]

In [None]:
del list

In [None]:
lambda_list = list(map(lambda num : num * 2, lst))
lambda_list

[0, 2, 4, 6, 8]

In [None]:
list_comp = [num*2 for num in lst]
list_comp

[0, 2, 4, 6, 8]

# 파이썬의 Comprehension 소개


Comprehension이란 iterable한 오브젝트를 생성하기 위한 방법중 하나로 파이썬에서 사용할 수 있는 유용한 기능중 하나이다.

파이썬에는 다음과 같은 크게 네 가지 종류의 Comprehension이 있다.

    List Comprehension (LC)
    Set Comprehension (SC)
    Dict Comprehension (DC)
    Generator Expression (GE)
Generator의 경우 comprehension과 형태는 동일하지만 특별히 expression이라고 부른다.

## List Comprehension (LC)


- List comprehension은 리스트를 쉽게 생성하기 위한 방법이다. 이는 파이썬에서 보편적으로 사용되는 기능으로 조금만 응용하면 다양한 조건으로 리스트를 생성할 수 있는 강력한 기능중 하나이다.



In [None]:
# 20까지의 짝수를 출력하기 위해 다음과 같은 LC를 사용할 수 있다
evens = [x * 2 for x in range(11)]
# [0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

# 리스트의 모든 원소값을 정규화 시킨 후 상수값을 더하는 LC
vals = [32, 12, 96, 42, 32, 93, 31, 23, 65, 43, 76]
amount = sum(vals)
norm_and_move = [(x / amount) + 1 for x in vals]
# [1.0587155963302752, 1.0220183486238532, 1.1761467889908257, 1.0770642201834861, 1.0587155963302752, 1.1706422018348623, 1.0568807339449542, 1.0422018348623854, 1.1192660550458715, 1.0788990825688074, 1.1394495412844037]


- 조금 더 복잡한 예제를 살펴보자. (조건을 지닌 LC와 Nested LC)



In [None]:
# 100 이하의 제곱수가 아닌 수를 찾는 LC
from math import sqrt
non_squars = [x for x in range(101) if sqrt(x)**2 != x]
# [2, 3, 5, 6, 7, 8, 10, 12, 13, 15, 18, 19, 20, 23, 24, 26, 28, 29, 31, 32, 37, 38, 40, 43, 45, 48, 50, 51, 52, 58, 59, 60, 61, 63, 65, 66, 72, 73, 75, 76, 77, 78, 80, 82, 87, 89, 92, 94, 95, 96, 97]

# 두 리스트의 원소들의 모든 조합을 찾는 LC
epithets = ['sweet', 'annoying', 'cool', 'grey-eyed']
names = ['john', 'alice', 'james']
epithet_names = [(e, n) for e in epithets for n in names]


- 조금 더 Practical한 예제를 살펴보자.



In [3]:
# a^2 + b^2 = c^2 (a < b < c)를 만족하는 피타고라스 방정식의 해를 찾는 LC
solutions = [(x, y, z) for x in range(1, 30) for y in range(x, 30) for z in range(y, 30) if x**2 + y**2 == z**2]
# [(3, 4, 5), (5, 12, 13), (6, 8, 10), (7, 24, 25), (8, 15, 17), (9, 12, 15), (10, 24, 26), (12, 16, 20), (15, 20, 25), (20, 21, 29)]

# 단어에서 모음을 제거하는 LC
word = 'mathematics'
without_vowels = ''.join([c for c in word if c not in ['a', 'e', 'i', 'o', 'u']])
# 'mthmtcs'

# 행렬을 일차원화 시키는 LC
matrix = [
  [1, 2, 3, 4],
  [5, 6, 7, 8],
  [9, 10, 11, 12],
]
flatten = [e for r in matrix for e in r]
flatten


[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

## Set Comprehension (SC)

- Set comprehension은 LC와 정확히 동일하며 단지 list가 아닌 set을 생성한다는 것만 다르다.



In [None]:
# 다음의 LC는 중복된 값들을 포함한다
no_primes = [j for i in range(2, 9) for j in range(i * 2, 50, i)]
# [4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 10, 15, 20, 25, 30, 35, 40, 45, 12, 18, 24, 30, 36, 42, 48, 14, 21, 28, 35, 42, 49, 16, 24, 32, 40, 48]

# SC를 사용하면 중복값이 없는 집합을 얻을 수 있다
no_primes = {j for i in range(2, 9) for j in range(i * 2, 50, i)}


## Dict Comprehension (DC)

- Dict comprehension 또한 LC와 동일하며 dict를 생성한다.



In [None]:
# 두 리스트를 하나의 dict로 합치는 DC. 하나는 key, 또 다른 하나는 value로 사용한다
subjects = ['math', 'history', 'english', 'computer engineering']
scores = [90, 80, 95, 100]
score_dict = {key: value for key, value in zip(subjects, scores)}
# {'math': 90, 'history': 80, 'english': 95, 'computer engineering': 100}

# 튜플 리스트를 dict 형태로 변환하는 DC
score_tuples = [('math', 90), ('history', 80), ('english', 95), ('computer engineering', 100)]
score_dict = {t[0]: t[1] for t in score_tuples}
# {'math': 90, 'history': 80, 'english': 95, 'computer engineering': 100}


## Generator Expression (GE)

- Generator expression은 특별한 형태의 comprehension이다. 이는 한 번에 모든 원소를 반환하지 않고 한 번에 하나의 원소만 반환하는 generator를 생성한다.

- GE 또한 다른 Comprehension과 동일한 형태로 쉽게 사용할 수 있다.



In [None]:
# 다음 Generator는 제곱수를 만들어낸다
gen = (x**2 for x in range(10))
print(gen)
# <generator object <genexpr> at 0x105bde5c8>
print(next(gen)) # call 1
# 0
print(next(gen)) # call 2
# 1
# 'next' 함수 호출을 10번 반복
print(next(gen)) # call 10
# 81
print(next(gen)) # call 11
"""
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration
"""

# Yes, it is an just generator. You can sum the yielding values.
# GE로 생성한 Generator도 yield를 가진 함수로 생성한 것과 동일한 Generator이기 때문에, 똑같이 sum을 사용할 수 있다. (iterable 객체)
gen = (x**2 for x in range(10))
sum_of_squares = sum(gen)
# 285
