# 3.1 List Comprehension

Cho chúng ta cú pháp ngắn hơn khi bạn muốn tạo một danh sách mới dựa trên các giá trị của danh sách hiện có.

## Thay thế một vòng lặp for loop
### Example: Tạo danh sách mà từng phần tử cộng thêm 10
**Cách 1: Cộng từng items dùng range()**

In [1]:
L = [1, 2, 3, 4, 5]
for i in range(len(L)):
    L[i] += 10
L

[11, 12, 13, 14, 15]

**Cách 2: Cộng từng element trong list**

In [2]:
L = [1, 2, 3, 4, 5]
res = []
for x in L:
    res.append(x + 10)
res

[11, 12, 13, 14, 15]

**Cách 3: Dùng list comprehension**

In [3]:
L = [1, 2, 3, 4, 5]
L = [x + 10 for x in L]
L

[11, 12, 13, 14, 15]

## Thay thế hai vòng lặp for loop

**Cách 1: Bắt cặp các chữ cái khi xài cách thông thường**

In [4]:
res = []
for x in 'abc':
    for y in 'def':
        res.append(x + y)
res

['ad', 'ae', 'af', 'bd', 'be', 'bf', 'cd', 'ce', 'cf']

**Cách 2: Xài list comprehesion**

In [5]:
[x + y for x in 'abc' for y in 'def']

['ad', 'ae', 'af', 'bd', 'be', 'bf', 'cd', 'ce', 'cf']

## List comprehesion có điều kiện

In [6]:
[x+y+z for x in 'spam' if x in 'sm'
       for y in 'SPAM' if y in ('P','A')
       for z in '123'  if z>'1']

['sP2', 'sP3', 'sA2', 'sA3', 'mP2', 'mP3', 'mA2', 'mA3']

In [7]:
[(x,y) for x in range(5) if x%2==0 for y in range(5) if y%2==1]

[(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]

In [8]:
res=[]
for x in range(5):
    if x%2==0:
        for y in range(5):
            if y%2==1:
                res.append((x,y))
res

[(0, 1), (0, 3), (2, 1), (2, 3), (4, 1), (4, 3)]

## Comprehension với ma trận

In [9]:
M=[[1,2,3],[4,5,6],[7,8,9]]

In [10]:
M[1] # Lấy hàng 1 của ma trận

[4, 5, 6]

In [11]:
[row[1] for row in M] # Lấy cột 1 của ma trận

[2, 5, 8]

In [12]:
[M[i][i] for i in range(len(M))] # Lấy ma trận đường chéo 

[1, 5, 9]

In [13]:
[M[i][len(M)-1-i] for i in range(len(M))] # Lấy ma trận đường chéo đối xứng

[3, 5, 7]

In [14]:
L=[[1,2,3],[4,5,6]]
for i in range(len(L)):
    for j in range(len(L[i])):
        L[i][j]+=10
L

[[11, 12, 13], [14, 15, 16]]

In [15]:
M=[[1,2,3],[4,5,6],[7,8,9]]
[col+10 for row in M for col in row] # Tăng mỗi element lên 10

[11, 12, 13, 14, 15, 16, 17, 18, 19]

Nhưng ta thấy nó bị chuyển thành ma trận 1 chiều.

In [16]:
M=[[1,2,3],[4,5,6],[7,8,9]]
[[col+10 for col in row] for row in M] # Sửa lại như sau

[[11, 12, 13], [14, 15, 16], [17, 18, 19]]

**Cách làm thông thường:**

In [17]:
M=[[1,2,3],[4,5,6],[7,8,9]]
res=[]
for row in M:
    for col in row:
        res.append(col+10)
res

[11, 12, 13, 14, 15, 16, 17, 18, 19]

In [18]:
M=[[1,2,3],[4,5,6],[7,8,9]]
res=[]
for row in M:
    temp=[]
    for col in row:
        temp.append(col+10)
    res.append(temp)
res

[[11, 12, 13], [14, 15, 16], [17, 18, 19]]

### Nhân hai ma trận (nhân element)

In [19]:
N=[[2,2,2],[3,3,3],[4,4,4]]  
M=[[1,2,3],[4,5,6],[7,8,9]] # Comprehension
[M[row][col]*N[row][col] for row in range(3) for col in range(3)]  

[2, 4, 6, 12, 15, 18, 28, 32, 36]

In [20]:
M=[[1,2,3],[4,5,6],[7,8,9]]
N=[[2,2,2],[3,3,3],[4,4,4]] # Comprehension
[[M[row][col]*N[row][col] for col in range(3)] for row in range(3)]

[[2, 4, 6], [12, 15, 18], [28, 32, 36]]

In [21]:
res=[]
for row in range(3):  # Cách thông thường
    temp=[]
    for col in range(3):
        temp.append(M[row][col]*N[row][col])
    res.append(temp)
res

[[2, 4, 6], [12, 15, 18], [28, 32, 36]]

In [22]:
M=[[1,2,3],[4,5,6],[7,8,9]]
N=[[2,2,2],[3,3,3],[4,4,4]]
res=[]
for row1,row2 in zip(M,N): # Cách thông thường dùng zip
    temp=[]
    for (col1,col2) in zip(row1,row2):
        temp.append(col1*col2)
    res.append(temp)
res

[[2, 4, 6], [12, 15, 18], [28, 32, 36]]

# 3.2 Dictionary amd set comprehension

In [23]:
{x: x * x for x in range(10)} # dict compreshension

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

In [24]:
res = {}
for x in range(10): # Cách tạo thông thường
    res[x] = x * x
res

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

In [25]:
{x: x * x for x in range(10) if x % 2 == 0} # dict comprehension có điều kiện

{0: 0, 2: 4, 4: 16, 6: 36, 8: 64}

In [26]:
{k.upper(): k * 2 for k in ['spam', 'ham', 'sausage'] if k[0] == 's'} # dict comprehension có điều kiện

{'SPAM': 'spamspam', 'SAUSAGE': 'sausagesausage'}

In [27]:
{x: y for x in [1, 2, 3] for y in [4, 5, 6]} # dict comprehension hai vòng loop

{1: 6, 2: 6, 3: 6}

In [28]:
{x * x for x in range(10)} # Set comprehension


{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

In [29]:
res = set()
for x in range(10): # Cách tạo thông thường
    res.add(x * x)
res

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

In [30]:
{x * x for x in range(10) if x % 2 == 0} # Set comprehension có điều kiện

{0, 4, 16, 36, 64}

In [31]:
{k * 2 for k in ['spam', 'ham', 'sausage'] if k[0] == 's'} # Set comprehension có điều kiện

{'sausagesausage', 'spamspam'}

In [32]:
{x + y for x in [1, 2, 3] for y in [4, 5, 6]} # Set comprehension thay thế hai vòng loop

{5, 6, 7, 8, 9}

# 3.3 Generator function and expression
+ **Generator function** được viết như các câu lệnh def bình thường, nhưng sử dụng câu lệnh **yield** để trả lại kết quả ở một thời điểm, có thể tạm dừng và tiếp tục ở mỗi trạng thái.
+ **Generator epression** tương tự như list comprehension và được **đặt trong dấu ngoặc tròn** nhưng chúng trả về một đối tượng tạo ra kết quả theo yêu cầu thay vì kết quả là một danh sách.

In [33]:
def gensquares(N):
    for i in range(N):
        yield i**2

In [34]:
gensquares(5)

<generator object gensquares at 0x03416370>

In [35]:
type(gensquares(5))

generator

In [36]:
for i in gensquares(5):
    print(i,end=':')

0:1:4:9:16:

## Xem cách thức lặp

In [37]:
x=gensquares(4)
x

<generator object gensquares at 0x03416030>

In [38]:
next(x)

0

In [39]:
next(x)

1

In [40]:
next(x)

4

In [41]:
next(x)

9

```python
next(x)
```
`Output: StopIteration: `

In [42]:
y=gensquares(5)  
iter(y) is y     # Ta thấy generator là một iterator

True

## Mô tả cách thức tạo ra generator

In [43]:
def buildsquare(n):
    res=[]
    for i in range(n):
        res.append(i**2)
    return res
for x in buildsquare(5):
    print(x,end=':')

0:1:4:9:16:

In [44]:
for x in [n**2 for n in range(5)]:
    print(x,end=':')

0:1:4:9:16:

In [45]:
for x in map(lambda n: n**2,range(5)):
    print(x,end=':')

0:1:4:9:16:

## Generator với tuple

In [46]:
def ups(line):
    for sub in line.split(','):
        yield sub.upper()
ups('aaa,bbb,cc')

<generator object ups at 0x03416130>

In [47]:
tuple(ups('aaa,bbb,cc'))

('AAA', 'BBB', 'CC')

In [48]:
{i:s for (i,s) in enumerate(ups('aaa,bbb,ccc'))}

{0: 'AAA', 1: 'BBB', 2: 'CCC'}

## Giao thức send 

In [49]:
def gen():
    for i in range(10):
        X=yield i
        print(X)

In [50]:
G=gen()

In [51]:
next(G)

0

In [52]:
G.send(77)

77


1

In [53]:
G.send(88)

88


2

In [54]:
next(G)

None


3

## Generator Expression

In [55]:
[x**2 for x in range(4)] #list comprehension

[0, 1, 4, 9]

In [56]:
(x**2 for x in range(4)) # Tạo generator expression

<generator object <genexpr> at 0x034165B0>

In [57]:
list(x**2 for x in range(4)) # Ép thình list comprehension

[0, 1, 4, 9]

In [58]:
G=(x**2 for x in range(3))
iter(G) is G              # Nó là Iterator

True

In [59]:
next(G)

0

In [60]:
next(G)

1

In [61]:
next(G)

4

```python
next(x)
```
`Output: StopIteration: `

## Duyệt generator expression

In [62]:
for num in (x**2 for x in range(4)):
    print('%s,%s'%(num,num/2.0))

0,0.0
1,0.5
4,2.0
9,4.5


In [63]:
''.join(x.upper() for x in 'aaa,bbb,ccc'.split(','))

'AAABBBCCC'

In [64]:
a,b,c=(x+"\n" for x in 'aaa,bbb,ccc'.split(',')) # Assign

In [65]:
a,b

('aaa\n', 'bbb\n')

## Expression với hàm

In [66]:
sum(x**2 for x in range(4))

14

In [67]:
sorted(x**2 for x in range(4))

[0, 1, 4, 9]

In [68]:
sorted((x**2 for x in range(4)),reverse=True)

[9, 4, 1, 0]

In [69]:
list(map(abs,(-1,-2,3,4)))

[1, 2, 3, 4]

In [70]:
list(abs(x) for x in (-1,-2,-3,4))

[1, 2, 3, 4]

In [71]:
list(map(lambda x:x**2,(1,2,3,4)))

[1, 4, 9, 16]

In [72]:
list(x**2 for x in (1,2,3,4))

[1, 4, 9, 16]

In [73]:
line='aaa,bbb,ccc'
''.join([x.upper() for x in line.split(',')])

'AAABBBCCC'

In [74]:
line='aaa,bbb,ccc'
''.join(x.upper() for x in line.split(',')) # Generate

'AAABBBCCC'

In [75]:
''.join(map(str.upper,line.split(',')))

'AAABBBCCC'

In [76]:
''.join(x*2 for x in line.split(','))

'aaaaaabbbbbbcccccc'

In [77]:
''.join(map(lambda x: x*2,line.split(',')))

'aaaaaabbbbbbcccccc'

## Nested Generator

In [78]:
[x*2 for x in [abs(x) for x in (-1,-2,3,4)]] # Nested comprehension

[2, 4, 6, 8]

In [79]:
list(map(lambda x: x*2,map(abs,(-1,-2,3,4)))) # Nested map

[2, 4, 6, 8]

In [80]:
list(x*2 for x in (abs(x) for x in (-1,-2,3,4))) # Nested generator

[2, 4, 6, 8]

In [81]:
import math
list(map(math.sqrt,(x**2 for x in range(4)))) # Nest kết hợp

[0.0, 1.0, 2.0, 3.0]

In [82]:
list(map(abs,map(abs,map(abs,(-1,0,1))))) # Nested bad

[1, 0, 1]

In [83]:
list(abs(x) for x in (abs(x) for x in (abs(x) for x in (-1,0,1)))) # Nested bad

[1, 0, 1]

### Generator với filter

In [84]:
line='aa bb cc'
''.join(x for x in line.split() if len(x)>1)

'aabbcc'

In [85]:
''.join(filter(lambda x: len(x) > 1, line.split()))

'aabbcc'

In [86]:
''.join(x.upper() for x in line.split() if len(x)>1)

'AABBCC'

In [87]:
line='aa bb cc'
res=''
for x in line.split():
    if len(x)>1:
        res+=x.upper()
res

'AABBCC'

## So sánh generator function với generator expression

In [88]:
G=(c*4 for c in 'SPAM') # Generator expression
list(G)

['SSSS', 'PPPP', 'AAAA', 'MMMM']

In [89]:
def timesfour(S): # Generator function
    for c in S:
        yield c*4
G=timesfour('spam')
list(G)

['ssss', 'pppp', 'aaaa', 'mmmm']

In [90]:
line='aa bbb c'
''.join(x.upper() for x in line.split() if len(x)>1) # Generator expression

'AABBB'

In [91]:
def gensub(line):          # Generator function
    for x in line.split():
        if len(x)>1:
            yield x.upper()
''.join(gensub(line))

'AABBB'

## Generator với  unpack agrument

In [92]:
def f(a, b, c): 
    print('%s, %s, and %s' % (a, b, c))

In [93]:
f(0,1,2) # Normal

0, 1, and 2


In [94]:
f(*range(3)) # Unpack

0, 1, and 2


In [95]:
f(*(i for i in range(3))) # Unpack generator

0, 1, and 2


In [96]:
D = dict(a='Bob', b='dev', c=40.5)  
D

{'a': 'Bob', 'b': 'dev', 'c': 40.5}

In [97]:
f(a='Bob', b='dev', c=40.5) # Normal keyword

Bob, dev, and 40.5


In [98]:
f(**D)  # Unpack key value

Bob, dev, and 40.5


In [99]:
f(*D.values()) # Unpack values

Bob, dev, and 40.5


In [100]:
f(*D) # Unpack keys

a, b, and c


## Scramble Squence

In [101]:
S= 'spam'
for i in range(len(S)): # Cho S biến đổi 
    S = S[1:] + S[:1]
    print(S, end=' ')

pams amsp mspa spam 

In [102]:
def scramble(seq): # Cách thông thường
    res = []
    for i in range(len(seq)):
        res.append(seq[i:] + seq[:i])
    return res
scramble('spam')

['spam', 'pams', 'amsp', 'mspa']

In [103]:
def scramble(seq): # Sử dụng comprehension
    return [seq[i:] + seq[:i] for i in range(len(seq))]
scramble('spam')

['spam', 'pams', 'amsp', 'mspa']

In [104]:
def scramble(seq): # Sử dụng generator function cho S biến đổi
    for i in range(len(seq)):
        seq = seq[1:] + seq[:1] 
        yield seq
list(scramble('spam'))

['pams', 'amsp', 'mspa', 'spam']

In [105]:
def scramble(seq): # Sử dụng generator function 
    for i in range(len(seq)):
        yield seq[i:] + seq[:i]
list(scramble('spam'))

['spam', 'pams', 'amsp', 'mspa']

In [106]:
S='spam'
G = (S[i:] + S[:i] for i in range(len(S))) # Generator expression
list(G)

['spam', 'pams', 'amsp', 'mspa']

In [107]:
F = lambda seq: (seq[i:] + seq[:i] for i in range(len(seq))) # Lambda với Generator expression
F(S)

<generator object <lambda>.<locals>.<genexpr> at 0x03416D70>

In [108]:
list(F(S))

['spam', 'pams', 'amsp', 'mspa']

### Cách viết hàm map

In [109]:
# Cách 1: Viết thông thường với zip
def mymap(func, *seqs):
    res = []
    for args in zip(*seqs):
        res.append(func(*args))
    return res
print(mymap(abs, [-2, -1, 0, 1, 2]))
print(mymap(pow, [1, 2, 3], [2, 3, 4, 5]))

[2, 1, 0, 1, 2]
[1, 8, 81]


In [110]:
# Cách 2: Sử dụng list comprehension
def mymap(func, *seqs):
    return [func(*args) for args in zip(*seqs)]
print(mymap(abs, [-2,-1, 0, 1, 2]))
print(mymap(pow, [1, 2, 3], [2, 3, 4, 5]))

[2, 1, 0, 1, 2]
[1, 8, 81]


In [111]:
# Cách 3: Sử dụng generator function and expression
def mymap(func, *seqs):
    res = []
    for args in zip(*seqs):
        yield func(*args)
def mymap(func, *seqs):
    return (func(*args) for args in zip(*seqs))
print(list(mymap(abs, [-2,-1, 0, 1, 2])))
print(list(mymap(pow, [1, 2, 3], [2, 3, 4, 5])))

[2, 1, 0, 1, 2]
[1, 8, 81]


### Cách viết hàm zip

In [112]:
# Cách 1: Sử dụng generator function
def myzip(*seqs):
    seqs = [list(S) for S in seqs]
    while all(seqs):
        yield tuple(S.pop(0) for S in seqs)
S1, S2 = 'abc', 'xyz123'
list(myzip(S1, S2))

[('a', 'x'), ('b', 'y'), ('c', 'z')]

In [113]:
# Cách 2: Sử dụng comprehension and generator expression
def myzip(*seqs):
    minlen = min(len(S) for S in seqs)
    return [tuple(S[i] for S in seqs) for i in range(minlen)]
S1, S2 = 'abc', 'xyz123'
print(myzip(S1, S2))

[('a', 'x'), ('b', 'y'), ('c', 'z')]



## Lợi ích khi dùng generator:

Cả hai generator function và generator expression đều không tạo danh sách kết quả cùng một lúc nên chúng tiết kiệm dung lượng bộ nhớ và cho phép thời gian tính toán được chia nhiều phần để đạt được kết quả.

+ Kiểu dữ liệu generator **không tốn dữ liệu** như các kiểu dữ liệu khác string, list, tuple.

+ Các Generator chỉ có khả năng **sinh dữ liệu đúng một lần.**

# 3.4 Bài tập Excercise
**Câu 1:** Viết chương trình tạo ra list mới là các số chia hết cho 5 hoặc 7 từ list A [2,7,15,8,10,19].

**Câu 2:** Viết chương trình tạo ra danh sách các số lẻ từ danh sách [2,3,55,4,36].

**Câu 3:**  Viết chương trình tạo ra danh sách không có giá trị 19 từ danh sách [3,2,4,1,19,9].

**Câu 4:** Viết chương trình tạo ra danh sách các giá trị có index chẵn từ danh sách [1,3,4,5,9,10].

**Câu 5:** Viết chương trình tạo ra generator các số chia hết cho 7 trong khoảng từ 0 đến 100.

---

In [114]:
# 1
listA = [2,7,15,8,10,19]
listA_new = [i for i in listA if i%5==0 or i%7==0]
print (listA_new)

[7, 15, 10]


In [115]:
# 2
list_A=[2,3,55,4,36]
list_A_new=[i for i in list_A if i%2!=0]
print(list_A_new)

[3, 55]


In [116]:
# 3 
list_A = [3,2,4,1,19,9]
list_A_new = [i for i in listA if i!=19]
print (list_A_new)

[2, 7, 15, 8, 10]


In [117]:
# 4
list_A = [1,3,4,5,9,10]
list_A_new= [ele for i,ele in enumerate(list_A) if i%2==0]
print(list_A_new)

[1, 4, 9]


In [118]:
# 5
def Divisor(n):
    for i in range(n):
        if i%7==0:
            yield i
for i in Divisor(100):
    print(i,end=' ')

0 7 14 21 28 35 42 49 56 63 70 77 84 91 98 