# I02 Lambda, `map()`, `filter()`, và `reduce()`

## Mục đích

Trong bài này, bạn sẽ làm quen với khái niệm hàm lambda, và ứng dụng của nó trong các hàm `map()`, `filter()`, và `reduce()`.


## Hàm lambda

Giả sử bạn viết một hàm sau để tính tổng của hai số và trả về kết quả dưới dạng một biểu thức tính toán.

In [1]:
def add(a, b):
    return f"{a} + {b} = {a + b}"

add(10, 12)

'10 + 12 = 22'

Chúng ta có thể dùng hàm này để cộng nhiều cặp số với nhau và trả về một danh sách kết quả bằng list comprehension.

In [2]:
nums1 = [10, 5, 9, 7]
nums2 = [4, 3, 8, 11]

[add(a, b) for a, b in zip(nums1, nums2)]

['10 + 4 = 14', '5 + 3 = 8', '9 + 8 = 17', '7 + 11 = 18']

Nếu không muốn khai báo hàm, bạn có thể dùng hàm lambda. Hàm lambda hoạt động tương tự như từ khóa `def`, bạn có thể khai báo bao nhiêu đối số tùy thích, nhưng tất cả các đối số này đều là đối số bắt buộc.

In [3]:
f = lambda a, b: f"{a} + {b} = {a + b}"
[f(a, b) for a, b in zip(nums1, nums2)]

['10 + 4 = 14', '5 + 3 = 8', '9 + 8 = 17', '7 + 11 = 18']

## `map()`

Cách viết ở trên vẫn chưa phải là lí do hàm lambda trở nên phổ biến và được dùng rộng rãi trong Python. Hàm `map()` cho phép chúng ta lặp qua một danh sách, lấy mỗi phần tử của danh sách đó làm đối số cho một hàm. Kết quả trả về là một iterator (chúng ta sẽ tìm hiểu định nghĩa của nó trong bài sau), và chúng ta có thể chuyển đổi đối tượng này sang một dạng dữ liệu khác, ví dụ `list`.

In [4]:
list(map(lambda a, b: add(a, b), nums1, nums2))

['10 + 4 = 14', '5 + 3 = 8', '9 + 8 = 17', '7 + 11 = 18']

Trong trường hợp bạn không có hai danh sách như ở trên mà chỉ có một danh sách, trong đó mỗi danh sách là một list hoặc tuple chứa các phần tử `a` và `b`, bạn có thể dùng chức năng giải nén.

In [5]:
list(map(lambda x: add(*x), zip(nums1, nums2)))

['10 + 4 = 14', '5 + 3 = 8', '9 + 8 = 17', '7 + 11 = 18']

Chức năng của hàm `map()` và lambda function tương tự với hàm `sapply()` trong R. Tuy nhiên, khi sử dụng đến các thư viện như Pandas, bạn sẽ thấy lambda function được tích hợp rất trôi chảy vào trong thư viện Pandas, do đó, việc thao tác trên các bộ dữ liệu thuận lợi hơn rất nhiều so với việc sử dụng thư viện `dplyr` của R. Một ví dụ "nhá hàng" để bạn thấy năng lực của hàm lambda và một hàm tương tự `map()` tên là `apply()` trong Pandas.

In [6]:
import pandas as pd
d = pd.DataFrame({
    "md": [2, 3, 4, 5],
    "cil": [1, 2, 3, 4],
    "ciu": [3, 4, 5, 6]
})

d["summary"] = d.apply(lambda x: "{:.2f} ({:.2f}, {:.2f})".format(*x), axis=1)
d

Unnamed: 0,md,cil,ciu,summary
0,2,1,3,"2.00 (1.00, 3.00)"
1,3,2,4,"3.00 (2.00, 4.00)"
2,4,3,5,"4.00 (3.00, 5.00)"
3,5,4,6,"5.00 (4.00, 6.00)"


## `filter()`

Tương tự như `map()`, `filter()` cũng sử dụng hàm lambda, nhưng để lọc ra các phần tử thỏa mãn điều kiện. Do đó, hàm lambda này phải trả về giá trị kiểu `bool`.

In [7]:
a = [1, 2, 3, 4]
list(filter(lambda x: x > 2, a))

[3, 4]

Bạn có thể thao tác phức tạp hơn trên hàm `filter()` này. Ví dụ, đoạn lệnh dưới đây lọc ra các cặp phần tử có tổng lớn hơn 5.

In [8]:
a = [1, 2, 3, 4]
b = [2, 3, 4, 5]

f = lambda a, b: a + b > 5

list(filter(lambda x: f(*x), zip(a, b)))

[(3, 4), (4, 5)]

Tương tự như `map()`, `filter()` trả về một đối tượng kiểu `filter` là iterator. Bạn có thể chuyển đối nó thành bất kì đối tượng nào bạn muốn, miễn là không vi phạm logic lập trình.

In [9]:
a = [1, 2, 3, 4]
b = ["fu1_wbc", "fu2_wbc", "fu1_hb", "fu2_hb"]

dict(filter(lambda x: x[1].startswith("fu2_"), zip(a, b)))

{2: 'fu2_wbc', 4: 'fu2_hb'}

## `functools.reduce()`

Hai hàm ở trên xử lí riêng biệt từ phần tử trong danh sách, còn hàm `reduce()` trong thư viện `functools` sẽ xâu chuỗi các phần tử này lại với nhau. Chẳng hạn, chúng ta muốn tính tích của tất cả các phần tử trong danh sách.

In [10]:
from functools import reduce
a = range(1, 6)
reduce(lambda x, y: x * y, a)

120

Bạn có thể "reduce" cả dữ liệu dạng kí tự.

In [11]:
a = ["Welcome", "to", "intermediate", "Python"]
reduce(lambda x, y: f"{x} {y}", a)

'Welcome to intermediate Python'

---

[Bài trước](./01_zipenum.ipynb) - [Danh sách bài](../README.md) - [Bài sau](./03_yield.ipynb)