# I01 `zip()`, `enumerate()`

## Mục đích

Bài hôm nay giới thiệu hai hàm quan trọng trong thao tác với các dữ liệu dạng danh sách và từ điển là `zip()` và `enumerate()`.


## `zip()`

Trước đây, chúng ta đã tạo từ điển codebook bằng tay. Đôi lúc bạn sẽ thấy mệt mỏi vì có phải gõ đi gõ lại theo cú pháp của từ điển. Bạn có thể nghĩ rằng nếu chúng ta có thể tạo một danh sách chìa khóa và một danh sách giá trị, sau đó ghép chúng vào với nhau thành từ điển thì sẽ thật tiện lợi (và dễ chỉnh sửa). Python làm việc này rất dễ dàng. Hãy xem ví dụ.

In [1]:
bmi_lvls = range(1, 4)    # Hãy nhớ đây là ba giá trị 1, 2, 3, không có giá trị 4
bmi_lbls = ["Thiếu cân", "Bình thường", "Thừa cân / Béo phì"]

dict(zip(bmi_lvls, bmi_lbls))

{1: 'Thiếu cân', 2: 'Bình thường', 3: 'Thừa cân / Béo phì'}

Bạn có thể thắc mắc hàm `zip()` thực sự đã làm gì. Thay vì sử dụng hàm `dict()` để tạo thư viện mới, hãy thử bỏ nó đi xem Python sẽ trả về cái gì.

In [2]:
zip(bmi_lvls, bmi_lbls)

<zip at 0x1f2cf210ec0>

Như bạn thấy, Python trả về cho chúng ta một đối tượng `zip`. Đối tượng này sẽ không có ý nghĩa gì cho đến khi bạn thực hiện một thao tác nào đó trên nó, chẳng hạn chuyển nó thành danh sách, bạn sẽ có một danh sách với các phần tử là tuple; mỗi tuple chứa một giá trị của từng danh sách mà chúng ta đã "zip". Để có thể zip hai (hoặc nhiều) danh sách với nhau, bạn phải đảm bảo chúng có số phần tử như nhau.

In [3]:
list(zip(bmi_lvls, bmi_lbls))

[(1, 'Thiếu cân'), (2, 'Bình thường'), (3, 'Thừa cân / Béo phì')]

Đối tượng `zip` cũng là một kiểu dữ liệu iterable. Khi đưa vào hàm lặp, bạn có thể sử dụng thẳng mà không cần chuyển đổi kiểu dữ liệu.

In [4]:
for key, value in zip(bmi_lvls, bmi_lbls):
    print(f"key = {key}, value = {value}")

key = 1, value = Thiếu cân
key = 2, value = Bình thường
key = 3, value = Thừa cân / Béo phì


Với đặc tính này, chúng ta có thể cung cấp thông tin cho hàm `dict()` để tạo từ điển. Hàm `zip()` tạo ra các cặp tuple chứa key-value, và giá trị đầu tiên của tuple sẽ được gán cho chìa khóa, còn giá trị sau gán cho giá trị tương ứng với chìa khóa trong từ điển.

```python
d = {}
for k, v in iterable_from_zip:
    d[k] = v
```

### Zip nhiều hơn hai danh sách

Như đã nói ở trên, bạn có thể zip nhiều danh sách với nhau.

In [5]:
means = [1, 2, 3, 4]
mins = [0, 0, 0, 0]
maxs = [5, 3, 7, 10]

for mean_val, min_val, max_val in zip(means, mins, maxs):
    print(f"{mean_val} [{min_val}, {max_val}]")

1 [0, 5]
2 [0, 3]
3 [0, 7]
4 [0, 10]


## `enumerate()`

Trong một số bài toán, bạn sẽ cần thao tác cùng lúc với cả chỉ mục và giá trị của các phần tử trong một danh sách. Ví dụ, chúng ta muốn in danh sách các phần tử và sẽ xuống hàng ở sau mỗi 5 phần tử:

In [6]:
numbers = list(range(20))

for i in range(20):
    print("{:3}".format(numbers[i]), end="")
    if (i + 1) % 5 == 0:
        print("")

  0  1  2  3  4
  5  6  7  8  9
 10 11 12 13 14
 15 16 17 18 19


Hoặc bạn có thể làm cách này.

In [7]:
i = 0

for value in numbers:
    print(f"{value:3}", end="")
    if (i + 1) % 5 == 0:
        print("")
    i += 1    # i = i + 1

  0  1  2  3  4
  5  6  7  8  9
 10 11 12 13 14
 15 16 17 18 19


Tuy nhiên, bạn sẽ thấy rằng chúng ta có thể sẽ phải lặp lại `numbers[i]` hoặc `i` vài lần nữa nếu còn dùng đến các biến này trong vòng lặp. Để tránh điều này, hàm `enumerate()` cho phép bạn truy cập vào chỉ mục và giá trị của phần tử đồng thời.

In [8]:
for i, value in enumerate(numbers):
    print(f"{value:3}", end="")
    if (numbers[i] + 1) % 5 == 0:
        print("")

  0  1  2  3  4
  5  6  7  8  9
 10 11 12 13 14
 15 16 17 18 19


Bạn có thể kết hợp cả `zip()` và `enumerate()` cùng với nhau.

In [9]:
colors = ["red", "gren", "blue"]
keys = list(range(10, 16))
values = ["Ba Dinh", "Hoan Kiem", "Cau Giay", "Hoang Mai", "Thanh Tri", "Tu Liem"]

for i, (key, value) in enumerate(zip(keys, values)):
    print("{} = {} ({})".format(key, value, colors[i % 3]))

10 = Ba Dinh (red)
11 = Hoan Kiem (gren)
12 = Cau Giay (blue)
13 = Hoang Mai (red)
14 = Thanh Tri (gren)
15 = Tu Liem (blue)


Và do đó, rất tiện lợi khi sử dụng với từ điển.

In [10]:
kv_dict = dict(zip(keys, values))

for i, (key, value) in enumerate(kv_dict.items()):
    print("{} = {} ({})".format(key, value, colors[i % 3]))

10 = Ba Dinh (red)
11 = Hoan Kiem (gren)
12 = Cau Giay (blue)
13 = Hoang Mai (red)
14 = Thanh Tri (gren)
15 = Tu Liem (blue)


---

[Bài trước](../01_basic/12_strfind.ipynb) - [Danh sách bài](../README.md) - [Bài sau](./02_lambda.ipynb)