# B08 Bộ (`tuple`), Từ điển (`dict`), và Tập (`set`)

## Mục đích

Giới thiệu các cấu trúc dữ liệu quan trọng khác của Python: **bộ**, **từ điển**, và **tập**.


## Tuple

Tuple là một cấu trúc dữ liệu tương tự như `list` nhưng không thể sửa được (immutable), nghĩa là một khi bạn đã gán dữ liệu cho nó thì không thể sửa được nội dung của dữ liệu nữa. Cấu trúc tuple thường được sử dụng để cung cấp giá trị cho các đối số của hàm.

Một tuple có thể được khởi tạo bằng cặp dấu ngoặc tròn `()`. Sau khi khởi tạo, bạn hoàn toàn có thể truy cập vào các phần tử của nó bằng chỉ mục.

In [1]:
tup = (0, 1)
print(tup[1])
# Bạn không thể: tup[1] = 2

1


## Từ điển

Dictionary là một cấu trúc dữ liệu đặc biệt bao gồm **chìa khóa** (key) và **giá trị** (value). Thay vì truy cập bằng chỉ mục như `list`, chúng ta sẽ truy cập bằng chìa khóa trong `dict`.

Chúng ta có thể khởi tạo từ điển trống bằng cặp dấu ngoặc móc `{}` hoặc hàm `dict()`.

In [2]:
codebook = {}
len(codebook)

0

Việc thêm dữ liệu vào từ điển hết sức dễ dàng. Bạn sẽ cần thông báo cho Python cả chìa khóa và giá trị của mỗi bản ghi trong từ điển.

In [3]:
codebook[1] = "Female"
codebook

{1: 'Female'}

Khác với R, chìa khóa của từ điển trong Python có thể là bất kì kiểu dữ liệu nào, dù đơn giản hay phức tạp.

In [4]:
codebook[("Sex", 0)] = "Male"
codebook

{1: 'Female', ('Sex', 0): 'Male'}

Nếu muốn khởi tạo một từ điển có các cặp key-value ngay từ đầu, bạn phân cách chìa khóa và giá trị bằng dấu hai chấm `:`.

In [5]:
codebook = {("Sex", 0): "Male", ("Sex", 1): "Female"}
codebook[("Sex", 0)]

'Male'

Thậm chí chúng ta có thể lồng từ điển trong từ điển.

In [6]:
codebook = {"Sex": {0: "Male", 1: "Female"}}
codebook["Sex"][1]

'Female'

Bạn không thể truy ngược từ giá trị ra chìa khóa.

```python
codebook["Female"]
```

```
KeyError: 'Female'
```

### Các hàm thao tác với từ điển

Bạn có thể lặp qua danh sách chìa khóa, giá trị, hoặc các cặp key-value của Python. Xem ví dụ sau.

In [7]:
codebook = {0: "Male", 1: "Female"}

for key in codebook:
    print(key, codebook[key])


0 Male
1 Female


Nếu muốn lặp qua danh sách giá trị, chúng ta sẽ sử dụng hàm `values()` của từ điển.

In [8]:
for value in codebook.values():
    print(value)


Male
Female


Nếu muốn lặp qua các cặp key-value, chúng ta sẽ sử dụng hàm `items()` của từ điển. Đoạn lệnh dưới đây sử dụng kĩ thuật unpacking, mình sẽ giới thiệu trong một bài tiếp theo.

In [9]:
for key, value in codebook.items():
    print(key, value)


0 Male
1 Female


### Bài toán

Cho chuỗi kí tự `s` như sau: `"Toan: 10, Van: 7, Tieng Anh: 9"`. Hãy tạo ra một từ điển trong đó chìa khóa là tên môn học và giá trị là điểm số của môn học.

Trong đoạn code dưới đây, mình sử dụng hàm `int()` để chuyển giá trị `str` thành giá trị `int()`. Lưu ý: hàm này sẽ báo lỗi nếu giá trị `str` chứa những kí tự không chuyển được thành dạng số.

In [10]:
s = "Toan: 10, Van: 7, Tieng Anh: 9"

score_dict = {}

for i in s.split(","):
    ketqua = i.split(":")
    monhoc = ketqua[0].strip()
    diemso = int(ketqua[1])
    score_dict[monhoc] = diemso

score_dict

{'Toan': 10, 'Van': 7, 'Tieng Anh': 9}

### Dictionary comprehension

Tương tự như list comprehension, chúng ta cũng có thể tạo một từ điển dựa trên vòng lặp.

In [11]:
values = ["Male", "Female"]
{i: values[i] for i in range(len(values))}

{0: 'Male', 1: 'Female'}

Trong các chủ đề trung cấp, chúng ta sẽ tìm hiểu thêm một số công cụ rất mạnh để thao tác trên từ điển và cho phép chúng ta sử dụng dictionary comprehension linh hoạt hơn nữa.


## Tập

Set cũng giống list và tuple, đều là danh sách dữ liệu một chiều, nhưng đặc biệt ở chỗ cho phép thao tác một số phép toán trên tập (giống như trong toán học rời rạc). Tập được khai báo bằng cặp dấu ngoặc móc `{}` (giống như khai báo từ điển, nhưng đừng nhầm hai kiểu dữ liệu với nhau - từ điển phải có key).

Chúng ta sẽ cùng xem các phép hợp (union) và giao (intersection) thực hiện trên tập trong Python.

In [12]:
a = {1, 2, 3}
b = {2, 3, 4}

print(a.union(b))
print(a.intersection(b))

{1, 2, 3, 4}
{2, 3}


Một phép toán nữa được thực hiện trên tập là phép trừ. Trong phép trừ này, thứ tự của toán hạng rất quan trọng (tập A trừ tập B khác với tập B trừ tập A). Phép trừ của tập A trừ B sẽ giữ lại các phần tử ở trong tập bị trừ (A) mà không xuất hiện trong tập trừ (B).

In [13]:
print(a.difference(b))
print(b.difference(a))

{1}
{4}


Việc chuyển đổi giữa list, tuple, và set hết sức dễ dàng trong Python.

In [14]:
a = range(5)
b = list(a)
c = tuple(b)
d = set(c)

print(a)
print(b)
print(c)
print(d)

range(0, 5)
[0, 1, 2, 3, 4]
(0, 1, 2, 3, 4)
{0, 1, 2, 3, 4}


---

[Bài trước](./07_def.ipynb) - [Danh sách bài](../README.md) - [Bài sau](./09_unpacking.ipynb)