# **Từ điển (Dictionaries)**

Bây giờ chúng ta hãy nói về một kiểu dữ liệu rất hữu ích khác: **từ điển**. Kiểu `dict` cho phép bạn tạo ánh xạ từ khóa (key) đến giá trị (value). Ví dụ, bạn có thể sử dụng từ điển để ánh xạ tên các bang của Úc với tên thủ đô tương ứng của chúng. Dưới đây là một từ điển literal biểu diễn điều này.

```python
capitals = {'Victoria': 'Melbie',
    'New South Wales': 'Sydney',
    'Queensland': 'Brisbane',
    'Tasmania': 'Hobart',
    'South Australia': 'Adelaide',
    'Western Australia': 'Perth'}

print(capitals['Tasmania'])
```

(Đúng vậy, có một lỗi cố ý ở đó — `'Melbie'`. Chúng ta sẽ sửa nó ngay.)

**Khóa (keys)** trong từ điển trên là các chuỗi đại diện cho tên các bang của Úc. Mỗi khóa ánh xạ tới một **giá trị (value)**, trong trường hợp này cũng là một chuỗi. Trong trường hợp tổng quát, khóa và giá trị có thể có kiểu khác nhau. Lưu ý cú pháp chúng ta sử dụng ở đây để biểu diễn các cặp khóa-giá trị: khóa đứng trước, theo sau là giá trị, và dấu hai chấm (`:`) được sử dụng để ghép chúng lại với nhau (đúng vậy, *lại một* cách sử dụng khác của dấu hai chấm, ngoài những gì chúng ta đã thấy: slicing và code-blocking).

Giá trị từ điển được xây dựng bằng cách sử dụng các ký tự dấu ngoặc nhọn `{` và `}`. Như một trường hợp đặc biệt, bạn có thể tạo một từ điển rỗng bằng cách sử dụng dấu ngoặc mở và đóng không có gì ở giữa:

```python
example_empty_dict = {}
```

Trong đoạn mã trên, một từ điển rỗng được tạo và gán cho biến `example_empty_dict`. Hiện tại từ điển này không chứa ánh xạ nào, vì vậy nó khá không thú vị. Như bạn sẽ sớm thấy, có thể thêm ánh xạ mới vào một từ điển hiện có, vì vậy việc tạo từ điển rỗng và sau đó thêm giá trị khi cần thiết có thể hữu ích.

# **Lập chỉ mục cho Dictionary (Từ điển)**

Giống như list và string, dictionary cũng có thể **lập chỉ mục**. Tuy nhiên, chỉ mục của dictionary là các key có giá trị tùy ý, trong khi chỉ mục của list và string luôn là số nguyên. Một key nhất định chỉ có thể xuất hiện một lần trong dictionary và được liên kết với một giá trị duy nhất (nhưng tất nhiên, bạn có thể làm cho giá trị đó là một list chứa nhiều đối tượng). Bạn có thể tra cứu giá trị trong dictionary bằng cách sử dụng ký hiệu lập chỉ mục thông thường. Chúng ta gọi điều này là thực hiện **tra cứu dictionary**:

```python
capitals = {'Victoria': 'Melbourne',
            'New South Wales': 'Sydney',
            'Queensland': 'Brisbane',
            'Tasmania': 'Hobart',
            'South Australia': 'Adelaide',
            'Western Australia': 'Perth'}

print(capitals['Victoria'])
print(capitals['Queensland'])
print(capitals['ACT'])  # Đây là LỖI!
```

**Kết quả:**
```
Melbourne
Brisbane
Traceback (most recent call last):
  File "program.py", line 9, in <module>
    print(capitals['ACT'])
KeyError: 'ACT'
```

Lưu ý rằng nếu chỉ mục không phải là key trong dictionary (ví dụ `'ACT'`) thì bạn sẽ gặp lỗi `KeyError`!

# Các Phương Thức Dictionary

Hãy cùng tìm hiểu một số phương thức của dictionary.

Phương thức `.get()` nhận một key làm tham số và trả về giá trị liên kết với nó. Sự khác biệt giữa phương thức này và việc truy xuất trực tiếp là trong trường hợp key không tồn tại, việc truy xuất trực tiếp sẽ ném ra lỗi trong khi sử dụng `.get()` sẽ đơn giản trả về `None`.

Phương thức `.pop()` nhận một key làm tham số và trả về giá trị, đồng thời **xóa** cặp key-value đó. Điều này tương tự như cách `.pop()` được sử dụng cho lists ở chỗ nó thay đổi dictionary được gọi và trả về giá trị nếu thực thi thành công, hoặc `KeyError` nếu key không được tìm thấy trong dictionary (loại lỗi nào được ném ra bởi `.pop()` trong trường hợp của list khi nó thất bại?).

Cuối cùng, phương thức `.clear()` xóa toàn bộ nội dung của một dictionary. Giống như `.pop()`, đây là một phương thức thay đổi, vì vậy đừng gán nó cho bất cứ thứ gì!

```python
my_dict = {"Age":34,"Anna":"Joe","Jobs":"Steve"}
```

```python
print(my_dict.get("Age"))
```

```python
print(my_dict)
```

```python
print(my_dict.pop("Jobs"))
```

```python
print(my_dict)
```

```python
my_dict.clear()
```

```python
print(my_dict)
```

# Cập nhật Dictionary

Trong trường hợp bạn đã bỏ lỡ từ slide trước, dictionary là **có thể thay đổi** (mutable). Vì vậy, giống như list, nội dung của chúng có thể được thay đổi sau khi đã được khởi tạo. Bạn có thể thay đổi giá trị được liên kết với một key hoặc thêm một cặp key-value mới vào dictionary bằng cách sử dụng toán tử gán (`=`):

```python
capitals = {'Victoria': 'Melbie',
            'New South Wales': 'Sydney',
            'Queensland': 'Brisbane',
            'Tasmania': 'Hobart',
            'South Australia': 'Adelaide',
            'Western Australia': 'Perth'}

print(capitals['Victoria'])

capitals['Victoria'] = 'Melbourne'
capitals['ACT'] = 'Canberra'

print(capitals['Victoria'])
print(capitals['ACT'])
```

`'Victoria'` bây giờ ánh xạ đến giá trị `'Melbourne'` thay vì `'Melbie'`, do đó sửa lỗi trước đó (phù!). Key `'ACT'` không có trong dictionary trước câu lệnh gán, vì vậy đoạn code trên mở rộng dictionary với một mục ánh xạ mới.

# Kiểm tra thành viên trong Dictionary

Bạn có thể kiểm tra xem một key có tồn tại trong dictionary hay không bằng cách sử dụng toán tử `in`. Hãy thử chạy đoạn code sau vài lần, nhập cả tên bang hợp lệ và không hợp lệ:

```python
capitals = {'Victoria': 'Melbourne',
            'New South Wales': 'Sydney',
            'Queensland': 'Brisbane',
            'Tasmania': 'Hobart',
            'South Australia': 'Adelaide',
            'Western Australia': 'Perth'}

state = input('Nhập tên bang: ')

if state in capitals:
    print(capitals[state])
else:
    print(state, 'không tìm thấy')
```

Toán tử `in` đặc biệt hữu ích vì nếu chúng ta chạy dòng code `print(capitals[state])` mà giá trị của `state` không tồn tại như một key trong dictionary, nó sẽ tạo ra lỗi `KeyError` như được hiển thị bên dưới. Với `in`, chúng ta có thể xác nhận rằng một key tồn tại và sẽ không gây ra lỗi trước khi sử dụng nó.

```python
capitals = {'Victoria': 'Melbourne'}
print(capitals["Queensland"])
```

```
Traceback (most recent call last):
  File "program.py", line 8, in <module>
    print(capitals["Queensland"])
KeyError: 'Queensland'
```

# Truy cập tất cả các Keys (Khóa)

Bạn có thể lấy các khóa trong dictionary bằng phương thức `.keys()`. `.keys()` trả về một collection đặc biệt có thể lặp được gọi là `dict_keys` view object, hỗ trợ việc lặp và toán tử `in` giống như `list`, nhưng **không** hỗ trợ indexing. Nếu bạn muốn index, bạn sẽ phải chuyển đổi nó thành `list()` một cách rõ ràng.

```python
capitals = {'Victoria': 'Melbourne',
            'New South Wales': 'Sydney'}

keys = capitals.keys()

print("The keys:", keys)

print("Looping through all keys:")
for key in keys:
    print(key)

state = 'Victoria'
print(f"Is '{state}' in keys?", state in keys)

print(keys[0])  # Đây là LỖI!
```

**Output:**
```
The keys: dict_keys(['New South Wales', 'Victoria'])
Looping through all keys:
New South Wales
Victoria
Is 'Victoria' in keys? True
Traceback (most recent call last):
  File "program.py", line 12, in <module>
    print(keys[0])  # This is an ERROR!
TypeError: 'dict_keys' object does not support indexing
```

Bạn có thể thắc mắc "*view object* là gì?" Không cần phải lo lắng về các chi tiết phức tạp; tất cả những gì bạn cần biết là chúng hỗ trợ một tập con các chức năng mà list hỗ trợ - lặp và kiểm tra thành viên. Đối với bất kỳ hành vi nào khác mà bạn có thể muốn, bạn có thể chuyển đổi các view object thành list bằng cách sử dụng hàm chuyển đổi `list()` trước.

## Có hữu ích không?

Phương thức `.keys()` không thực sự hữu ích trong thực tế, bởi vì việc tham chiếu đến một dictionary sẽ tự động tham chiếu đến các khóa của nó.

Chúng ta đã thấy ở slide trước đó rằng toán tử `in` kiểm tra thành viên trong các khóa của dictionary. Nếu chúng ta muốn lặp qua các khóa của dictionary như trên, chúng ta có thể chỉ cần lặp qua bản thân dictionary:

```python
capitals = {'Victoria': 'Melbourne',
            'New South Wales': 'Sydney'}

for key in capitals:
    print(key)
```

# Truy cập tất cả Keys và Values

Một phương thức hữu ích khác cho dictionary là phương thức `.items()`. Tương tự như `.keys()` và `.values()`, `.items()` trả về một view object gọi là `dict_items` chứa một 2-tuple cho mỗi cặp `(key, value)`.

Bạn có thể lặp qua từng cặp với vòng lặp `for pair in <dict>.items():`, nhưng Python cho phép bạn *unpack* hai giá trị đó bên trong mỗi tuple bằng cách chỉ định hai biến vòng lặp. Hãy xem vòng lặp dưới đây:

```python
capitals = { 'Victoria': 'Melbourne',
             'New South Wales': 'Sydney' }

d_items = capitals.items()

print("Items in this dictionary:", d_items)
print("As a list:", list(d_items))

for key, value in d_items:
    print(key, value)
```

Slide tiếp theo sẽ đi sâu hơn về unpacking.

## Có ích không?

Bạn sẽ tìm thấy nhiều cách sử dụng khác nhau cho `.items()` khi làm việc với dictionary, vì nó cho phép bạn xử lý các cặp `(key, value)` riêng lẻ. Ví dụ, bạn có thể muốn sắp xếp các keys theo *values* của chúng. Có những cách thanh lịch hơn, chẳng hạn như sử dụng đối số `key` trong `sorted()`, nhưng khi sử dụng `.items()` bạn chỉ cần hoán đổi thứ tự của keys và values, và sắp xếp danh sách tuple kết quả:

```python
my_dict = {"Melbourne": 5, "Sydney": 2, "Brisbane": 3}
swapped = []

for key, value in my_dict.items():
    swapped.append((value, key))

for value, key in sorted(swapped):
    print(key)
```

# Đếm Các Phần Tử Với Dictionary

Một nhiệm vụ lập trình phổ biến là theo dõi số lần xuất hiện của các mục khác nhau trong một tập hợp dữ liệu. Dưới đây là một chương trình ví dụ đếm số lần xuất hiện của mỗi chữ cái trong đoạn đầu tiên của Moby Dick:

```python
MOBY = """Call me Ishmael. Some years ago - never mind how long precisely - having little or no money in my purse, and nothing particular to interest me on shore, I thought I would sail about a little and see the watery part of the world. It is a way I have of driving off the spleen and regulating the circulation. Whenever I find myself growing grim about the mouth; whenever it is a damp, drizzly November in my soul; whenever I find myself involuntarily pausing before coffin warehouses, and bringing up the rear of every funeral I meet; and especially whenever my hypos get such an upper hand of me, that it requires a strong moral principle to prevent me from deliberately stepping into the street, and methodically knocking people's hats off - then, I account it high time to get to sea as soon as I can. This is my substitute for pistol and ball. With a philosophical flourish Cato throws himself upon his sword; I quietly take to the ship. There is nothing surprising in this. If they but knew it, almost all men in their degree, some time or other, cherish very nearly the same feelings towards the ocean with me."""
```

```python
tally = {}
```

```python
for char in MOBY:
    if char in tally:
        tally[char] += 1
    else:
        tally[char] = 1
```

```python
print(tally['C'])
print(tally['I'])
```

```
2
12
```

Đoạn code trên gán văn bản của đoạn đầu tiên trong Moby Dick cho biến `MOBY`. Một dictionary rỗng mới được tạo và gán cho `tally`. Vòng lặp `for` đếm số lần mỗi ký tự xuất hiện trong chuỗi được gán cho `MOBY`. Mỗi lần lặp, code kiểm tra xem chữ cái hiện tại `char` đã có trong dictionary `tally` chưa. Nếu có, số đếm tương ứng của nó được tăng lên. Nếu không, nó được thêm vào dictionary và số đếm được đặt thành `1`. Lý do chúng ta cần làm điều này là nếu chúng ta cố gắng tăng một giá trị liên kết với một key không tồn tại, chúng ta sẽ gặp `KeyError` (vì không có giá trị sẵn có để tăng):

```python
votes = {}
votes['Melbourne'] = 'many!'
votes['anywhere else'] += 1  # Điều này sẽ gây ra KeyError
```

Khi chương trình hoàn thành, nó in ra số lượng các trường hợp của các chữ cái `C` và `I` trong văn bản.

# **Biểu Đồ Tần Suất Ký Tự**

Sau khi đếm tất cả các ký tự trong đoạn đầu tiên của Moby Dick, bạn có thể làm những điều thú vị với thông tin này. Ví dụ, bạn có thể in ra một biểu đồ cột đơn giản về tần suất của tất cả các chữ cái viết hoa xuất hiện trong văn bản, theo thứ tự bảng chữ cái:

```python
MOBY = """Call me Ishmael. Some years ago - never mind how long precisely - having little or no money in my purse, and nothing particular to interest me on shore, I thought I would sail about a little and see the watery part of the world. It is a way I have of driving off the spleen and regulating the circulation. Whenever I find myself growing grim about the mouth; whenever it is a damp, drizzly November in my soul; whenever I find myself involuntarily pausing before coffin warehouses, and bringing up the rear of every funeral I meet; and especially whenever my hypos get such an upper hand of me, that it requires a strong moral principle to prevent me from deliberately stepping into the street, and methodically knocking people's hats off - then, I account it high time to get to sea as soon as I can. This is my substitute for pistol and ball. With a philosophical flourish Cato throws himself upon his sword; I quietly take to the ship. There is nothing surprising in this. If they but knew it, almost all men in their degree, some time or other, cherish very nearly the same feelings towards the ocean with me."""
```

```python
tally = {}
```

```python
for char in MOBY:
    if char in tally:
        tally[char] += 1
    else:
        tally[char] = 1
```

```python
for key in sorted(tally):
    if key.isupper():
        print(f"{key}: {'=' * tally[key]}")
```

**Kết quả đầu ra:**
```
C: ==
I: ============
N: =
S: =
T: ==
W: ==
```

Đối với mỗi khóa trong `tally`, đoạn code kiểm tra xem nó có phải là chữ cái viết hoa hay không bằng cách sử dụng `.isupper()`. Nếu là chữ viết hoa, nó sẽ in ra một thanh với số lượng ký tự `'='` bằng với số lần xuất hiện của ký tự đó trong `tally`, sử dụng toán tử lặp chuỗi `*`. Từ kết quả đầu ra của đoạn code, bạn có thể thấy rằng, ví dụ, có hai lần xuất hiện của `C` trong văn bản, và 12 lần xuất hiện của `I`.

# Thực hành: Đếm với Dictionary

Hãy thực hành sử dụng dictionary để đếm các phần tử bằng cách xây dựng đoạn code sau đây cùng nhau.

Trong đoạn code bên dưới, chúng ta có một `fruit_basket` (giỏ trái cây), đây là một danh sách tên các loại trái cây, và một số code đơn giản để lặp qua danh sách và in ra nội dung.

Chúng ta sẽ chỉnh sửa đoạn code này, sử dụng dictionary, để giúp đếm số lượng của từng loại trái cây trong giỏ.

```python
# Giỏ trái cây
fruit_basket = ['orange', 'coconut', 'cherry', 'orange', 'coconut', 'apple', 'pear', 'pear', 'cherry', 'cherry', 'pear']
```

```python
for fruit in fruit_basket:
    print(fruit)
```

## Bài tập:

**1.** Chạy đoạn code ví dụ ở trên để xem code hoạt động. Bạn nghĩ kết quả đầu ra sẽ như thế nào?

**2.** Hãy tạo một dictionary để giúp chúng ta đếm. Tạo một dictionary rỗng và lưu nó trong một biến có tên **fruits_seen**. Đảm bảo tạo dictionary này *bên ngoài vòng lặp* để chúng ta không tạo dictionary rỗng mới mỗi lần vòng lặp chạy.

**3.** Ở cuối chương trình, thêm một câu lệnh **print()** để chúng ta có thể xem nội dung của dictionary **fruits_seen**. Chạy lại chương trình. Kết quả hiện tại sẽ hiển thị dictionary rỗng, vì chúng ta chưa sử dụng nó.

**4.** Trong vòng lặp, hãy viết một số code để thêm một mục mới vào dictionary cho mỗi loại trái cây được thấy. *Key* (khóa) sẽ là *tên của loại trái cây* từ giỏ trái cây, và *value* (giá trị) sẽ là *1*. Chạy lại code để xem nội dung của dictionary.

**5.** Dictionary của chúng ta thực tế chưa đếm gì cả — thêm một câu lệnh **if** để kiểm tra xem dictionary đã chứa loại trái cây đó làm key chưa. Nếu có, hãy cộng thêm một vào giá trị hiện tại, thay vì đặt giá trị thành *1*. Nếu key *không tồn tại*, thì chúng ta nên đặt giá trị thành *1* (đây là lần đầu tiên chúng ta thấy loại trái cây cụ thể đó!). Chạy lại code để xem kết quả.

### 💡 Mẹo
Nhớ rằng để kiểm tra xem một key có tồn tại trong dictionary hay không, chúng ta có thể đơn giản sử dụng từ khóa `in` trực tiếp trên dictionary. Việc gọi phương thức `.keys()` trên dictionary sẽ là thừa và do đó nên tránh.

# **Tóm tắt về Dictionary (Từ điển)**

Qua những slide vừa rồi, chúng ta đã học về kiểu dữ liệu `dict` và cách sử dụng hữu ích của nó.

* Dictionary cho phép bạn tạo ánh xạ từ key (khóa) đến value (giá trị). Key và value có thể thuộc các kiểu khác nhau. Chỉ có thể có một instance của một key nhất định trong dictionary, và nó được liên kết với một giá trị duy nhất.
* Key phải là bất biến (immutable), nhưng value có thể thuộc bất kỳ kiểu nào.
* Dictionary đặc biệt tốt trong việc đếm các thứ. Đây là một cách sử dụng phổ biến của chúng.

```python
empty_dict = {}
```

```python
new_dict = {'number': 1, 'letter': 'a'}
```

```python
new_dict['hello'] = 'world'
```

```python
print(new_dict)
```

* Dictionary rỗng được định nghĩa bằng một cặp dấu ngoặc nhọn rỗng `{}`.
* Dictionary literal có thể khởi tạo dictionary với một số cặp key-value, với cú pháp `{<key1>: <value1>, <key2>: <value2>}`.
* Dictionary có thể thay đổi (mutable): bạn có thể thay đổi giá trị được liên kết với một key hoặc thêm cặp key-value mới vào dictionary bằng toán tử gán (`=`).

```python
new_dict = {'number': 1, 'letter': 'a'}
```

```python
print(new_dict['number'])
```

```python
print(new_dict['hello'])  # KeyError
```

* **Dictionary lookup** (tra cứu từ điển) có thể được thực hiện để trả về giá trị cho một key cụ thể, sử dụng ký hiệu indexing quen thuộc: `<tên dict>[<key>]`.
* Cố gắng tra cứu một key không có trong dictionary sẽ dẫn đến `KeyError`.

Chúng ta đã học về các phương thức và toán tử dictionary sau:

* Phương thức `.get()` nhận một key làm đối số và trả về giá trị liên kết với nó, hoặc `None` nếu key không tồn tại.
* Phương thức `.pop()` nhận một key làm đối số và xóa cặp key-value, trả về giá trị.
* Phương thức `.clear()` xóa tất cả các cặp key-value khỏi dictionary.
* Khi được sử dụng với dictionary, toán tử `in` sẽ kiểm tra sự hiện diện của một key.
* Các phương thức `.keys()` và `.values()` trả về một collection có thể lặp của các key và value, tương ứng, của dictionary mà chúng được gọi.
* Phương thức `.items()` trả về một collection có thể lặp của các tuple có dạng `(key, value)` cho mỗi entry key-value trong dictionary.
   * Tuple này có thể được **unpacked** (giải nén) để tách các biến:

```python
my_dict = {'first': 1, 'second': 2, 'third': 3}
```

```python
for key, value in my_dict.items():
    print(key, value)
```