# 🐍 SERIES TỰ HỌC PYTHON CÙNG XÓM  
## BÀI 5: Dictionary,Set trong Python

### 🎯 Mục tiêu bài học:
- Làm quen với 2 kiểu dữ liệu có cấu trúc còn lại trong Python: `dictionary` và `set`
- Hiểu rõ cách hoạt động của `dictionary` dưới dạng key-value và `set` với tính chất tập hợp
- Thực hành các thao tác khai báo, truy cập, cập nhật và sử dụng một số method phổ biến
- So sánh đặc điểm, điểm mạnh – điểm yếu của từng kiểu để ứng dụng hiệu quả vào bài toán thực tế

Cùng bắt đầu nhé! 👇


<!-- Tác giả: Xóm Data _ daiduong.eth -->
## **🧾 D_03. Python Data Types Phần 3 (Dictionary & Set trong Python)**

Trong Python, khi bạn muốn **ánh xạ thông tin theo cặp** hoặc **làm việc với tập hợp không trùng lặp**, bạn sẽ dùng đến `dictionary` và `set` – 2 kiểu dữ liệu có cấu trúc rất mạnh mẽ.

🔹 Những kiểu này cho phép bạn:

- Lưu trữ **cặp giá trị** (key – value) để tra cứu nhanh (với `dict`)
- Làm việc với **tập hợp các giá trị duy nhất**, loại bỏ trùng lặp (với `set`)
- Hỗ trợ nhiều thao tác phổ biến trong xử lý dữ liệu, từ tiền xử lý đến phân tích

| **Kiểu dữ liệu** | **Mô tả ngắn gọn**                            | **Ví dụ sử dụng thực tế**                          |
|------------------|-----------------------------------------------|----------------------------------------------------|
| `dict`           | Cấu trúc key–value, cho phép tra cứu nhanh     | Hồ sơ người dùng: `{'name': 'An', 'age': 20}`      |
| `set`            | Tập hợp không trùng lặp, không có thứ tự       | Danh sách ID duy nhất, loại bỏ các hashtag trùng   |


## I. DICTIONARY

#### 📦 1. Dictionary là gì?

**Dictionary** (từ điển) là một kiểu dữ liệu có cấu trúc trong Python,  
dùng để lưu trữ các giá trị dưới dạng **cặp khóa – giá trị** (*key – value*).

📌 Mỗi khóa (key) là duy nhất, và dùng để truy cập nhanh giá trị đi kèm.

📌 Cú pháp khai báo:
```python
my_dict = {key_1: value_1, key_2: value_2, ..., key_n: value_n}


#### 📦 2. Đặc điểm nổi bật của Dictionary

Dưới đây là những đặc điểm quan trọng giúp Dictionary trở thành kiểu dữ liệu cực kỳ mạnh trong Python:

1. ✅ **Không có thứ tự (Unordered)** *(trước Python 3.7)*,  
   ✅ **Duy trì thứ tự thêm vào (Ordered)** *(từ Python 3.7 trở đi)*  
2. ✅ **Không cho phép key trùng lặp**  
3. ✅ **Cho phép value trùng lặp**  
4. ✅ **Có thể chứa nhiều kiểu dữ liệu khác nhau (ở cả key và value)**  
5. ✅ **Có thể thay đổi (Mutable)**  
6. ✅ **Truy cập nhanh bằng key thay vì chỉ số**

In [5]:
# 1. ✅ Có thứ tự (Python 3.7+)
my_dict = {"a": 1, "b": 2, "c": 3}
print("Keys theo thứ tự thêm:", list(my_dict.keys()))   # ['a', 'b', 'c']

Keys theo thứ tự thêm: ['a', 'b', 'c']


In [7]:
# 2. ✅ Không cho phép key trùng lặp
my_dict = {"a": 1, "a": 999, "b": 2}
print(my_dict)  # {'a': 999, 'b': 2} → key 'a' bị ghi đè

{'a': 999, 'b': 2}


In [8]:
# 3. ✅ Value có thể trùng lặp
my_dict = {"x": 100, "y": 100, "z": 100}
print(my_dict)  # {'x': 100, 'y': 100, 'z': 100}

{'x': 100, 'y': 100, 'z': 100}


In [10]:
# 4. ✅ Hỗn hợp kiểu dữ liệu
info = {
    "name": "Ngọc",
    "age": 24,
    "skills": ["Python", "SQL"],
    True: "is_active"
}
print(info)

{'name': 'Ngọc', 'age': 24, 'skills': ['Python', 'SQL'], True: 'is_active'}


In [11]:
# 5. ✅ Có thể thay đổi
user = {"name": "Ngọc", "age": 24}
user["age"] = 25   # thay đổi giá trị
user["city"] = "Hà Nội"  # thêm key mới
print(user)

{'name': 'Ngọc', 'age': 25, 'city': 'Hà Nội'}


In [12]:
# 6. ✅ Truy cập nhanh bằng key
profile = {"username": "xomdata", "followers": 1024}
print("Số follower:", profile["followers"])  # không cần dùng chỉ số

Số follower: 1024


#### 🔍 3. Một số Function và Method hay dùng trong Dictionary

📏 **3.1 Hàm `len()`**  
Hàm `len()` trả về **số lượng cặp key – value** có trong dictionary.

📌 Cú pháp:
```python
len(my_dict)
```

In [26]:
my_dict = {"a": 1, "b": 2, "c": 3}
print("Số phần tử trong dict:", len(my_dict))  # 3

Số phần tử trong dict: 3


🗝️ **3.2 Method `.keys()`**  
Trả về danh sách các **key** trong dictionary dưới dạng `dict_keys`.

📌 Cú pháp:
```python
my_dict.keys()


In [29]:
my_dict = {"name": "Ngọc", "age": 24}
print("Các key:", my_dict.keys())  # dict_keys(['name', 'age'])

Các key: dict_keys(['name', 'age'])


📦 **3.3 Method `.values()`**  
Trả về danh sách các **giá trị** (value) trong dictionary.

📌 Cú pháp:
```python
my_dict.values()


In [30]:
my_dict = {"a": 100, "b": 200}
print("Các value:", my_dict.values())  # dict_values([100, 200])

Các value: dict_values([100, 200])


🧩 **3.4 Method `.items()`**  
Trả về danh sách các **cặp (key, value)** trong dictionary.

📌 Cú pháp:
```python
my_dict.items()


In [31]:
my_dict = {"x": 1, "y": 2}
print("Các cặp key-value:", my_dict.items())  # dict_items([('x', 1), ('y', 2)])

Các cặp key-value: dict_items([('x', 1), ('y', 2)])


🔍 **3.5 Method `.get()`**  
Trả về giá trị của một key nếu tồn tại, nếu không sẽ trả về `None` hoặc giá trị mặc định.

📌 Cú pháp:
```python
my_dict.get(key, giá_trị_mặc_định)


In [32]:
my_dict = {"user": "xomdata"}
print(my_dict.get("user"))        # xomdata
print(my_dict.get("age", "N/A"))  # N/A

xomdata
N/A


➕ **3.6 Method `.update()`**  
Thêm một cặp key–value mới hoặc **cập nhật** giá trị nếu key đã tồn tại.

📌 Cú pháp:
```python
my_dict.update({key: value})


In [33]:
info = {"name": "Ngọc"}
info.update({"age": 25})
print(info)  # {'name': 'Ngọc', 'age': 25}

{'name': 'Ngọc', 'age': 25}


❌ **3.7 Method `.pop()`**  
Xóa một phần tử khỏi dict bằng key, đồng thời trả về giá trị bị xóa.

📌 Cú pháp:
```python
my_dict.pop(key)

In [34]:
profile = {"name": "Ngọc", "city": "Hà Nội"}
city = profile.pop("city")
print("Đã xóa:", city)
print(profile)

Đã xóa: Hà Nội
{'name': 'Ngọc'}


## II. SET

#### 📦 1. Set là gì?

**Set** (tập hợp) là một kiểu dữ liệu có cấu trúc trong Python,  
dùng để lưu trữ **các giá trị không trùng lặp** và **không theo thứ tự**.

📌 `Set` thường được dùng khi bạn muốn loại bỏ phần tử trùng hoặc làm các phép toán tập hợp (giao, hợp, hiệu...).

📌 Cú pháp khai báo:
```python
my_set = {giá_trị_1, giá_trị_2, ..., giá_trị_n}



#### 📦 2. Đặc điểm nổi bật của Set

Dưới đây là những đặc điểm quan trọng giúp `Set` trở nên hữu ích trong xử lý dữ liệu:

1. ❌ **Không có thứ tự (Unordered)**  
2. ❌ **Không cho phép phần tử trùng lặp**  
3. ✅ **Có thể chứa nhiều kiểu dữ liệu khác nhau** *(miễn là immutable)*  
4. ✅ **Hỗ trợ các phép toán tập hợp như giao, hợp, hiệu**  
5. ✅ **Có thể thay đổi (Mutable)**  

In [18]:
# 1. ❌ Không có thứ tự
my_set = {10, 20, 30, 40, 50}
print("Set ban đầu:", my_set)  # Thứ tự có thể thay đổi mỗi lần chạy

Set ban đầu: {50, 20, 40, 10, 30}


In [20]:
# 2. ❌ Không cho phép phần tử trùng lặp
nums = {1, 2, 2, 3, 3, 3}
print(nums)  # Chỉ còn: {1, 2, 3}

{1, 2, 3}


In [21]:
# 3. ✅ Có thể chứa nhiều kiểu dữ liệu (miễn là immutable)
my_set = {1, "hello", True, (1, 2)}
print(my_set)

{1, (1, 2), 'hello'}


In [22]:
# 4. ✅ Hỗ trợ giao, hợp, hiệu
a = {1, 2, 3}
b = {3, 4, 5}

print("Giao:", a & b)
print("Hợp:", a | b)
print("Hiệu:", a - b)

Giao: {3}
Hợp: {1, 2, 3, 4, 5}
Hiệu: {1, 2}


In [23]:
# 5. ✅ Có thể thêm hoặc xóa phần tử
tags = {"python", "data"}
tags.add("machine learning")
tags.remove("data")
print(tags)

{'python', 'machine learning'}


#### 🔍 3. Một số Function và Method hay dùng trong Set

📏 **3.1 Hàm `len()`**  
Trả về **số lượng phần tử** trong một tập hợp (set).

📌 Cú pháp:
```python
len(my_set)


In [35]:
my_set = {1, 2, 3, 4}
print("Số phần tử:", len(my_set))  # 4

Số phần tử: 4


➕ **3.2 Method `.add()`**  
Thêm một phần tử mới vào `set`. Nếu phần tử đã tồn tại thì không thêm lại.

📌 Cú pháp:
```python
my_set.add(value)


In [36]:
tags = {"python", "data"}
tags.add("ml")
print(tags)

{'ml', 'python', 'data'}


❌ **3.3 Method `.remove()`**  
Xóa phần tử khỏi `set`. Nếu phần tử không tồn tại → báo lỗi.

📌 Cú pháp:
```python
my_set.remove(value)
```

In [37]:
s = {1, 2, 3}
s.remove(2)
print(s)  # {1, 3}

{1, 3}


❓ **3.4 Method `.discard()`**  
Giống `.remove()` nhưng **không báo lỗi nếu phần tử không tồn tại**.

📌 Cú pháp:
```python
my_set.discard(value)
```

In [39]:
s = {1, 2, 3}
s.discard(10)
print(s)

{1, 2, 3}


🧼 **3.5 Method `.clear()`**  
Xoá toàn bộ phần tử trong `set`, biến nó thành tập rỗng.

📌 Cú pháp:
```python
my_set.clear()


In [None]:
colors = {"red", "green"}
colors.clear()
print(colors)

🟰 **3.6 Các phép toán tập hợp**  
`Set` hỗ trợ nhiều phép toán toán học như:

- `|` → hợp (union)
- `&` → giao (intersection)
- `-` → hiệu (difference)
- `^` → phần khác nhau (symmetric difference)

📌 Cú pháp:
```python
a | b, a & b, a - b, a ^ b


In [41]:
a = {1, 2, 3}
b = {3, 4, 5}

print("Hợp:", a | b)
print("Giao:", a & b)
print("Hiệu:", a - b)
print("Phần khác:", a ^ b)

Hợp: {1, 2, 3, 4, 5}
Giao: {3}
Hiệu: {1, 2}
Phần khác: {1, 2, 4, 5}


## III. TỔNG KẾT

📊 So sánh giữa Dictionary và Set

| Tiêu chí                         | `Dictionary`                                          | `Set`                                        |
|----------------------------------|--------------------------------------------------------|----------------------------------------------|
| ✅ **Cấu trúc**                 | Cặp key – value                                        | Tập hợp các phần tử không trùng lặp          |
| 🧠 **Truy cập**                 | Truy cập nhanh qua `key`                               | Không có chỉ số hay key                      |
| 🔁 **Thay đổi được (mutable)**  | Có                                                     | Có                                           |
| ♻️ **Cho phép trùng lặp**        | Key ❌, Value ✅                                        | ❌ Không có phần tử trùng                    |
| 📦 **Cú pháp khai báo**          | `{key: value}`                                         | `{giá_trị_1, giá_trị_2, ...}` hoặc `set()`   |
| 🛠 **Method phổ biến**          | `.get()`, `.keys()`, `.values()`, `.update()`...       | `.add()`, `.remove()`, phép toán `&`, `|`, `-` |
| 🚫 **Indexing/Slicing**         | ❌ Không hỗ trợ                                         | ❌ Không hỗ trợ                               |
| 🔒 **Ứng dụng phù hợp**         | Tra cứu thông tin, ánh xạ dữ liệu theo key             | Xử lý tập hợp, loại trùng, toán học tập hợp  |

📌 **Tóm lại**:
- Dùng `Dictionary` khi bạn cần **gắn nhãn dữ liệu**, tra cứu nhanh theo `key`.
- Dùng `Set` khi bạn muốn **loại bỏ trùng lặp** hoặc xử lý **toán học trên tập hợp**.


## IV. BÀI TẬP

In [42]:
# 🧪 Bài 1: Tạo một dictionary đơn giản gồm tên và tuổi của một người. In ra toàn bộ dictionary.


In [43]:
# 🧪 Bài 2: Truy cập giá trị gắn với key 'email' trong dictionary sau:
profile = {"name": "An", "email": "an@example.com", "age": 25}


In [44]:
# 🧪 Bài 3: Thêm một key 'city' với giá trị là 'Hà Nội' vào dictionary sau:
user = {"name": "Ngọc", "age": 22}


In [47]:
# 🧪 Bài 4: Dùng `.get()` để lấy giá trị của key 'phone' trong dictionary sau, mặc định là "Không có"
info = {"name": "Lan", "email": "lan@gmail.com"}


In [45]:
# 🧪 Bài 5: Tạo một set chứa các số tự nhiên không trùng từ list sau:
nums = [1, 2, 2, 3, 4, 4, 5]


In [49]:
# 🧪 Bài 6: Lấy ra phần tử chung giữa 2 tập hợp:
a = {"python", "sql", "excel"}
b = {"python", "powerbi", "excel"}


In [48]:
# 🧪 Bài 7: Tạo một dictionary từ 2 list sau:
keys = ["id", "name", "score"]
values = [101, "Ngọc", 95]


In [50]:
# 🧪 Bài 8: Kiểm tra xem key "email" có tồn tại trong dictionary sau hay không (kết quả trả về True/False)
student = {"name": "Bình", "class": "12A"}


In [51]:
# 🧪 Bài 9: Dùng `.pop()` để xoá key 'age' khỏi dictionary sau và in ra giá trị đã xoá:
profile = {"name": "Tú", "age": 23, "gender": "Nam"}


In [52]:
# 🧪 Bài 10: Tìm tất cả các key có value là số trong dictionary sau:
data = {"a": 10, "b": "hello", "c": 15.5, "d": [1, 2], "e": 20}
# Gợi ý: sử dụng list + comprehension + type() (không dùng vòng lặp)


In [53]:
# 🧪 Bài 11: Tạo một set từ chuỗi 'dataanalysis' để lấy ra các chữ cái không trùng lặp.


In [54]:
# 🧪 Bài 12: Kiểm tra xem 'sql' có nằm trong tập hợp sau không:
skills = {"python", "sql", "excel"}


In [55]:
# 🧪 Bài 14: Hợp nhất 3 tập hợp thành một tập hợp duy nhất:
a = {1, 2}
b = {2, 3}
c = {3, 4}


In [None]:
# 🧪 Bài 15: Dùng `.symmetric_difference()` hoặc toán tử `^` để tìm phần tử khác nhau giữa hai tập:
x = {"apple", "banana", "cherry"}
y = {"banana", "durian", "cherry"}
