# **Sets (Tập hợp)**

Cuối cùng, chúng ta sẽ giới thiệu một kiểu dữ liệu khác có liên quan chặt chẽ đến dictionary, được gọi là **set** (tập hợp). Nếu bạn đã quen thuộc với khái niệm tập hợp trong toán học, thì đây chính xác là điều đó. Đối với những người chưa biết, set giống như một list, nhưng chỉ chứa các phần tử duy nhất và không có thứ tự có ý nghĩa của các phần tử (do đó không có khái niệm "chỉ mục" có ý nghĩa). Hoặc có thể chính xác hơn, nó giống như một dictionary chỉ có keys mà không có values.

Dưới đây chúng ta định nghĩa một set rỗng và một set có một số phần tử.

**Lưu ý:**
* Mặc dù set có phần tử sử dụng dấu ngoặc nhọn, bạn không thể sử dụng dấu ngoặc nhọn rỗng để định nghĩa một set rỗng, vì cách này đã được sử dụng để định nghĩa dictionary rỗng. `set()` được sử dụng để định nghĩa một set rỗng.
* Vì không có value nào được liên kết với mỗi key, chúng ta không cần sử dụng ký hiệu dấu hai chấm nữa, và chính việc thiếu dấu hai chấm (và keys) này cho phép Python phân biệt set literals với dictionaries.
* Thứ tự của các phần tử trong set không có ý nghĩa (tương tự như dictionaries). Nhưng trong khi dictionaries chọn một thứ tự key tùy ý và giữ nguyên nó (thứ tự mà các keys được chèn vào), thứ tự của sets có phần tùy ý, như bạn sẽ thấy nếu chạy đoạn code sau:

```python
my_set1 = set()
```

```python
my_set2 = {"a", "b", "c"}
```

```python
print(my_set1, my_set2)
```

Việc sử dụng "thứ tự" của một set không có ý nghĩa gì, nhưng nếu bạn chuyển đổi nó thành một kiểu có thứ tự như list, hãy nhớ rằng thứ tự có thể không như bạn mong đợi.

Vì sets chứa các phần tử duy nhất, chúng tự động loại bỏ các phần tử trùng lặp:

```python
my_set3 = {"a", "b", "c", "a", "a"}
```

```python
print(my_set3)
```

Giống như dictionary keys, sets chỉ có thể chứa các đối tượng **bất biến** (immutable):

```python
my_set4 = {['a', 'list'], {'a': 'dict'}}
```

## **Các kiểu rỗng (Empty types)**

Chúng ta sử dụng `set()` để tạo một set rỗng vì chúng ta không thể sử dụng dấu ngoặc hoặc dấu phân cách như chúng ta làm với các kiểu khác: dấu ngoặc nhọn mà chúng ta sử dụng với sets đã được sử dụng cho dictionaries. Thực tế, trong khi chúng ta sử dụng các cặp dấu ngoặc hoặc dấu phân cách để tạo dictionaries mới `{}`, tuples `()`, lists `[]` hoặc strings `""`, ký hiệu này thực sự chỉ là một phím tắt cho cách tổng quát hơn để tạo một đối tượng mới: bằng cách viết tên kiểu với một cặp dấu ngoặc đơn:

```python
empty_dict = dict()
```

```python
empty_tuple = tuple()
```

```python
empty_list = list()
```

```python
empty_string = str()
```

```python
print(empty_dict=={})
```

```python
print(empty_tuple==())
```

```python
print(empty_list==[])
```

```python
print(empty_string=="")
```

# Các Toán Tử Set Hữu Ích

Giống như lists, bạn có thể sử dụng toán tử `in` với sets để kiểm tra một phần tử cho trước:

```python
my_set = {"a", "b", "c"}
```

```python
print("a" in my_set)
```

```python
print("d" in my_set)
```

Bạn có thể tạo sets từ các sequences. Đây là một mẹo hay để loại bỏ các phần tử trùng lặp:

```python
my_sequence = "hello"
```

```python
my_set = set(my_sequence)
```

```python
print(my_set)
```

Có ba toán tử hữu ích độc nhất với sets:

* **Hợp (Union)**: `set1 | set2` hoặc `set1.union(set2)` trả về một set mới chứa các phần tử từ `set1` kết hợp với các phần tử từ `set2`.
* **Giao (Intersection)**: `set1 & set2` hoặc `set1.intersection(set2)` trả về một set mới chỉ chứa các phần tử có mặt trong cả `set1` và `set2`.
* **Hiệu (Difference)**: `set1 - set2` hoặc `set1.difference(set2)` trả về một set mới chỉ chứa các phần tử có mặt trong `set1` và không có mặt trong `set2` (tức là: loại bỏ các phần tử trong `set2` khỏi `set1`).

```python
my_set1 = {2, 3, 4}
```

```python
my_set2 = {2, 5}
```

```python
print(f"Hợp: {my_set2} | {my_set1} = {my_set2 | my_set1}")
```

```python
print(f"Giao: {my_set2} & {my_set1} = {my_set2 & my_set1}")
```

```python
print(f"Hiệu: {my_set1} - {my_set2} = {my_set1 - my_set2}")
```

```python
print(f"Hiệu: {my_set2} - {my_set1} = {my_set2 - my_set1}")
```

## Tính Giao Hoán

Phép hợp set và phép giao set có tính giao hoán, nghĩa là `set1 | set2 == set2 | set1` và `set1 & set2 == set2 & set1`.

Tuy nhiên, phép hiệu set thì không có tính này: thứ tự của các toán hạng thay đổi ý nghĩa của biểu thức, giữa "các phần tử trong `set1` mà không có trong `set2`" và "các phần tử trong `set2` mà không có trong `set1`": tương ứng là `set1 - set2` và `set2 - set1`.

# Các Phương Thức Hữu Ích Của Set

Cuối cùng, giống như list, set là **có thể thay đổi** (mutable), vì vậy bạn có thể thêm và xóa các phần tử. Lưu ý `.add()` là phương thức để thêm một phần tử vào set, không phải `.append()` hoặc `.insert()` như chúng ta đã sử dụng với list:

```python
my_set = {"a", 1, "sandy"}
```

```python
my_set.add("kim")
```

```python
print(my_set)
```

```python
my_set.remove("sandy")
```

```python
print(my_set)
```

Bạn cũng có thể tìm độ dài của một set:

```python
my_set = {"a", 1, "kim"}
```

```python
print(len(my_set))
```

Vì set không có thứ tự, việc sử dụng chỉ số (index) hoặc cắt lát (slice) không có ý nghĩa. Điều này sẽ tạo ra lỗi `TypeError`:

```python
my_set = {"a", 1, "bob"}
```

```python
print(my_set[0])
```

# **Tóm tắt về Set (Tập hợp)**

Qua các slide vừa rồi, chúng ta đã tìm hiểu về kiểu dữ liệu `set` và cách nó có thể hữu ích.

* Một set chứa một chuỗi các giá trị duy nhất không có khái niệm về thứ tự. Set không thể được đánh chỉ mục.
* Các phần tử trong set phải là bất biến (immutable).

```python
empty_set = set()
```

```python
new_set = {1, 3, 3, 'hello'}
```

```python
print(new_set)  # số 3 trùng lặp sẽ bị xóa
```

```python
new_set.add(7)
```

```python
new_set.remove(3)
```

```python
print(new_set)
```

## Các điểm chính:

* Một set rỗng phải được viết là `set()`.
* Một set literal có thể được khởi tạo với các phần tử theo cách tương tự như list (bằng cách phân tách các phần tử bằng dấu phẩy): `{<phần_tử_1>, <phần_tử_2>}`.
* Set có thể thay đổi được (mutable): bạn có thể thêm một phần tử mới vào set bằng phương thức `.add()`, hoặc xóa một phần tử bằng phương thức `.remove()`.
* Các giá trị trùng lặp đã được nhập vào set sẽ bị xóa, chỉ để lại một của mỗi giá trị.
* Khi sử dụng với set, toán tử `in` sẽ kiểm tra xem nó có chứa một giá trị hay không.
* Hợp (`|`), giao (`&`), và hiệu (`-`) là ba phép toán set hữu ích.
* Set có thể không có vẻ hữu ích, nhưng bằng cách thêm các phần tử vào chúng, thực hiện các phép toán set, truy vấn thành viên, và có thể chuyển đổi sang các kiểu khác, chúng có thể rất tiện dụng trong một số trường hợp nhất định.

Chúng ta cũng đã đề cập đến **kiểu container** là những kiểu có khả năng lưu trữ tập hợp các đối tượng khác. List, tuple, string, dictionary, và set đều là kiểu container (với ba kiểu đầu tiên cũng là sequence).