# Sets

Bảng so sánh: 

| Đặc điểm            | List                     | Dictionary                        | Set                          | Tuple                           |
|---------------------|--------------------------|-----------------------------------|------------------------------|---------------------------------|
| **Cú pháp**         | `[item1, item2, ...]`    | `{'key1': value1, 'key2': value2}`| `{item1, item2, ...}`         | `(item1, item2, ...)` hoặc `item,` |
| **Loại Dữ liệu**    | Dãy (Sequence)           | Bản đồ (Mapping)                 | Tập hợp (Set)                 | Dãy (Sequence)                  |
| **Thứ tự** (Order)         | Có thứ tự (Ordered)      | Không có thứ tự (Unordered)       | Không có thứ tự (Unordered)   | Có thứ tự (Ordered)             |
| **Chỉ mục** (Indexing)        | Có (theo chỉ mục)        | Có (theo khóa)                   | Không có                     | Có (theo chỉ mục)              |
| **Giá trị trùng lặp** (Duplicate Values)| Cho phép                 | Giá trị có thể trùng lặp, khóa không thể trùng lặp | Không cho phép             | Cho phép                        |
| **Tính biến đổi** (Mutability)   | Có thể thay đổi (Mutable)| Có thể thay đổi (Mutable)        | Có thể thay đổi (Mutable)     | Không thể thay đổi (Immutable)  |
| **Sử dụng**         | Dùng cho một tập hợp các phần tử có thứ tự | Dùng cho các cặp khóa-giá trị   | Dùng cho các phần tử duy nhất | Dùng cho dữ liệu cố định        |

## Notes

* Dùng cho những mục đính duy nhất, độc nhất
* Lưu trữ nhiều kiểu dữ liệu trong 1 biến duy nhất
* Đặc điểm 
  * Không có thứ tự.
  * Không thể thay đổi.
  * Không có chỉ mục.
* Set *items* are unchangeable but you can still remove items and add new items

## Importance

 Các mục trong tập hợp (*set*) không thể thay đổi, nhưng vẫn có thể xóa mục và thêm mục mới.
## Ví Dụ

In [1]:
job_skills = {'tableau', 'sql', 'python', 'statistics'}

job_skills

{'python', 'sql', 'statistics', 'tableau'}

### Không Có Thứ Tự và Chỉ Mục

Tập hợp (*sets*) không có thứ tự và không có chỉ mục nên không hoạt động giống hoàn toàn như danh sách (*lists*).

Vì vậy những cú pháp liên quan đến chỉ mục không áp dụng cho **set**

In [2]:
job_skills[1]

TypeError: 'set' object is not subscriptable

### Add()

Thêm một phần tử mới bằng cách sử dụng `add()`

In [None]:
job_skills.add('looker')

job_skills

{'looker', 'python', 'sql', 'statistics', 'tableau'}

Nếu thêm phần tử trùng lặp thì nó vẫn giữu nguyên như ban đầu vì `tính bất biến` của set

In [None]:
job_skills.add('sql')

job_skills

{'looker', 'python', 'sql', 'statistics', 'tableau'}

### Remove()

Xóa một phần tử chỉ định bằng cách sử dụng `remove()`

`Error: Tried to remove a skill that does not exist in this set.`

khi có lỗi này nó sẽ cho bạn thông tin là phần tử này không có trong cái set đó

In [3]:
job_skills.remove('r')

job_skills

KeyError: 'r'

Đay là đoạn code đúng✅.

In [None]:
job_skills.remove('statistics')

job_skills

{'looker', 'python', 'sql', 'tableau'}

### Set()

Tập hợp (*sets*) rất hữu ích để loại bỏ các giá trị lặp lại. Dùng nhiều trong những bài toán tìm sự giống, khác trong một tập hợp danh sách các phần tử...

In [None]:
skill_list = ['python', 'sql', 'statistics', 'tableau', 'python', 'sql', 'statistics', 'tableau']

set(skill_list)

{'python', 'sql', 'statistics', 'tableau'}

Chuyển nó về lại là list và trong list này bây giờ chỉ còn những phần tử duy nhất

In [None]:
skill_list = list(set(skill_list))

skill_list

['python', 'statistics', 'tableau', 'sql']