# **List**
*Danh sách*

Dưới đây là bảng so sánh 4 kiểu dữ liệu container trong python:

| Đặc điểm            | List                     | Dictionary                        | Set                          | Tuple                           |
|---------------------|--------------------------|-----------------------------------|------------------------------|---------------------------------|
| **Cú pháp**         | `[item1, item2, ...]`    | `{'key1': value1, 'key2': value2}`| `{item1, item2, ...}`         | `(item1, item2, ...)` hoặc `item,` |
| **Loại Dữ liệu**    | Dãy (Sequence)           | Bản đồ (Mapping)                 | Tập hợp (Set)                 | Dãy (Sequence)                  |
| **Thứ tự** (Order)         | Có thứ tự (Ordered)      | Không có thứ tự (Unordered)       | Không có thứ tự (Unordered)   | Có thứ tự (Ordered)             |
| **Chỉ mục** (Indexing)        | Có (theo chỉ mục)        | Có (theo khóa)                   | Không có                     | Có (theo chỉ mục)              |
| **Giá trị trùng lặp** (Duplicate Values)| Cho phép                 | Giá trị có thể trùng lặp, khóa không thể trùng lặp | Không cho phép             | Cho phép                        |
| **Tính biến đổi** (Mutability)   | Có thể thay đổi (Mutable)| Có thể thay đổi (Mutable)        | Có thể thay đổi (Mutable)     | Không thể thay đổi (Immutable)  |
| **Sử dụng**         | Dùng cho một tập hợp các phần tử có thứ tự | Dùng cho các cặp khóa-giá trị   | Dùng cho các phần tử duy nhất | Dùng cho dữ liệu cố định        |


# **Notes**
* Dùng để lưu trữ nhiều phần tử có thứ tự trong một biến.
* Được tạo ra bằng cách sử dụng dấu [ ].
* Các kiểu dữ liệu phổ biến trong danh sách: Integer, Float, String, Boolean, List, Dictionary, Tuple, Set, Object.
* Có thể bao gồm danh sách trong danh sách.
* Dễ dàng lưu trữ thông tin.

# **Importance**
Linh hoạt trong việc lưu trữ các chuỗi dữ liệu. Pandas có thể chuyển danh sách thành các đối tượng Series hoặc DataFrame để phân tích.

## **Ví dụ**

In [1]:
job_skills = ['sql','tableau','excel']
job_skills

['sql', 'tableau', 'excel']

# **Indexing**
*Chỉ mục*

Dùng chỉ mục để lấy một phần tử củ thể trong danh sách

**Notes: Chỉ mục bắt đầu từ `0` kết thúc là `-1`**

In [5]:
print(job_skills[0])
print(job_skills[-1])

sql
excel


# **Methods**

cú pháp `object.method()`

## **Append**
Thêm một phần tuwr vào cuối danh sách 

cú pháp: `object.append()`

In [6]:
job_skills.append('looker')

job_skills

['sql', 'tableau', 'excel', 'looker', 'looker']

## **Length()**
Xem có bao nhiêu phần tử trong danh sách

cú pháp: `len(object)`

In [8]:
len(job_skills)

5

| Phương thức        | Mô tả                                                         | Ví dụ                                                              |
|--------------------|---------------------------------------------------------------|--------------------------------------------------------------------|
| **append()**       | Thêm một phần tử vào cuối danh sách.                          | `my_list.append(4)`                                                |
| **extend()**       | Thêm tất cả phần tử từ một danh sách khác vào cuối danh sách.| `my_list.extend([ 4, 6])`                                           |
| **insert()**       | Thêm một phần tử vào danh sách tại chỉ mục chỉ định. (chèn y vào vị trí x)         | `my_list.insert(x, y)`                                             |
| **remove()**       | Xóa phần tử đầu tiên có giá trị xác định.                    | `my_list.remove(3)`                                                |
| **pop()**          | Xóa phần tử tại chỉ mục chỉ định và trả về giá trị đó.       | `my_list.pop(1)`                                                   |
| **clear()**        | Xóa tất cả các phần tử trong danh sách.                      | `my_list.clear()`                                                  |
| **index()**        | Trả về chỉ mục đầu tiên của phần tử xác định.               | `my_list.index(3)`                                                 |
| **count()**        | Đếm số lần xuất hiện của một phần tử trong danh sách.        | `my_list.count(3)`                                                 |
| **sort()**         | Sắp xếp các phần tử trong danh sách theo thứ tự tăng dần.    | `my_list.sort()`                                                   |
| **reverse()**      | Đảo ngược thứ tự các phần tử trong danh sách.                | `my_list.reverse()`                                                |
| **copy()**         | Tạo một bản sao của danh sách.                               | `new_list = my_list.copy()`                                        |


# **Ví dụ**

## **Insert**

In [9]:
job_skills.insert(2,'python')

job_skills

['sql', 'tableau', 'python', 'excel', 'looker', 'looker']

## **Remove()**

In [10]:
job_skills.remove('looker')

job_skills

['sql', 'tableau', 'python', 'excel', 'looker']

# **Join lists**
*Nối danh sách*

Có nhiều cách khác nhau để nối (kết hợp) 2 hay nhiều danh sách với nhau:

1. Nối bằng toán tử `+`

In [11]:
skills1 = ['SQL', 'Tableau']
skills2 = ['Excel']

skills3 = skills1 + skills2
skills3

['SQL', 'Tableau', 'Excel']

2. Thêm tất cả phần tử từ list này sang list khác bằng phương thức `.append()`
Khi sử dụng .append(), ta chỉ có thể thêm từng phần tử vào cuối danh sách. Để thêm tất cả các phần tử từ danh sách này vào danh sách khác, thì cần sử dụng vòng lặp `for`.

In [12]:
skills4 = ['Python', 'Power BI']

for x in skills3:
    skills4.append(x)

skills4

['Python', 'Power BI', 'SQL', 'Tableau', 'Excel']

3. Sử dụng phương thức `extend()` để thêm phần tử từ danh sách này vào danh sách khác
Phương thức extend() cho phép thêm tất cả các phần tử từ một danh sách vào một danh sách khác, thay vì thêm từng phần tử như với .append().

In [13]:
skills5 = ['Statistics', 'Machine Learning']

skills5.extend(skills4)

skills5

['Statistics',
 'Machine Learning',
 'Python',
 'Power BI',
 'SQL',
 'Tableau',
 'Excel']

## **Join()**
Phương thức `.join()` được sử dụng để nối một chuỗi các chuỗi con với nhau, sử dụng một dấu phân cách cụ thể giữa mỗi phần tử trong quá trình nối. Phương thức này thường được dùng để định dạng đầu ra cho dễ đọc.

In [14]:
skills = ['Python', 'SQL', 'Excel']

print('I have these skills: ' +  ', '.join(skills))

I have these skills: Python, SQL, Excel


# **Slicing lists**
Cắt danh sách (slicing) là cách để trích xuất một phần của danh sách bằng cách sử dụng chỉ mục. Bạn có thể chỉ định điểm bắt đầu, điểm kết thúc và bước nhảy giữa các phần tử.

**Cú pháp: `list[start:end:step]`**

* start: Chỉ mục bắt đầu (bao gồm phần tử tại chỉ mục này).

* end: Chỉ mục kết thúc (không bao gồm phần tử tại chỉ mục này).

* step: Bước nhảy giữa các phần tử (mặc định là 1).

In [15]:
skills = ['Python', 'SQL', 'Excel']

first_two = skills[0:2]
first_two  

['Python', 'SQL']

**Ta có thể bỏ qua các phần tử khi sử dụng slicing:**

1. Bỏ qua start: Khi bỏ qua giá trị bắt đầu, Python sẽ mặc định bắt đầu từ phần tử đầu tiên (chỉ mục 0).

In [16]:
also_first_two = skills[:2:1]
also_first_two

['Python', 'SQL']

2. Bỏ qua end: Khi bỏ qua giá trị kết thúc, Python sẽ cắt đến phần tử cuối cùng trong danh sách.

In [17]:
last_two = skills[1::1]
last_two

['SQL', 'Excel']

3. Bỏ qua step: Khi bỏ qua bước nhảy, Python sẽ mặc định sử dụng bước nhảy là 1, tức là lấy từng phần tử liên tiếp.

In [18]:
last_one = skills[0:1:]
last_one

['Python']

In [19]:
full_list = skills[:]
full_list

['Python', 'SQL', 'Excel']

In [20]:
skills = ['Python', 'SQL', 'Excel', 'R', 'Java']

every_second = skills[0::2]
every_second

['Python', 'Excel', 'Java']

# **Unpack List**
*Giải nén danh sách*

Giải nén danh sách (unpacking) là khi gán mỗi giá trị trong một danh sách vào một biến trong một câu lệnh duy nhất. Bạn có thể gán trực tiếp các phần tử của danh sách vào các biến.

In [22]:
job_skills = ['sql', 'bigquery', 'python', 'excel']

skill1, skill2, skill3, skill4 = job_skills

print(skill1)
print(skill2)
print(skill3)
print(skill4)

sql
bigquery
python
excel


# **Extend Unpack List**
*Giải nén mở rộng*

Giải nén mở rộng là khi gán một phần của danh sách vào một biến dưới dạng danh sách.

In [23]:
*sql_skills, skill3, skill4 = job_skills

print(sql_skills)  # *sql_skills lưu những phần không được gán
print(skill3)  
print(skill4)

['sql', 'bigquery']
python
excel
