# Bài 6: Builtin data types - Sequences (part 1) 
## *Lists*

- Sequences là kiểu dạng collection gồm nhiều phần tử dưới một tên chung. 
- Các phần tử được truy xuất thông qua index của nó ở trong sequence.
- Python bắt đầu index tại `0`. Vì vậy nếu sequence gồm `N` phần tử thì các phần tử sẽ được đánh index từ `0`, `1`, ..., `N-1`.
- Các kiểu thuộc loại sequence chính trong Python bao gồm:
    - List
    - Tuple
    - Range
    - String

## 1. Kiểu `list`

### 1.1. Tổng quan
- Dùng để chứa 0 hoặc nhiều phần tử dưới chung một tên biến.
- Các phần tử có sắp thứ tự và được đánh index.
- Index bắt đầu từ `0` và kết thúc ở `n-1`.
- List là **mutable**: tức có thể thêm, sửa, xóa phần tử sau khi được tạo.
- Khởi tạo list dùng `[]`
- Các phần tử có thể khác kiểu dữ liệu. List có thể chứa list (nested list).
- Các phần tử có thể truy xuất qua indexing hoặc slicing.

### 1.2. Khởi tạo list

Khởi tạo list dùng square brackets `[]`, các phần tử cách nhau bởi dấu phẩy.

In [None]:
l = [1, 2, 3, 4, 5]

In [None]:
l

In [None]:
type(l)

### 1.3. Indexing (read)

Indexing là hành động truy xuất (access) đến 1 single element của list.  
Ta dùng tên list và index tương ứng của phần tử. Ví dụ:

Khởi tạo 1 list tên `l` gồm các nguyên từ 1 đến 5:

In [None]:
l = [1, 2, 3, 4, 5]

Truy cập phần tử đầu tiên:

In [None]:
l[0]

Truy cập phần tử thứ 3:

In [None]:
l[2]

Truy cập phần tử cuối cùng:

In [None]:
# Cách 1: dùng index n-1
l[4]

In [None]:
# Cách 2: recommended
l[2]

Nếu index quá tay sẽ bị lỗi out-of-range (ví dụ list có 5 phần tử thì index lớn nhất là 4, nếu gọi `l[5]` hay `l[6]` sẽ báo lỗi.

### 1.4 Indexing (write)

Ngoài việc dùng index truy xuất đến element và read value của element, ta có thể thay đổi (write) value này thông qua phép gán.  
List thuộc kiểu **mutable** (biến đổi được) nên ta có thể làm được điều này.  
Ví dụ:

In [None]:
# Tạo một list l gồm các phần tử [1, 2, 3, 4, 5]
l = [1, 2, 3, 4, 5]

In ra `l`:

In [None]:
# In ra l
l

In [None]:
# Truy cập đến phần tử thứ 3, in ra giá trị
l[2]

In [None]:
# Truy cập phần tử thứ 3, đổi nó thành 99
l[2] = 99

# In lại list
l

In [None]:
# Truy cập phần tử thứ 3, đối nó thành string "Hello"
l[2] = "Hello"

# In lại list
l

Truy cập phần tử thứ 3, đối nó thành list `[2, 3]`, in lại list:

In [None]:
# Truy cập phần tử thứ 3, đối nó thành list [2, 3]
l[2] = [2, 3]

# In lại list
# Nested list
l

### 1.5. Slicing (read)
Slicing là hành động truy xuất đến một nhóm các phần tử (liên tiếp) cùng một lúc.  
Lưu ý: index trả về phần tử của list, còn slice trả về một list các phần tử slice được (dù chỉ slice được một phần tử).
Cú pháp `l[start:stop]` hoặc `l[start:stop:step]`

    - `start`: index phần tử đầu tiên (included)
    - `stop`: index phần tử cuối cùng (excluded)
    - `step`: bước nhảy, mặc định là 1

#### Slicing cơ bản

In [None]:
# Khởi tạo lại list
l = [1, 2, 3, 4, 5]

# In
l

In [None]:
# Slice từ đầu đến phần tử thứ 3 (cách 1)
# Lấy các phần tử có index 0, 1, 2 (không lấy index 3)
l[0:3]

In [None]:
# Slice từ đầu đến phần tử thứ 3 (cách 2): recommended
l[:3]

In [None]:
# Slice từ phần tử thứ 3 đến cuối
l[2:]

In [None]:
# Slice từ phần tử thứ 3 đến phần tử ngay trước phần tử cuối
l[2:-1]

In [None]:
l[0]

In [None]:
l[0:1]

#### Slicing tạo shallow copy

In [None]:
# Slice từ đầu đến cuối (trả về 1 shallow copy, sẽ nói rõ hơn trong bài sau)
l[:]

In [None]:
# Kiểm tra ID
l2 = l[:]

print(id(l))
print(id(l2))

#### So sánh index và slice

In [None]:
# Index lấy phần tử đầu tiên
l[0]

In [None]:
# Slice lấy phần tử đầu tiên
l[:1]

In [None]:
# Khác nhau gì giữ 2 câu lệnh sau?
print(l[0])
print(l[0:1])

#### Slice với `step`
Mặc định nếu không truyền `step`, thì `step=1`, nếu muốn slice nhảy cách thì phải truyền `step`

In [None]:
l

In [None]:
# Step = 1
l[1:4:3]

In [None]:
# Step = 2
print(l[::2])

Slice với `step < 0`:

- Tức là slice nhảy lùi (chạy từ phải qua trái). 
- Vì vậy yêu cầu `start > stop` (vì `start` bây giờ ở bên phải, `stop` ở bên trái. 
- Nếu không sẽ trả về list rỗng.

In [None]:
# Slice từ index 4 về index 1 với step = -1
l[4:1:-1]

In [None]:
# Slice từ index 1 đến index 4 với step = -1 sẽ trả về list rỗng
l[1:4:-1]

In [None]:
# Slice đảo ngược lại list
# Not recommended
l[::-1]

In [None]:
# Tuy nhiên nên dùng hàm reversed để sáng code hơn
# Sẽ học về iterator sau
reversed(l)

In [None]:
# Ép iterator ra list
list(reversed(l))

Note: slice không bị lỗi out-of-range. Nếu stop quá lớn thì Python sẽ lấy từ `start` đến cuối list. Ví dụ:

In [None]:
l[1:3000]

### 1.6. Slicing (write)

Ngoài việc slice để read values, ta có thể overwrite values thông qua phép gán. Ví dụ:

In [None]:
# Khởi tạo lại list
l = [1, 2, 3, 4, 5]

# In
l

In [None]:
# Slice lấy phần tử thứ 2 và 3
l[1:3]

In [None]:
# Slice lấy phần tử thứ 2 và 3, và thay nó bằng ['A', 'B']
l[1:3] = ['A', 'B']

# In
l

In [None]:
# Slice lấy phần tử thứ 2 và 3, và thay nó bằng ['A', 'B', 'C', 'D']
l[1:3] = ['A', 'B', 'C', 'D']

# In
l

**Note:** Gán slice với single element (vd: 99) sẽ báo lỗi vì Python expect giá trị gán phải ở dạng một sequence. Thử đoạn code sau:

```python
l[1:3] = 99
```

In [None]:
l[1:3] = [99]

In [None]:
l

### 1.7. Duyệt một list

- Duyệt một list là hành động chạy qua (iterate) từng phần từ trong list từ đầu đến cuối.
- Mỗi một lần một element được duyệt được gọi là một iteration.
- Cách đơn giản nhất để duyệt một list là dùng vòng `for`. Chi tiết về cách sử dụng vòng `for` sẽ học ở bài Control Flows.

In [None]:
# Khởi tạo list
l = [1, 2, 3, 4, 5]

# In
l

In [None]:
# Duyệt qua từng phần tử của list
# In ra giá trị từng phần tử
for hello in l:
    print(hello + 2)

In [None]:
# Duyệt qua từng phần tử của list
# In ra formated string "x = {}, x squared = {}"
for x in l:
    print("x = {}, x squared = {}".format(x, x ** 2))

Notes:

- `x` là biến tạm để gán phần tử của list `l` ở mỗi lần duyệt. 
- Không nhất thiết phải đặt là `x`, mà có thể đặt tên tùy ý, miễn là một tên biến hợp lệ.

VD 2: Tạo 1 list `[1, 2, -7, 8, -9, -4, 10, 30]`

- Chỉ in ra các số chẵn
- Chỉ in ra các số dương

In [None]:
# Tạo list
l = [1, 2, -7, 8, -9, -4, 10, 30]

In [None]:
# In số chẵn
for x in l:
    if x % 2 == 0:
        print(x)

In [None]:
# In số dương
for x in l:
    if x > 0:
        print(x)

In [None]:
# Duyệt qua list và chỉ in ra số lẻ
for x in l:
    if x % 2 != 0:
        print(x)

### 1.8. Phép gán list

- Gán một list cho một biến khác, không tạo đối tượng mới.
- Nó chỉ tạo một reference từ biến mới đến existing object mà biến cũ đã trỏ tới.
- Như vậy, thay đổi 1 list thông qua một biến thì underlying object sẽ bị thay đổi và phản ánh thông qua biến còn lại.

In [None]:
# Khởi tạo list
l = [1, 2, 3, 4, 5]

# In l
l

In [None]:
# Gán l2 = l
l2 = l

# In l2
l2

In [None]:
# Kiểm tra identity
print(id(l))
print(id(l2))
print(l is l2)

In [None]:
# Sửa phần tử đầu tiên của l thành 99
l[0] = 99

In [None]:
# In l và l2
# Nhận thấy l2 cũng bị thay đổi
print(l)
print(l2)

### 1.9. Copy list

- Như đã thấy ở trên, không thể dùng phép gán để tạo copy 1 list
- Muốn tạo 1 **shallow** copy độc lập với list ban đầu, ta cần dùng các cách sau
    - Dùng phương thức copy: `l.copy()`
    - Dùng slice từ đầu đến cuối: `l[:]`
    - Dùng ép kiểu: `list(l)`
- Shallow copy sẽ không sufficient khi list có chứa mutable elements. Lúc đó ta cần tới deep copy.
    
- Muốn tạo một **deep** copy thì cần dùng package `deepcopy` (tạm thời chưa bàn tới)

In [None]:
# Khởi tạo các lists
l = [1, 2, 3, 4, 5]

In [None]:
# 3 cách tạo shallow copy
l2 = l.copy() # Dùng .copy method
l3 = l[:]     # dùng slice
l4 = list(l)  # Dùng ép kiểu

In [None]:
# Kiểm tra content
print(l)
print(l2)
print(l3)
print(l4)

In [None]:
# Kiểm tra identity
print(id(l))
print(id(l2))
print(id(l3))
print(id(l4))

In [None]:
# Sửa phần tử đầu của l thành 99
l[0] = 99
print(l)
print(l2)
print(l3)
print(l4)

#### Note:
Khi shall copy không sufficient

In [None]:
# Khởi tạo và tạo copy
l = [1, 2, [98, 99], 4, 5]
l2 = l.copy()

In [None]:
# Check content
print(l)
print(l2)

In [None]:
# Check ID
print(id(l))
print(id(l2))

In [None]:
# Thay đổi phần tử đầu của l thành "A" -> No issue
l[0] = "A"
print(l)
print(l2)

In [None]:
# Thay đổi phần tử đầu của phần tử thứ 3 của l thành "X" -> Notice the difference
l[2][0] = "X"
print(l)
print(l2)

In [None]:
# Kiểm tra identity
print(id(l[2]))
print(id(l2[2]))

## Giải thích shallow copy

In [None]:
# Tạo 1 list và tạo shallow copy
l = [1000, [2000, 3000]]
l_shallow = l.copy()

In [None]:
# Check content
print(l)
print(l_shallow)

`l` và `l_shallow` có phải là một (trỏ tới cùng 1 object)?

No

In [None]:
print(id(l))
print(id(l_shallow))

Nếu `l` và `l_shallow` không phải là một, thì các phần tử tương ứng của `l` và `l_shallow` có khác nhau không?

No. Shallow copy chỉ copy references, không phải copy values.

In [None]:
print(id(l[0]))
print(id(l_shallow[0]))

In [None]:
print(id(l[1]))
print(id(l_shallow[1]))

Example 1:

In [None]:
l[0] = 9000

In [None]:
# Check content
print(l)
print(l_shallow)

In [None]:
# Check ID
print(id(l[0]))
print(id(l_shallow[0]))

In [None]:
# Check ID
print(id(l[1]))
print(id(l_shallow[1]))

Nếu `l[0]` và `l_shallow[0]` là một, thì tại sao một list đổi phần tử đầu thành 9000, còn list còn lại ko bị thay đổi?

Lý do:
- `l[0] = 9000` -> xóa binding giữa `l[0]` và `1000`, sau đó tạo binding giữa `l[0]` và `9000`
- Binding giữa `l_shallow[0]` và `1000` không bị thay đổi gì

Example 2:

In [None]:
l[1][0] = "Hello. Have a good day"

In [None]:
# Check content
print(l)
print(l_shallow)

Tại sao lần này thay đổi lại xảy ra ở cả 2 list, trong khi phép gán thực hiện thông qua `l` mà ko phải `l_shallow`?

Reasons:

- `l[1]` và `l_shallow[1]` cùng trỏ tới 1 object (same list)
- Hành động `l[1][0] = "Hello. Have a good day"` là hành động sửa phần tử đầu tiên của list `l[1]`, cũng chính là list `l_shallow[1]`

In [None]:
print(id(l[1]))
print(id(l_shallow[1]))

Lưu ý: hành động `l[1][0] = 'Something'` (thay đổi diễn ra ở cả 2 list) khác với hành động `l[1] = "Something"` (thay đổi chỉ diễn ra ở `l`)

In [None]:
l[1][0] = "Something"

print(l)
print(l_shallow)

In [None]:
l[1] = "Something"

print(l)
print(l_shallow)

Để copy 2 list mà không muốn chúng dính dáng gì đến nhau, dùng gói `copy` (cách dùng tương tự `math`)

In [None]:
# Import
import copy

In [None]:
# Tạo list và deep copy
l = [1000, [2000, 3000]]
l_deep = copy.deepcopy(l)

In [None]:
# Sửa l
l[0] = 9000
l[1][0] = "Something"

In [None]:
# Check content
print(l)
print(l_deep)

### 1.10. Các thao tác với list

In [None]:
# Khởi tạo list
l = [10, 2, 7, 9, 4, 2]

#### Các thao tác không làm thay đổi list

- Đếm số phần tử

In [None]:
len(l)

- Kiểm tra membership

In [None]:
2 in l

In [None]:
99 in l

- Nối 2 list

In [None]:
l + ["A", "B", "C"]

- Replicate list

In [None]:
l * 3

- Sắp xếp (nếu được)

In [None]:
# Tăng dần
sorted(l)

In [None]:
# Giảm dần
sorted(l, reverse=True)

- Đếm số lần xuất hiện của 1 phần tử

In [None]:
l.count(2)

- Tìm vị trí của lần xuất hiện đầu tiên của một phần tử

In [None]:
l

In [None]:
l.index(7)

In [None]:
l.index(2)

#### Các thao tác làm thay đổi list

In [None]:
# Khởi tạo
l = [10, 2, 7, 9, 4, 2]
l

In [None]:
# Reverse
l.reverse()
l

In [None]:
# Sort tăng dần (nếu được)
l.sort()
l

In [None]:
# Sort giảm dần (nếu được)
l.sort(reverse=True)
l

In [None]:
# Append
l.append(99)
l

In [None]:
# Extend
l.extend(["A", "B"])
l

In [None]:
# Insert
l.insert(1, 20)
l

In [None]:
# Pop
# pop phần tử cuối cùng, lưu giá trị đó vào biến last_value
last_value = l.pop()

print(l)
print(last_value)

In [None]:
# Pop
# pop phần tử đầu tiên, lưu giá trị đó vào biến first_value
first_value = l.pop(0)

print(l)
print(first_value)

In [None]:
# Delete
del l[2]
l

In [None]:
# Remove
l.remove("A")
l

In [None]:
# Clear (làm rỗng list)
l.clear()
l

#### Bonus
- Unpack list

In [None]:
# Unpack list (1)
l = [2020, 1, 25]
y, m, d = l

print(y)
print(m)
print(d)

In [None]:
# Unpack list (2)
l = [2020, 1, 25]
y, m, _ = l

print(y)
print(m)

In [None]:
# Unpack list (3)
l = [2020, 1, 25]
y, *_ = l

print(y)
print(_)

#### Lưu ý về các phương thức của list
- Phương thức (method) là các hàm dành riêng cho đối tượng của một kiểu nào đó.
- Rất nhiều phương thức của list thuộc dạng "inplace", tức khi gọi phương thức thông qua tên list, thì effect của action sẽ được reflect vào list mà không cần thông qua phép gán. (Xem ví dụ để rõ thêm)
- Các phương thức thông dụng:
    - `.count()`
    - `.index()`
    - `.append()`
    - `.extend()`
    - `.insert()`
    - `.pop()`
    - `.remove()`
    - `.clear()`
    - `.sort()`