# Mutability (Tính khả biến)

**Tính khả biến**

Như bạn có thể nhớ lại, khi chúng ta giới thiệu về các chuỗi, chúng ta đã giới thiệu cả lists và tuples, về cơ bản chúng khá giống nhau, ngoại trừ việc chúng ta nói rằng tuples là **bất biến (immutable)**. Bây giờ chúng ta quay lại để thảo luận điều này một cách sâu sắc hơn.

Một đối tượng được gọi là **khả biến (mutable)** nếu giá trị (nội dung) của nó có thể được thay đổi sau khi nó được tạo ra. Nếu giá trị không thể thay đổi, nó là **bất biến (immutable)**.

Việc một đối tượng có khả biến hay không được định nghĩa bởi kiểu dữ liệu của nó — điều này được ghi trong "Kinh thánh Python". Các điều sau đây đúng với các kiểu dữ liệu chúng ta đã thấy:

Lists, dictionaries và sets (chúng ta sẽ thấy hai kiểu cuối này trong vài bài tập tới) là **khả biến**.

Tất cả mọi thứ khác đều **bất biến** — strings, tuples và numbers (bao gồm ints, floats và booleans).

# **Các Phương Thức List Hữu Ích (1)**

Python cung cấp một số phương thức hữu ích để thao tác với list. Đặc biệt, do list có thể thay đổi được (mutable), nhiều phương thức sẽ "biến đối" (mutate) list mà chúng được áp dụng. Dưới đây là một số ví dụ đáng chú ý về các phương thức list có tính biến đối.

Phương thức `.append(object)` thêm `object` vào cuối list mà nó được gọi:

```python
chomsky = ['colourless', 'green', 'ideas']
```

```python
chomsky.append('sleep')
```

```python
print(chomsky)
```

```
['colourless', 'green', 'ideas', 'sleep']
```

---

`.pop()` loại bỏ phần tử cuối cùng khỏi list (không rỗng) mà nó được gọi. Nếu được gọi với đối số số nguyên `.pop(index)` sẽ loại bỏ phần tử tại chỉ số được chỉ định.

`.pop()` biến đối list để loại bỏ phần tử mong muốn, tuy nhiên nó trả về phần tử đó như là giá trị trả về để bạn có thể kiểm tra xem đó có phải là thứ bạn mong đợi không.

```python
chomsky = ['colourless', 'green', 'ideas']
```

```python
print(chomsky.pop())
```

```
'ideas'
```

```python
print(chomsky)
```

```
['colourless', 'green']
```

```python
print(chomsky.pop(0))
```

```
'colourless'
```

```python
print(chomsky)
```

```
['green']
```

---

`.insert(index, object)` thêm `object` vào list mà nó được gọi tại `index` cụ thể được cho (nhớ rằng chỉ số bắt đầu từ số không):

```python
chomsky = ['colourless', 'green', 'ideas']
```

```python
chomsky.insert(1, 'sleep')
```

```python
print(chomsky)
```

```
['colourless', 'sleep', 'green', 'ideas']
```

# Các Phương Thức List Hữu Ích (Phần 2)

## Phương thức `.copy()`

`.copy()` trả về một list mới có cùng nội dung với list được gọi phương thức. List mới này có `id` khác với list gốc, vì vậy bất kỳ list nào cũng có thể được thay đổi mà không ảnh hưởng đến list kia.

```python
chomsky = ['colourless', 'green', 'ideas', 'green']
```

```python
chomsky_copy = chomsky.copy()
```

```python
print(chomsky_copy)
```

```
['colourless', 'green', 'ideas', 'green']
```

```python
chomsky_copy[1] = 'yellow'
```

```python
print(chomsky)
```

```
['colourless', 'green', 'ideas', 'green']
```

```python
print(chomsky_copy)
```

```
['colourless', 'yellow', 'ideas', 'green']
```

## Phương thức `.remove(value)`

`.remove(value)` xóa **lần xuất hiện đầu tiên** của một object bằng với `value` từ list được gọi phương thức. Lỗi `ValueError` sẽ xảy ra nếu không có item nào như vậy trong list.

```python
chomsky = ['colourless', 'green', 'ideas', 'green']
```

```python
chomsky.remove('green')
```

```python
print(chomsky)
```

```
['colourless', 'ideas', 'green']
```

## Phương thức `.index(value)`

Cuối cùng, `.index(value)` là một phương thức không thay đổi list, trả về chỉ số (index) của **lần xuất hiện đầu tiên** của `value` trong list, như được thấy trong ví dụ sau, trong đó list chứa nhiều instance của `'ideas'`.

```python
chomsky = ['colorless', 'green', 'ideas', 'are', 'good', 'ideas']
```

```python
print(chomsky.index('ideas'))
```

```
2
```

Lỗi `ValueError` sẽ xảy ra nếu đối số của `.index()` không có trong list:

```python
chomsky = ['colorless', 'green', 'ideas', 'are', 'good', 'ideas']
```

```python
print(chomsky.index('furiously'))
```

```
Traceback (most recent call last):
  File "program.py", line 2, in <module>
    print(chomsky.index('furiously'))
ValueError: 'furiously' is not in list
```

## Khám phá thêm các phương thức khác

Điều này không bao gồm tất cả các phương thức có sẵn để sử dụng với list: bạn có thể tìm thấy các phương thức khác bằng cách chạy `dir(list)` và cuộn qua tất cả những phương thức có dấu gạch dưới:

```python
for entry in dir(list):
    print(entry)
```

# Tìm kiếm chỉ số (index)

Hãy cẩn thận khi sử dụng các phương thức như `.index()`. Nếu bạn đang lặp qua một danh sách bằng vòng lặp `for-in`, nó có thể không hoạt động đúng như bạn nghĩ:

```python
my_list = [1, 3, 5, 4, 5]

for item in my_list:
    if item == 5:
        print("5 found at index", my_list.index(item))
```

**Kết quả:**
```
5 found at index 2
5 found at index 2
```

Tại sao nó lại hiển thị chỉ số 2 cả hai lần? Bởi vì khi bạn sử dụng phương thức `.index()` để tìm chỉ số của `item`, không có cách nào để `index` biết chính xác chúng ta đang ở đâu trong vòng lặp: thay vào đó, nó thực hiện một tìm kiếm nhanh để tìm chỉ số của **lần xuất hiện đầu tiên** của `item` trong danh sách. Trong trường hợp này, nó trả về chỉ số đúng khi gặp số 5 đầu tiên, nhưng lần thứ hai tại chỉ số 4, nó không có cách nào biết rằng lần này chúng ta đã vượt qua instance đầu tiên của số 5. Các vấn đề tương tự có thể xảy ra khi sử dụng `.remove()` vì nó chỉ xóa lần xuất hiện đầu tiên.

Một cách tốt hơn để tiếp cận các bài toán mà bạn cần biết chỉ số hiện tại trong vòng lặp là lặp trực tiếp qua các chỉ số bằng cách sử dụng hàm `range()`. Bằng cách này, bạn biết chính xác mình đang ở chỉ số nào:

```python
my_list = [1, 3, 5, 4, 5]

for i in range(len(my_list)):
    if my_list[i] == 5:
        print("5 found at index", i)
```

**Kết quả:**
```
5 found at index 2
5 found at index 4
```

Sẽ khôn ngoan khi tránh sử dụng `.index()` trừ khi bạn đang tìm kiếm cụ thể chỉ số đầu tiên của một giá trị trong danh sách (và bạn chắc chắn rằng giá trị đó tồn tại!).

## Tìm kiếm "giá trị"

`.index()` và `.remove()` không tìm kiếm một *đối tượng*, chúng tìm kiếm một *giá trị*. Điều này có nghĩa là chúng kiểm tra từng item trong danh sách để tìm sự khớp không phải bằng `id` của đối tượng mà bằng cách kiểm tra tính bằng nhau `==` của **giá trị** của các item.

Bạn có thể chứng minh điều này bằng đoạn code sau, nơi chúng ta tìm kiếm `list_copy` bên trong `lists` nhưng Python trả về chỉ số của `my_list` thay vào đó, mặc dù nó có `id` khác với `list_copy`:

```python
my_list = [1, 4, 5]
list_copy = my_list.copy()
lists = [my_list, list_copy]
print(lists.index(list_copy))
```

# Trích xuất `list` từ các String

Vài bài tập trước chúng ta đã thấy qua phương thức `.split()`. Đây là một cách tiện lợi để chuyển đổi string thành `list` các từ.

```python
sniglet = 'The one cube left by the person too lazy to refill the ice tray'
```

```python
sniglet_words = sniglet.split()
```

```python
print(sniglet_words)
```

```
['The', 'one', 'cube', 'left', 'by', 'the', 'person', 'too', 'lazy', 'to', 'refill', 'the', 'ice', 'tray']
```

Theo mặc định, `.split()` chia một string thành list các substring dựa trên dấu phân cách "khoảng trắng" (ký tự space, tab, và xuống dòng), đồng thời loại bỏ các dấu phân cách trong quá trình này. Có thể thay đổi hành vi này bằng cách chỉ định dấu phân cách trong tham số của `.split()`, ví dụ:

```python
print("1,2,3".split(","))
```

```python
print("l00k b4 U l3ap".split("b4"))
```

## Ghép lại với nhau

Còn việc thực hiện ngược lại thì sao? Phương thức `.join()` nhận một đối tượng iterable chứa các string làm đầu vào và nối các string đó lại thành một.

```python
print(''.join(['j', 'o', 'i', 'n', 'e', 'd']))
```

`.join()` là một phương thức được gọi trên một string. Trong ví dụ trên, string này là một string rỗng - hãy đoán xem nó làm gì. Nó là một string **phân cách** được chèn vào giữa các string trong list khi chúng được nối lại. Nó giống như tham số được truyền cho split.

```python
joined = ' and '.join(['apple', 'carrot', 'tomato'])
```

```python
print('I like', joined)
```

Bạn có thể so sánh việc tách (splitting) và nối (joining) theo cách chúng được gọi bên dưới:

```python
list = string.split(sep)  # string -> list
```

```python
string = sep.join(list)  # list -> string
```

# **Sorting (Sắp xếp)**

Một thao tác `list` mà bạn sẽ tìm thấy nhiều ứng dụng là sắp xếp các phần tử. Có hai cách để thực hiện điều này, mà bạn chắc chắn sẽ nhầm lẫn ở một thời điểm nào đó vì tên của chúng quá giống nhau: **[1]** hàm `sorted()`; và **[2]** phương thức `.sort()`.

`sorted()` nhận một list làm đối số và trả về một list mới với các phần tử được sắp xếp theo thứ tự (không làm thay đổi list gốc). Ví dụ:

```python
randlist = [4, 1, 3.0, 2, 5]
```

```python
print(sorted(randlist))
```

```python
print(randlist)
```

Nó cũng có thể được áp dụng cho một list các chuỗi, trong trường hợp này thứ tự sắp xếp dựa trên giá trị Unicode `ord()` cơ bản:

```python
print(sorted(['abacus', 'a', 'aardvark', 'ABC']))
```

Lưu ý rằng trong khi sắp xếp một list chứa các giá trị `int` và `float` hỗn hợp tạo ra chuỗi số như mong đợi (xem ví dụ trên), nếu bạn cố gắng trộn lẫn các kiểu khác, `sorted()` sẽ phát sinh ngoại lệ `TypeError`:

```python
print(sorted([1, 2, 'three', 'four', ['five']]))
```

```python
print(sorted(strlist))
```

Nếu bạn muốn sắp xếp ngược list, chỉ cần đặt đối số từ khóa tùy chọn `reverse` thành `True`:

```python
randlist = [4, 1, 3.0, 2, 5]
```

```python
print(sorted(randlist, reverse=True))
```

```python
print(randlist)
```

Hy vọng đến đây là dễ hiểu. Nơi mà mọi thứ trở nên khó hiểu là với phương thức `.sort()`, hoạt động **tại chỗ (in-place)**, có nghĩa là nó thay đổi list để các phần tử được sắp xếp (tức là thứ tự ban đầu của các phần tử có thể bị thay đổi):

```python
randlist = [4, 1, 3.0, 2, 5]
```

```python
randlist.sort()
```

```python
print(randlist)
```

Sự nhầm lẫn xuất phát từ cách viết code khác nhau một cách tinh tế giữa `sorted()` và `.sort()`. `sorted()` trả về kết quả của nó, vì vậy nên được gọi và gán như thế này:

```python
randlist = [4, 1, 3.0, 2, 5]
```

```python
randlist = sorted(randlist)
```

```python
print(randlist)
```

Tuy nhiên, vì `.sort()` thay đổi list, nó không trả về gì cả và chắc chắn không nên được gán!

```python
randlist = [4, 1, 3.0, 2, 5]
```

```python
randlist = randlist.sort()
```

```python
print(randlist)
```

Có lẽ cách dễ nhất để tránh sự nhầm lẫn này là sử dụng `sorted()` độc quyền, và nhớ gán lại kết quả cho biến list (như trên) nếu ý định là giữ cùng tên biến.

Một ưu điểm khác của `sorted()` là nó có thể được áp dụng cho bất kỳ chuỗi nào, bao gồm lists và tuples (mặc dù nó sẽ luôn trả về một list):

```python
print(sorted("bananas"))
```

```python
print(sorted((3, 1, 5)))
```

# **Sắp xếp: Phá vỡ thế hòa**

`sorted()` và `.sort()` hoạt động bằng cách sắp xếp một danh sách từ phần tử nhỏ nhất đến lớn nhất, nhưng điều gì xảy ra khi có các phần tử giống hệt nhau? Hãy xem cách chúng được quản lý.

Điều đầu tiên mà `sorted()` làm là sắp xếp các phần tử dựa trên **chỉ mục đầu tiên** của chúng. Đó sẽ là ký tự đầu tiên trong một chuỗi, hoặc phần tử đầu tiên nếu sắp xếp một chuỗi các danh sách hoặc tuple. Trong một danh sách các số, chỉ có một thứ để sắp xếp: chính con số đó!

Nếu có sự hòa, chẳng hạn như hai chuỗi có cùng chữ cái đầu tiên, thì chữ cái thứ hai sẽ được sử dụng, như chúng ta thấy bên dưới:

```python
strings = ['ap', 'r', 'ab', 'rh', 'rz', 'a', 'rc', 'cg']
```

```python
print(sorted(strings))
```

Đầu tiên trong thứ tự sắp xếp là ba chuỗi bắt đầu bằng `a`, sau đó là chuỗi bắt đầu bằng `c`, rồi ba chuỗi bắt đầu bằng `r`. `'ab'` đứng trước `'ap'` vì `b` đứng trước `p` trong bảng chữ cái. `'a'` đứng trước cả `'ab'` và `'ap'` vì nó chỉ có một ký tự.

Phương pháp phá vỡ thế hòa này sẽ rất tự nhiên đối với bạn vì đó là cách mà từ điển được sắp xếp.

Phá vỡ thế hòa có thể thậm chí còn thú vị hơn khi sắp xếp các tuple hoặc danh sách, trong đó phần tử thứ hai của mỗi tuple có thể được sử dụng như một yếu tố phá vỡ thế hòa cho phần tử đầu tiên. Bạn cũng có thể có các kiểu dữ liệu khác nhau:

```python
tuples = [(1, 'hi'), (4, 'bye'), (4, 'hi'), (1, 'ace')]
```

```python
print(sorted(tuples))
```

Tuy nhiên, hãy đảm bảo rằng mỗi chỉ mục đều có kiểu dữ liệu có thể so sánh được! Nếu bạn cố gắng phá vỡ thế hòa với các kiểu dữ liệu không khớp, bạn sẽ gặp lỗi `TypeError`:

```python
tuples = [(1, 'hi'), (3, 4), (1, 'ace')]
```

```python
print(sorted(tuples))  # hoạt động bình thường
```

```python
tuples = [(1, 4), (3, 'hi'), (1, 'ace')]
```

```python
print(sorted(tuples))  # 1 phá vỡ thế hòa với các kiểu dữ liệu không khớp
```

# **Tóm Tắt Các Phương Thức List**

Trong các slide vừa qua, chúng ta đã tìm hiểu một số phương thức list hữu ích và cách sắp xếp. Đây là những phương thức chúng ta đã giới thiệu:

* Phương thức `.append(object)` thêm `object` vào cuối list mà nó được gọi.
* `.pop()` loại bỏ phần tử cuối cùng khỏi list (không rỗng) mà nó được gọi. Nếu được gọi với tham số số nguyên `.pop(index)` sẽ loại bỏ phần tử tại chỉ số được chỉ định.
* `.insert(index, object)` thêm `object` vào list mà nó được gọi tại `index` cụ thể được cho (nhớ rằng chỉ số bắt đầu từ số không).
* `.copy()` trả về một list mới có cùng nội dung nhưng khác `id` so với list mà nó được gọi.
* `.remove(value)` xóa **lần xuất hiện đầu tiên** của một object bằng `value` khỏi list mà nó được gọi.
* `.index(value)` là một phương thức không thay đổi (non-mutating) trả về chỉ số của **lần xuất hiện đầu tiên** của `value` trong list mà nó được gọi.

Chúng ta đã đưa ra một số cảnh báo về các phương thức trên:

* `ValueError` xảy ra nếu item được tìm kiếm bởi `.remove()` hoặc `.index()` không tồn tại.
* Vì `.index()` và `.remove()` khớp với instance đầu tiên của một giá trị trong list, tốt nhất nên tránh chúng trừ khi bạn chắc chắn *instance đầu tiên* là thứ bạn muốn.
* Hãy cẩn thận không thay đổi list khi đang lặp qua chúng, vì điều này có thể gây ra các hiệu ứng không mong muốn và khó debug.
* Phương thức `.split()` chia một string thành một list các substring dựa trên vị trí của khoảng trắng.
* Phương thức `.join()` nối một list các string lại thành một string.

Chúng ta đã xem qua ngắn gọn về `zip()`, nó nhận nhiều iterable object và nhóm các phần tử tại các chỉ số tương ứng của những input đó.

Chúng ta đã giới thiệu về sắp xếp:

* Hàm `sorted()` sẽ trả về một bản sao đã sắp xếp của list được nhập làm tham số. Phương thức `.sort()` sẽ thay đổi list mà nó được gọi để sắp xếp nó, trả về `None`.
* Đặt keyword argument `reverse=True` cho `sorted()` hoặc `.sort()` sẽ đảo ngược thứ tự sắp xếp.
* Cố gắng gán giá trị của một phương thức thay đổi như `.sort()` sẽ gây rắc rối vì nó trả về `None` và không được thiết kế để gán. An toàn hơn là sử dụng `sorted()` trừ khi bạn chắc chắn muốn sử dụng `.sort()` có tính thay đổi.
* Tiebreaking hoạt động tương tự như sắp xếp từ điển: ký tự/item đầu tiên được xem xét trước, sau đó là ký tự tiếp theo nếu những ký tự đầu tiên giống nhau, và cứ thế tiếp tục.