# B09 Giải nén (unpacking)

## Mục đích

Giới thiệu về kĩ thuật giải nén danh sách và từ điển.


## Giải nén danh sách

Unpacking là một công cụ quan trọng và rất hữu dụng trong lập trình Python. Giải nén danh sách cho phép chúng ta lấy số liệu từ danh sách mà không cần phải truy cập bằng chỉ mục.

Giả sử chúng ta có một hàm như sau:

```python
def gen_summary(md, cil, ciu):
    print(round(md, 2), round(cil, 2), round(ciu, 2))
    return
```

Hàm này sẽ in ra một chuỗi tổng kết số liệu trung bình hiệu số và khoảng tin cậy của nó. Tuy nhiên, số liệu mà chúng ta thao tác lại không phải là 3 biến riêng biệt mà là một list có 3 phần tử. Trong trường hợp này, nếu muốn đưa vào đối số của hàm, bạn sẽ phải dùng chỉ mục.

```python
result = [0.55, 0.355, 0.745]
gen_summary(result[0], result[1], result[2])
```

Một cách đơn giản hơn, chúng ta có thể "giải nén" các giá trị trong danh sách này bằng cú pháp như sau.

In [1]:
def gen_summary(md, cil, ciu):
    print(round(md, 2), round(cil, 2), round(ciu, 2))
    return

result = [0.55, 0.355, 0.745]
gen_summary(*result)

0.55 0.35 0.74


Bằng việc đặt dấu sao `*` trước tên biến kiểu danh sách, chúng ta đang nói với Python rằng thay vì chuyển giá trị của biến này như một `list` vào trong một đối số của hàm, hay chuyển **các phần tử** của nó thành **nhiều đối số** của hàm.

Chúng ta chỉ sử dụng dấu `*` ở khi giải nén vào đối số của hàm. Khi giải nén vào các biến, bạn không cần dùng dấu `*`. Bạn cũng có thể không cần giải nén hết toàn bộ danh sách. Xem ví dụ sau đây.

In [2]:
def gen_fullname(firstname, lastname):
    return firstname + " " + lastname

customer_info = ["Long", "Hoang", 34, "Hanoi", "long.hoang@fulbrightmail.org"]
firstname, lastname, *_ = customer_info
gen_fullname(firstname, lastname)

'Long Hoang'

Ở đây, chúng ta giải nén hai phần tử đầu tiên của danh sách vào hai biên `firstname` và `lastname`. Phần còn lại của danh sách chúng ta sẽ "nén" lại vào trong biến thứ ba (lí do sử dụng dấu `*` ở đầu). Bạn cũng làm quen với kí tự `_`: Python sẽ không lưu lại các giá trị gán cho `_` vào bộ nhớ; chúng ta dùng cách này để đối xử với các giá trị mà chúng ta không sử dụng đến.

### Giải nén nhiều cấp

Bạn còn có thể giải nén các danh sách lồng trong nhau. Để đảm bảo giải nén đúng, bạn phải chắc chắn về cấu trúc lồng của danh sách.

In [3]:
result = [0.5, [0.4, 0.6]]
md, (cil, ciu) = result
print(md, cil, ciu)

0.5 0.4 0.6


### Khai báo `*args`

Giả sử bạn có một hàm để gộp các chuỗi kí tự với nhau và phân cách chúng bằng một chuỗi kí tự phân cách (separator). Bạn có thể khai báo hàm như sau:

```python
def str_concat(str1, str2, sep=" "):
    return str1 + sep + str2
```

Chúng ta dễ dàng nhận ra nhược điểm của hàm này: nếu bạn muốn gộp 3 chuỗi kí tự với nhau, chúng ta sẽ phải viết lệnh như thế này:

```python
str_concat(str1, str_concat(str2, str3))
```

Thực sự rất không tiện lợi. Sẽ tiện lợi hơn nếu chúng ta có thể cung cấp nhiều chuỗi kí tự trong cùng một lần gọi hàm, chẳng hạn:

```python
str_concat(str1, str2, str3, sep="-")
str_concat(str1, str2, str3, str4, sep="*")
str_concat(*strs)    # với strs là một danh sách chuỗi kí tự
```

Khai báo `*args` cho phép bạn khai báo đối số kiểu như vậy cho hàm (args là viết tắt của arguments, đối số).

In [4]:
def str_concat(*args, sep=" "):
    result = args[0]
    for i in range(1, len(args)):
        result += sep + args[i]
    return result

strs = ["Hello", "my name", "is", "Long"]
str_concat(*strs)

'Hello my name is Long'

Bạn vẫn có thể cung cấp các chuỗi kí tự như một dãy các đối số thay vì nén trong danh sách.

In [5]:
str_concat("Hello", "my name", "is", "Long")

'Hello my name is Long'

Nếu `sep` là đối số bắt buộc (không có giá trị mặc định), bạn sẽ cần cung cấp thông tin về đối số này. Bạn có thể thay đổi vị trí của các đối số.

In [6]:
def str_concat(*args, sep):
    result = args[0]
    for i in range(1, len(args)):
        result += sep + args[i]
    return result

strs = ["Hello", "my name", "is", "Long"]
str_concat(sep=" ", *strs)

'Hello my name is Long'

### Dictionary comprehension

Trong bài [B08](./08_tupdictset.ipynb), chúng ta đã làm quen với bài toán tạo từ điển từ chuỗi kí tự.

```python
s = "Toan: 10, Van: 7, Tieng Anh: 9"

score_dict = {}

for i in s.split(","):
    ketqua = i.split(":")
    monhoc = ketqua[0].strip()
    diemso = int(ketqua[1])
    score_dict[monhoc] = diemso

score_dict
```

Nếu đã quen với list comprehension, bạn sẽ thấy mô thức của thuật toán trên đây rất giống với list comprehension, trừ việc kết quả chúng ta tạo ra là `dict`. Do từ điển cần có hai nội dung là chìa khóa và giá trị, chúng ta phải có hai biến trong dictionary comprehension (`key` và `value`).

Vậy, tư duy của chúng ta sẽ là:

```python
{key: value for key, value in keyvalue_list}
```

Danh sách `keyvalue_list` chứa các phần tử kiểu `list`, `tuple`, hoặc `set`, mỗi phần tử này chứa chính xác hai giá trị, và chúng ta đang giải nén hai giá trị này vào hai biến `key` và `value`. Câu hỏi đặt ra là danh sách này sẽ được tạo ra như thế nào?

In [7]:
s = "Toan: 10, Van: 7, Tieng Anh: 9"
[i.split(":") for i in s.split(",")]

[['Toan', ' 10'], [' Van', ' 7'], [' Tieng Anh', ' 9']]

Chúng ta dùng list comprehension để tạo ra danh sách các tên môn học và điểm số đã được tách nhau ra. Sau đó, chúng ta sử dụng dictionary comprehension để chuyển chúng thành một từ điển.

In [8]:
{key.strip(): int(value) for key, value in [i.split(":") for i in s.split(",")]}

{'Toan': 10, 'Van': 7, 'Tieng Anh': 9}

Chúng ta sẽ còn ứng dụng việc giải nén danh sách vào trong định dạng chuỗi kí tự.


## Giải nén từ điển

Một mục đích thông dụng của giải nén từ điển là để gộp các từ điển với nhau. Kí hiệu giải nén cho từ điển là hai dấu sao `**`.

In [9]:
codebook_sex = {("sex", 0): "Male", ("sex", 1): "Female"}
codebook_bmi = {("bmi", 1): "Underweight", ("bmi", 2): "Normal", ("bmi", 3): "Overweight"}

{**codebook_sex, **codebook_bmi}

{('sex', 0): 'Male',
 ('sex', 1): 'Female',
 ('bmi', 1): 'Underweight',
 ('bmi', 2): 'Normal',
 ('bmi', 3): 'Overweight'}

Ngoài ra, việc giải nén từ điển cũng áp dụng cho đối số của hàm, nhưng là các đối số có tên.

In [10]:
def print_repeat(s, end, reps):
    for i in range(reps):
        print(s, end=end)

print_repeat("Hello", "~~~", 5)

Hello~~~Hello~~~Hello~~~Hello~~~Hello~~~

In [11]:
params = {
    "s": "Hello",
    "end": "~~~",
    "reps": 5
}
print_repeat(**params)

Hello~~~Hello~~~Hello~~~Hello~~~Hello~~~

### Khai báo `**kwargs`

Tương tự như `*args`, khai báo `**kwargs` dùng để báo cho Python biết hàm có thể nhận thêm một dãy các đối số. Khác với `*args`, `*kwargs` (viết tắt của keyword arguments) đòi hỏi chúng ta phải cung cấp tên của đối số, và do đó, từ điển là kiểu dữ liệu hợp lí hơn vì nó chứa các cặp key-value.

Chẳng hạn, chúng ta có một hàm thống kê tổng và trung bình, nhưng không phải lúc nào cũng cần in ra cả hai chỉ số này. Bạn có thể bật/tắt việc hiển thị các chỉ số bằng một từ điển đối số.

In [12]:
def summarize(*args, **kwargs):
    s = sum(args)
    m = s / len(args)

    print("Input:", *args)
    if "sum" in kwargs and kwargs["sum"] == True:
        print("Sum =", s)
    if "mean" in kwargs and kwargs["mean"] == True:
        print("Mean =", m)

summarize(1, 2, 3, 4, 5)
summarize(1, 2, 3, 4, 5, sum = True)

data = range(1, 6)
params = {"sum": False, "mean": True}
summarize(*data, **params)

Input: 1 2 3 4 5
Input: 1 2 3 4 5
Sum = 15
Input: 1 2 3 4 5
Mean = 3.0


---

[Bài trước](./08_tupdictset.ipynb) - [Danh sách bài](../README.md) - [Bài sau](./10_slicing.ipynb)