Source: https://manhhomienbienthuy.github.io/2019/Sep/20/python-args-and-kwargs.html

Có một điều chắc chắn là dù rất nhiều lập trình viên sử dụng cú pháp này, thì việc sử dụng tên `*args` và `**kwargs` là hoàn toàn không bắt buộc. Chỉ có cú pháp với dấu `*` là bắt buộc mà thôi. 
<br/>Nếu muốn chúng ta hoàn toàn có thể viết là `*var` và `**vars` cũng không gặp bất cứ vấn đề gì cả. Tuy nhiên, `*args` và `**kwargs` được sử dụng phổ biến như một quy tắc ngầm vậy, do đó, hầu như mọi người đều sử dụng cách viết đó.

## Sử dụng trong định nghĩa hàm

Cả `*args` và `**kwargs` đều chủ yếu được sử dụng trong định nghĩa. Hai cú pháp đặc biệt này giúp chúng ta có thể truyền bao nhiêu tham số vào hàm cũng được.

Để dễ hiểu hơn, chúng ta hãy xem hàm sau. Đây là một hàm đơn giản, nhận vào hai tham số và trả về tổng của chúng:

In [1]:
def foo(x, y):
    return x + y

foo(1, 2)

3

Hàm này hoạt động rất tốt, nhưng nó sẽ gặp vấn đề khi muốn mở rộng. Bây giờ, nếu muốn tính tổng của nhiều số hơn, chúng ta phải định nghĩa lại hàm với nhiều tham số hơn.
<br/>Đặc biệt, nếu muốn tính tổng có nhiều số nhưng số lượng không biết trước (chỉ biết được khi thực thi) thì cách định nghĩa hàm cơ bản này không còn phù hợp nữa.
<br/>Lúc đó chúng ta cần đến các phương thức khác.

### Sử dụng `*args`

Bây giờ, vấn đề của chúng ta là cần tính tổng của tất cả các số được truyền vào hàm, nhưng không biết trước số lượng của chúng. Có nhiều cách để làm việc này. Một cách khá đơn giản là chúng ta sẽ truyền vào hàm một list, hoặc một tuple các số cần tính tổng:

In [5]:
def foo(numbers):
    result = 0
    for n in numbers:
        result += n
    return result

In [6]:
foo([1, 2])

3

In [7]:
foo([1, 2, 3])

6

Cách làm này khá hiệu quả, ngoại trừ một bất tiện nhỏ là chúng ta cần tạo ra một list các số cần tính toán. Điều này khá bất tiện trong các bài toán thực tế hơn, do các số cần tính toán nà nhiều khi cũng biến động chứ không cố định.
<br/><br/>Đây là lúc là cú pháp `*args` cực kỳ hữu ích, bởi nó cũng giúp chúng ta có thể truyền một số lượng tham số tuỳ ý vào hàm:

In [8]:
def foo(*args):
    result = 0
    for n in args:
        result += n
    return result

In [10]:
foo(1, 2)

3

In [11]:
foo(1, 2, 5)

8

Cú pháp này tiện lợi hơn rất nhiều do chúng ta hoàn toàn không cần xây dựng một list để truyền vào hàm. Tất cả các tham số truyền vào sẽ là phần tử của args và chúng ta có thể duyệt qua nó như một tuple bình thường.
<br/><br/>Lưu ý rằng, **`args là một tuple chứ không phải list`**. Tuy chúng có nhiều điểm tương đồng nhưng sự khác biệt cũng tương đối lớn: list là mutable còn tuple là immutable.
<br/><br/>Ngoài ra, chúng ta hoàn toàn có thể kết hợp `*args` với các tham số khác của hàm với ý nghĩa "những tham số còn lại". Trong trường hợp này, `*args` sẽ phải **đặt ở cuối cùng** nếu không sẽ gặp lỗi ngay.

In [12]:
def foo(a, b, *args):
    print('normal arguments', a, b)
    for x in args:
        print('another argument through *args', x)

In [13]:
foo(1, 2, 3, 4)

normal arguments 1 2
another argument through *args 3
another argument through *args 4


Như vậy, nếu chúng ta biết chắc chắn một số lượng tham số nào đó, chúng ta có thể sử dụng tên tham số bình thường, và với các tham số còn lại chúng ta sẽ dùng `*args`. 
<br/><br/>Về lý thuyết, chúng ta có thể đặt `*args` ở bất cứ đâu chúng ta muốn trong định nghĩa hàm. Tuy nhiên, nếu đặt ở giữa, chúng ta sẽ không thể gọi hàm được bởi mọi lời gọi sẽ đều gặp lỗi. Nguyên nhân là do `*args` sẽ nhận toàn bộ các *tham số "còn lại"* sau khi các tham số đầu tiên đã có giá trị, do đó, các tham số phía sau `*args` sẽ không bao giờ được truyền vào nữa.

In [14]:
def foo(a, *args, b):
    print(a, b, args)

In [15]:
foo(1, 2, 3, 4)

TypeError: foo() missing 1 required keyword-only argument: 'b'

### Sử dụng `**kwargs`

Cách sử dụng `**kwargs` cũng tương tự như như `*args`, tuy nhiên, nó không dùng cho các tham số thông thường truyền vào lần lượt, mà nó được sử dụng cho các tham số đặt tên (thuật ngữ chính xác là **named arguments** hoặc **keyword arguments**).

Các tham số đặt tên này khi định nghĩa cần kèm theo giá trị mặc định của nó. Khi gọi hàm với các tham số đặt tên, nó linh hoạt cho phép chúng ta có thể gọi theo bất kỳ thứ tự nào của tham số cũng được (tất nhiên là gọi lần lượt như bình thường cũng không sao).

Các tham số dạng này cho phép gọi hàm linh hoạt hơn rất nhiều, thậm chí vì có giá trị mặc định, khi gọi hàm không cần truyền tham số cũng được.

In [17]:
def foo(a=0, b=1):
    return a + b

In [18]:
foo()

1

In [19]:
foo(1, 2)

3

In [20]:
foo(b=3, a=4)

7

Ở đây, nếu số lượng và tên của các tham số này không biết trước, chúng ta có thể sử dụng một cách "thông thường" là truyền vào hàm một dict làm tham số. Khi đó, hàm có thể nhận số lượng giá trị truyền vào một cách tuỳ ý:

In [22]:
def foo(a):
    for key, value in a.items():
        print(key, value)

foo({'a': 1, 'b': 2})

a 1
b 2


Cách làm này có nhiều bất tiện, thậm chí còn phức tạp hơn cả việc truyền vào một list cho hàm. Và trong trường hợp này, `**kwargs` vô cùng cần thiết.

In [23]:
def foo(**kwargs):
    for key, value in kwargs.items():
        print(key, value)

foo(a=1, b=2)

a 1
b 2


Lưu ý rằng, với cách sử dụng `**kwargs` thì kwargs trong hàm sẽ nhận giá trị là một dict với key là các tham số được truyền kèm giá trị tương ứng của chúng.

Ngoài ra, cũng tương tự như `*args`, `**kwargs` cũng hoàn toàn có thể kết hợp được với các tham số thông thường khác, và kết hợp với cả `*args` luôn. Nhưng thứ tự khi khai báo các tham số này **rất quan trọng và không thể thay đổi được**. Thứ tự đúng sẽ là:
- Các tham số bình thường
- `*args`
- `**kwargs`

Việc kết hợp này rất phổ biến trong thực tế, nhưng một điều trớ trêu là các trường hợp hay gặp lại thường dùng `*args` và `**kwargs` để bỏ qua các tham số **không cần xử lý** (các tham số quan trọng được khai báo là tham số như thông thường).

Điều này cực kỳ phổ biến với các hàm nhận đầu vào từ form GUI hay lập trình web, vì dữ liệu đầu vào dạng này thường rất đa dạng, mà không phải dữ liệu nào nhận được chúng ta cũng cần xử lý.

In [24]:
def foo(a, b, *args, **kwargs):
    return a + b

Việc thay đổi thứ tự của `**kwargs` là không thể, nếu khai báo hàm với `**kwargs` trước bất kỳ một tham số nào, chúng ta sẽ gặp lỗi ngay:

In [25]:
def foo(a, **kwargs, b):
    pass

SyntaxError: invalid syntax (<ipython-input-25-448936ac7ee1>, line 1)

## Sử dụng để unpack

Thực ra unpack không phải chính xác là sử dụng `*args` và `**kwargs`, nhưng cú pháp thì hoàn toàn giống nhau.

### Unpack khi gọi hàm

Trong phần trước, chúng ta đã thấy cách sử dụng `*args` và `**kwargs` để định nghĩa hàm. Không chỉ định nghĩa, nó còn có thể được sử dụng để gọi hàm. Để minh hoạ, hãy xem xét hai cách gọi hàm như sau:

In [26]:
x = (1, 2, 3)
print(x)

(1, 2, 3)


In [27]:
print(*x)

1 2 3


Hãy xem xét một hàm đơn giản như sau:

In [28]:
def foo(a, b, c):
    print("a = %d, b = %d, c = %d" % (a, b, c))
    
foo(1, 2, 3)

a = 1, b = 2, c = 3


In [29]:
x = (4, 5, 6)
foo(*x)

a = 4, b = 5, c = 6


In [30]:
y = {'a': 7, 'b': 8, 'c': 9}
foo(**y)

a = 7, b = 8, c = 9


Nói một cách đơn giản thì cú pháp `*` được xử dụng với một đối tượng `iterable`, còn `**` chỉ có thể dùng được với `dict` mà thôi.

Một lưu ý nhỏ là khi gọi hàm, số lượng các tham số của hàm và số lượng giá trị unpack được phải khớp nhau, nếu không sẽ có lỗi xảy ra:

In [31]:
x = (1, 2, 3, 4)
foo(*x)

TypeError: foo() takes 3 positional arguments but 4 were given

Trong các ví dụ trên, chúng ta thấy, việc unpack chủ yếu sử dụng cú pháp `*` mà ít khi sử dụng đến `**`. Nguyên nhân cũng là vì `**` chỉ áp dụng được với dict. Và thực tế thì `*`* thường được dùng với dict trong trường hợp hàm có sử dụng **keyword arguments**:

In [32]:
def foo(a=0, b=1, c=2):
    print(a, b, c)

In [33]:
y = {'c': 3, 'b': 4, 'a': 5}
foo(**y)

5 4 3


Lưu ý rằng, dict cũng là một iterable nên nó hoàn toàn có thể sử dụng `*` để unpack khi truyền hàm. Tuy nhiên, dùng `*` thì chúng ta sẽ chỉ truyền được `key` của dict vào cho hàm mà thôi:

In [34]:
foo(*y)

c b a


Ngoài ra, chúng ta hoàn toàn có thể unpack nhiều đối tượng khác nhau trong cùng một lời gọi hàm mà không gặp phải khó khăn gì (lưu ý duy nhất là số lượng giá trị sau khi unpack phải phù hợp với tham số của hàm):

In [36]:
list1 = [1, 2, 3]
list2 = [4, 5]
list3 = [6, 7, 8, 9]

In [37]:
print(list1, list2, list3)

[1, 2, 3] [4, 5] [6, 7, 8, 9]


In [38]:
print(*list1, *list2, *list3)

1 2 3 4 5 6 7 8 9


### Unpack khi gán biến

Có nhiều trường hợp khác mà unpack cực kỳ cần thiết. Một nhu cầu khá thường xuyên của lập trình viên đó là chia giá trị một list (hoặc tuple) vào các biến riêng biệt. Như trong ví dụ dưới đây, chúng ta cần lấy ra giá trị đầu tiên, giá trị cuối cùng và các giá trị khác.

Sử dụng unpack cực kỳ nhanh chóng:

In [39]:
x = [1, 2, 3, 4, 5, 6]
a, *b, c = x

In [40]:
a

1

In [41]:
b

[2, 3, 4, 5]

In [42]:
c

6

Nếu không có unpack, chúng ta sẽ phải làm một việc khá lòng vòng kiểu như thế này:

In [43]:
a, b, c  = x[0], x[1:-1], x[-1]

In [44]:
a

1

In [45]:
b

[2, 3, 4, 5]

In [46]:
c

6

Ngoài ra cũng không thể sử dụng nhiều lần dấu `*` để unpack trong cùng một phép gán. Điều này cũng dễ hiểu thôi, vì nếu dùng nhiều dấu * thì biết các giá trị được phân chia như thế nào mà gán.

In [47]:
x = [1, 2, 3, 4, 5, 6]
*a = x

SyntaxError: starred assignment target must be in a list or tuple (<ipython-input-47-2ce48ddfb3b1>, line 5)

Có một trick nhỏ để giúp chúng ta unpack rồi gán cho một biến duy nhất, tuy nhiên chắc không ai dùng trick này làm gì cả vì trông nó không được thông minh cho lắm (không ai lại phải dùng unpack để gán biến này thành biến kia cả):

In [48]:
*a, = x

In [49]:
a

[1, 2, 3, 4, 5, 6]

### Các trường hợp unpack khác

Một điều thú vị là unpack có thể áp dụng với mọi đối tượng iterable, nó sẽ rất cần thiết nếu chúng ta cần làm "phẳng" 2 hay nhiều list, ví dụ:

In [50]:
list1 = [1, 2, 3]
list2 = [4, 5]
list3 = [6, 7, 8, 9]

[*list1, *list2, *list3]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

Với dict, chúng ta cần đến cú pháp `**` nếu muốn gộp hai dict với nhau:

In [51]:
dict1 = {"A": 1, "B": 2}
dict2 = {"C": 3, "D": 4}

{**dict1, **dict2}

{'A': 1, 'B': 2, 'C': 3, 'D': 4}