# Giải thích về \*args và \**kwargs

Trong bài này Nhi sẽ giải thích về 2 arguments kì lạ là \*args và \**kwargs mà bạn hay gặp khi đọc hướng dẫn sử dụng functions trong các packages (Khi đọc lên nghe như tiếng vịt kêu :) ). Chúng là gì và có công dụng gì ?

Trước hết, ta chú ý về 2 kí tự * (đọc là asterisk) và ** (double asterisk), đây thực ra là 2 toán tử dùng để mở gói (unpacking) những objects có thể truy nhập tuần tự (iterable). Những unpacking operator này đã có từ thời Python 2.

Toán tử * dùng được tất cả loại object, bao gồm list, tuple, set, dictionary và strings; nhưng toán tử ** chỉ dành riêng cho dictionary. Cách dùng là đặt * trước iterable object hay ** trước dictionary object. Việc mở gói sẽ xuất ra rất cả phần tử chứa bên trong object theo đúng trình tự, sau đó gán vào các biến rời hay sử dụng trong các hàm.

Thí dụ mở gói 1 tuple: 

In [17]:
tpl = 1,2,3,4,5

print(tpl)

print(*tpl)

(1, 2, 3, 4, 5)
1 2 3 4 5


Nếu làm như sau sẽ đóng gói trở lại:

In [18]:
*tpl,

(1, 2, 3, 4, 5)

Có thể gán vào variables rời:

In [20]:
a,b,c,d,e = *tpl,

print(a,b,c,d,e)

1 2 3 4 5


Đóng gói vào list:

In [21]:
[*tpl]

[1, 2, 3, 4, 5]

Làm tương tự cho list

In [22]:
lst = [1,2,3,4,5]

print(lst)

print(*lst)

[1, 2, 3, 4, 5]
1 2 3 4 5


Làm như sau sẽ đóng gói vào tuple

In [23]:
*lst,

(1, 2, 3, 4, 5)

Gán vào biến rời

In [25]:
a,b,c,d,e = *lst,

print(a,b,c,d,e)

1 2 3 4 5


Tương tự cho dict: sau khi mở gói ta xuất ra keys

In [62]:
dct = {'A':1, 'B':2, 'C':3, 'D':4, 'E':5}
print(dct)
print(*dct)

{'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5}
A B C D E


Tương tự cho strings

In [8]:
st= "abcde"

print(st)
print(*st)

abcde
a b c d e


Hay cho set:

In [11]:
a_set = {1,2,3,4,5}
print(a_set)
print(*a_set)

{1, 2, 3, 4, 5}
1 2 3 4 5


Bây giờ ta bàn một chút về hàm (function), một function có thể không cần argument nào cả, như:

In [69]:
def func():
    print('Đây là hàm không có arguments')
    
func()

Đây là hàm không có arguments


Function cũng có thể chứa 1 hay nhiều arguments. Các arguments có thể xác định bằng Vị trí hoặc từ khóa:

In [71]:
def add_3_numbers(a,b,c):
    print('Đây là hàm dùng positional arguments')
    print(f'Tổng 3 số là {a+b+c}')
    
add_3_numbers(10,20,30)

Đây là hàm dùng positional arguments
Tổng 3 số là 60


Arguments cũng có thể được xác định bằng từ khóa (keywords), thí dụ:

In [77]:
def add_a_number_to_list(lst=None, num=None):
    print('Hàm này có 2 arguments với keyword là lst và num')
    print(f'lst = {lst} và num = {num}')
    print(f'Kết quả là {[i + num for i in lst]}')
    
lst = [1,2,3,4,5]

add_a_number_to_list(lst=lst, num=10)

Hàm này có 2 arguments với keyword là lst và num
lst = [1, 2, 3, 4, 5] và num = 10
Kết quả là [11, 12, 13, 14, 15]


Trong những thí dụ trên, số lượng và nội dung của các arguments là cố định cũng như bị giới hạn bởi định nghĩa khi ta viết hàm. Chúng cũng là các argument bắt buộc cần phải có khi sử dụng hàm. 
Thí dụ: Ta cần phải dùng đúng 3 giá trị cho hàm add_3_numbers nhưng không thể chỉ dùng 2 giá trị, hoặc đưa thêm con số thứ 4.

Trên thực tế, ta cần sự linh hoạt hơn thế này, bằng cách dùng những argument tùy chọn (không có cũng được, không giới hạn về số lượng, nội dung hay bản chất ...).

Để đưa nhiều arguments vào hàm một cách tùy thích mà không cần khai báo khi tạo hàm, ta có thể đóng gói chúng bằng 1 list, thí dụ:

In [95]:
def func_with_packaged_args(pack_args):
    print(f'Hàm này dùng arguments đóng gói trong list: {pack_args}')
    print('Mở gói tuần tự:')
    for _ in pack_args:
        print(_)

In [96]:
func_with_packaged_args([1,2,3,4,5])

Hàm này dùng arguments đóng gói trong list: [1, 2, 3, 4, 5]
Mở gói tuần tự:
1
2
3
4
5


Tuy nhiên một cách khác linh động hơn, ta có thể dùng 2 công cụ có sẵn là \*args và \**kwargs

Khi tạo hàm, ta có thể dùng 3 keywords sau đây, lần lượt:

required : tương ứng với arguments bắt buộc phải có

\*args : tương ứng với arguments kiểu positional tùy chọn, có bản chất là tuple

\**kwargs : tương ứng với arguments kiểu keyword tùy chọn, có bản chất là dictionary

Thí dụ sau đây sẽ cho phép hình dung về vai trò của 3 loại keywords này:

In [119]:
def a_flexible_func(required, *args, **kwargs):
    print(f'Đây là một hàm linh động, với:')
    print(f'argument bắt buộc là {required}')
    if args:
        print(f'argument nối dài tùy chọn *args là {args}')
    if kwargs:
        print(f'keyword argument tùy chọn **kwargs là {kwargs}')

Nếu ta không khai báo required, là 1 positional argument bắt buộc, hàm sẽ không chạy và báo lỗi:

In [80]:
a_flexible_func()

TypeError: a_flexible_func() missing 1 required positional argument: 'mandatory_arg'

Khi chỉ có argument bắt buộc, hàm chạy bất chấp bản chất nội dung của argument này là gì:

In [85]:
a_flexible_func('ABCD')

Đây là một hàm linh động, với:
argument bắt buộc là ABCD


In [86]:
a_flexible_func([1,2,3,4,5])

Đây là một hàm linh động, với:
argument bắt buộc là [1, 2, 3, 4, 5]


In [98]:
a_flexible_func(['A','100', None, True, 2.5])

Đây là một hàm linh động, với:
argument bắt buộc là ['A', '100', None, True, 2.5]


Đi sau argument bắt buộc (ngăn cách bằng dấu phẩy đầu tiên), *args có bản chất là tuple, 

toán tử * có nghĩa là ta sẽ mở gói một iterable object đưa vào hàm trong hình thức một tuple

Ta tạm không quan tâm đến kí tự *, chỉ cần biết rằng tất cả giá trị nào sau dấu phẩy đầu tiên đều sẽ được đóng gói và đưa vào hàm trong phần *args là 1 tuple:

In [99]:
a_flexible_func(1,2,3,4,5)

Đây là một hàm linh động, với:
argument bắt buộc là 1
argument nối dài tùy chọn *args là (2, 3, 4, 5)


In [103]:
a_flexible_func('ABCD', 1,2,3,4,5, )

Đây là một hàm linh động, với:
argument bắt buộc là ABCD
argument nối dài tùy chọn *args là (1, 2, 3, 4, 5)


In [104]:
lst = [1,2,3,4,5]

a_flexible_func(lst, 6,10.5, None, True, )

Đây là một hàm linh động, với:
argument bắt buộc là [1, 2, 3, 4, 5]
argument nối dài tùy chọn *args là (6, 10.5, None, True)


Bây giờ, thay vì đưa rời rạc từng phần tử, ta dùng trực tiếp * để mở gói bất cứ iterable object nào:

In [108]:
a_flexible_func('ABC', *lst)

Đây là một hàm linh động, với:
argument bắt buộc là ABC
argument nối dài tùy chọn *args là (1, 2, 3, 4, 5)


In [109]:
a_flexible_func(1,2,3, *tpl)

Đây là một hàm linh động, với:
argument bắt buộc là 1
argument nối dài tùy chọn *args là (2, 3, 1, 2, 3, 4, 5)


In [112]:
a_flexible_func(1,2,3, *a_set)

Đây là một hàm linh động, với:
argument bắt buộc là 1
argument nối dài tùy chọn *args là (2, 3, 1, 2, 3, 4, 5)


In [113]:
a_flexible_func(1,2,3, *dct)

Đây là một hàm linh động, với:
argument bắt buộc là 1
argument nối dài tùy chọn *args là (2, 3, 'A', 'B', 'C', 'D', 'E')


\**kwargs có cơ chế tương tự *args, nhưng nó dùng cho các keyword arguments thay vì positional arguments

và vì 1 keyword argument là 1 cặp key:value, \**kwargs tương đương với 1 dictionary:

Tương tự như trên, những keyword argument đi sau *args sẽ được đóng gói vào 1 dict và chuyển vào hàm

In [120]:
a_flexible_func('ABC',kw1 = 123, kw2=None, kw3 = True)

Đây là một hàm linh động, với:
argument bắt buộc là ABC
keyword argument tùy chọn **kwargs là {'kw1': 123, 'kw2': None, 'kw3': True}


Thực ra, tên gọi args và kwargs chỉ là cho dễ nhớ, khi đã hiểu cơ chế đằng sau thì ta có thể dùng bất cứ từ nào tùy thích, thí dụ:

In [129]:
def complex_func(mandatory, *args_list, **keywords):
    print(f'Đây là một hàm linh động, với:')
    print(f'argument bắt buộc là {mandatory}')
    if args_list:
        print(f'argument nối dài tùy chọn *args là {args_list}')
    if keywords:
        print(f'keyword argument tùy chọn **kwargs là {keywords}')

In [130]:
complex_func(0, *lst,**dct)

Đây là một hàm linh động, với:
argument bắt buộc là 0
argument nối dài tùy chọn *args là (1, 2, 3, 4, 5)
keyword argument tùy chọn **kwargs là {'A': 1, 'B': 2, 'C': 3, 'D': 4, 'E': 5}


Sau khi được đóng gói đưa vào hàm, các phần tử bên trong tuple args và dict kwargs có thể được sử dụng tùy thích, thí dụ tính toán hàng loạt trên iterable object hay mở gói để lấy từng phần tử ra dùng riêng

In [138]:
def power(order, *numlist, **numdict):
    if numlist:
        print([i**order for i in numlist])
    if numdict:
        print([i**order for i in numdict.values()])

In [139]:
power(2, *[3,5,7,9,10])

[9, 25, 49, 81, 100]


In [140]:
power(2, **{'A':3, 'B':5, 'C':9})

[9, 25, 81]


Cơ chế mà ta vừa thấy có thể áp dụng được cho cả hàm lambda:

In [142]:
(lambda *args: sum(args))(1,2,3)

6

In [143]:
(lambda **kwargs: sum(kwargs.values()))(one=1, two=2, three=3)

6

In [148]:
(lambda *args: sum(args))(*lst)

15

In [146]:
(lambda **kwargs: sum(kwargs.values()))(**dct)

15