<a href="https://colab.research.google.com/github/vuduclyunitn/learning_python/blob/master/S%C3%A1ch_Effective_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Dịch từ sách Effective Python 59 specific ways to write better Python. Tác giả: Brett Slatkin

## Nên sử dụng ```enumerate``` thay vì ```range```

Hàm có sẵn ```range``` hữu dụng cho các vòng lặp qua một tập hợp các số **nguyên**

In [0]:
from random import randint
random_bits = 0
for i in range(64):
  if randint(0, 1):
    random_bits |= 1 << i
    print(random_bits)

2
6
14
30
286
798
1822
3870
36638
167710
429854
954142
2002718
4099870
8294174
25071390
58625822
192843550
461279006
998149918
3145633566
7440600862
16030535454
33210404638
170649358110
445527265054
995283078942
3194306334494
11990399356702
29582585401118
64766957489950
135135701667614
416610678378270
979560631799582
2105460538642206
11112659793383198
29127058302865182
317357434454576926
1470278939061423902
3776121948275117854
8387807966702505758
17611180003557281566


Khi bạn cần lặp qua một cấu trúc dữ liệu như là danh sách của các chuỗi văn bản, bạn có thể lặp trực tiếp qua danh sách này.

In [0]:
flavor_list = ["vanilla", "chocolate", "pecan", "strawberry"]
for flavor in flavor_list:
  print("%s is delicious" % flavor)

vanilla is delicious
chocolate is delicious
pecan is delicious
strawberry is delicious


Thông thường, bạn muốn lặp qua một danh sách và bạn muốn biết được chỉ số (index) của phần tử hiện thời trong danh sách. Ví dụ, bạn muốn in ra xếp hạng của các món kem yêu thích của mình. Có một cách để làm điều này là sử dụng ```range```.

In [0]:
for i in range(len(flavor_list)):
  flavor = flavor_list[i]
  print("%d: %s" % (i+1, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


Đoạn mã trên nhìn không được gọn cho lắm, so với các vòng lặp được thực hiện trên ```flavor_list``` hay dùng ```range```. Bạn phải lấy ra kích thước của danh sách. Bạn phải dùng chỉ số để lấy ra phần tử. Điều này làm cho đoạn code khó đọc.


Python cung cấp một hàm có sẵn ```enumerate``` để giải quyết vấn đề này. ```enumerate``` bao bất cứ iterator nào với một generator. Generator này tạo ra các cặp chỉ số và giá trị từ iterator. Đoạn mã dưới đây nhìn sáng sủa hơn nhiều

In [0]:
for i, flavor in enumerate(flavor_list):
  print("%d: %s" % (i + 1, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


Bạn còn có thể làm cho đoạn code trên gọn hơn nữa khi chỉ định cho ```enumerate``` bắt đầu từ một giá trị nào đó (1 trong trường hợp dưới đây)

In [0]:
for i, flavor in enumerate(flavor_list, 1):
  print("%d: %s" % (i, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


### Nhứng điều cần nhớ


*   ```enumerate``` cung cấp một cú pháp tinh gọn giúp lặp qua một iterator và lấy ra chỉ số của mỗi phần tử tương ứng.
*   Nên sử dụng ```enumerate``` thay vì lặp sử dụng ```range``` và dùng chỉ số để lấy phần tử.
* Bạn có thể cung cấp một tham số thứ 2 chỉ định số bắt đầu được đếm cho chỉ số (mặc định là 0)



## Sử dụng ```zip``` để xử lý các iterators song song

Thông thường bạn làm việc với nhiều danh sách của các đối tượng liên quan. Sử dụng list comprehension cho phép ta nhận một danh sách nguồn và lấy về một danh sách đã qua xử lý. Như ví dụ dưới đây

In [0]:
names = ["Cecilia", "Lise", "Marie"]
letters = [len(n) for n in names]

Các phần tử trong danh sách mới có liên quan với các phần tử trong danh sách gốc thông qua các chỉ số của nó. Để lặp qua hai danh sách này song song, bạn có thể lặp qua chiều dài của danh sách gốc, lấy chiều dài của mỗi phần tử trong danh sách gốc thông qua danh sách mới với một chỉ số.

In [0]:
longest_name = None
max_letters = 0

for i in range(len(names)):
  count = letters[i]
  if count > max_letters:
    longest_name = names[i]
    max_letters = count

print(longest_name)

Cecilia


Vấn đề ở đây đó là vòng lặp phía trên nhìn rối. Các chỉ số của ```names``` và ```letters``` làm cho code khó đọc. Ta dùng chỉ số ```i``` tới hai lần. Sử dụng ```enumerate``` có thể cải thiện vấn đề một chút, nhưng nó vẫn không phải là một giải pháp tốt.

In [0]:
for i, name in enumerate(names):
  count = letters[i]
  if count > max_letters:
    longest_name = name 
    max_letters = count

Để làm cho đoạn mã sáng sủa hơn, Python cung cấp hàm có sẵn ```zip```. Trong Python 3, ```zip``` bao hai hay nhiều iterators với một generator. ```zip``` sinh ra các tuples chứa giá trị tiếp theo từ mỗi iterator. Đoạn mã dưới đây nhìn gọn hơn rất nhiều so với việc dùng chỉ số với nhiều danh sách

In [0]:
for name, count in zip(names, letters):
  if count > max_letters:
    longest_name = name
    max_letters = count 

print(longest_name)

Cecilia


Có hai vấn đề với hàm có sẵn ```zip```. Vấn đề đầu tiên đó là trong Python 2 ```zip``` không phải là một generator; nó sẽ chiếm hết các iterators được cung cấp và trả về một danh sách các tuples nó tạo. Điều này có thể làm cho nó sử dụng rất nhiều bộ nhớ và làm cho trương chình crash. Nếu bạn muốn ```zip``` các iterators rất lớn trong Python 2, bạn nên sử dụng ```izip``` từ module có sẵn ```itertools```  

Vấn đề thứ hai đó là trong trường hợp các iterators đầu vào có chiều dài khác nhau ```zip``` cư xử một cách lạ lùng. Ví dụ, bạn thêm một tên khác vào danh sách phía trên nhưng quên cập nhật danh sách chứa kích số lượng các kí tự. Khi bạn chạy ```zip``` trên hai danh sách đầu vào này, kết quả sẽ không như mong đợi.

In [0]:
names.append("Rosalind")
for name, count in zip(names, letters):
  print(name)

Cecilia
Lise
Marie


Phần tử mới thêm vào 'Rosalind' không được in ra. Đó là cách ```zip``` làm việc. Nó duy trì xuất ra các tuples cho đến khi iterator bên trong cạn kiệt. Cách tiếp cận này hoạt động tốt khi bạn biết rằng các iterators có cùng một chiều dài, điều thường thấy đối với các danh sách được tạo bởi list comprehensions. Trong nhiều trường hợp khác, cách cư xử thông qua việc cắt bớt các phần tử của ```zip``` gây ngạc nhiên và tệ. Nếu bạn không tự tin về chiều dài của các danh sách bạn muốn zip chúng, ví như không chắc rằng các danh sách này bằng nhau, hãy xem xét sử dụng hàm ```zip_longest``` từ thư viện ```itertools```

In [0]:
from itertools import zip_longest

names.append("Rosalind")
for name, count in zip_longest(names, letters):
  print(name, count)

Cecilia 7
Lise 4
Marie 5
Rosalind None
Rosalind None
Rosalind None


Ở ví dụ trên ta thấy rằng các phần tử mới vẫn được in ra, nhưng nếu ta không cập nhật danh sách đếm số lượng kí tự thì giá trị đó sẽ là None. 

### Các thứ cần nhớ


*   Hàm có sẵn ```zip``` có thể được sử dụng để lặp qua nhiều iterators song song.

*   Trong Python 3, ```zip``` là một generator tạo ra các tuples. Trong Python 2, ```zip``` trả về một danh sách đầy đủ các tuples.

* ```zip``` cắt bỏ kết quả một cách thầm lặng nếu bạn cung cấp các iterators với chiều dài khác nhau. 

* Hàm ```zip_longest``` từ module có sẵn ```itertools``` cho phép bạn lặp qua nhiều iterators khác nhau song song bất kể kích thước của chúng thế nào. 



## Biết cách cắt các sequences

Python có các cú pháp cho việc cắt các sequences thành các mảnh. Việc cắt này giúp bạn truy cập vào một phần nhỏ các phần tử của sequence với một nỗ lực nhỏ. Cách sử dụng đơn giản nhất là đối với các kiểu có sẵn như là ```list```, ```str```, và ```bytes```. Phép cắt này có thể được mở rộng cho bất cứ lớp Python nào triển khai các phương thức đặc biệt ```__getitem__``` và ```__setitem__```. 

Dạng đơn giản nhất của cú pháp cắt là ```somelist[start:end]```, ở đó ```start``` được bao gồm và ```end``` được trừ ra. Ví dụ:

In [0]:
a = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
print('First four: ', a[:4])
print('Last four: ', a[-4:])
print('Middle two: ', a[3:-3])

First four:  ['a', 'b', 'c', 'd']
Last four:  ['e', 'f', 'g', 'h']
Middle two:  ['d', 'e']


Khi cắt từ đầu của một danh sách, bạn nên bỏ đi chỉ số 0 ban đầu để cho code nhìn sáng sủa hơn. Hai cách viết đều mang lại kết quả như nhau.

In [0]:
assert a[:5] == a[0:5]

Khi cắt từ cuối danh sách, bạn nên bỏ đi chỉ số cuối bởi vì nó dư thừa

In [0]:
assert a[5:] == a[5:len(a)]

Sử dụng các số âm cho việc cắt trở nên hữu ích cho  các chỉ số tương đối với cuối của một danh sách. Tất cả các dạng cắt này trở nên rõ ràng với một người mới đọc mã của bạn. 

In [0]:
a[:]

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [0]:
a[:5]

['a', 'b', 'c', 'd', 'e']

In [0]:
a[:-1]

['a', 'b', 'c', 'd', 'e', 'f', 'g']

In [0]:
a[:-2]

['a', 'b', 'c', 'd', 'e', 'f']

Kĩ thuật cắt sử dụng các chỉ số ```start``` và ```end``` để kiểm soát truy cập các phần tử trong danh sách. Truy cập các phần tử có chỉ số nằm ngoài biên giới danh sách sẽ tạo ra lỗi.

In [0]:
a[20]

IndexError: ignored

**Chú ý** Nên biết rằng try cập vào danh sách sử dụng một chỉ số âm là một trong số các trường hợp gây ra các kết quả ngạc nhiên từ phép cắt. Ví dụ, ```somelist[-n:]``` sẽ hoạt động tốt khi ```n``` lớn hơn một (ví dụ, ```somelist[-3:]```). Tuy nhiên, khi ```n``` bằng 0, thì ```somelist[-0:]``` sẽ trả lại một bản sao của danh sách ban đầu. Danh sách sao này trỏ tới danh sách ban đầu. Thay đổi kết quả phép cắt sẽ không ảnh hưởng tới danh sách ban đầu. 

In [0]:
b = a[-0:]

In [0]:
b

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [0]:
b.append("i")

In [0]:
b

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']

In [0]:
a

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [0]:
c = a[4:]
print("Before: ", b)
c[1] = 99
print("After: ", b)
print("No change: ", a)

Before:  ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']
After:  ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i']
No change:  ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']


Khi được sử dụng trong các phép gán, các lát cắt sẽ thay thế dải được chỉ định trong danh sách ban đầu. Không 

 như các phép gán tuple (như là ```a, b = c[:2]```), chiều dài của các phép gán không nhất thiết phải giống nhau. Các giá trị trước và sau lát cắt được gán sẽ được bảo tồn. Danh sách sẽ phình ra hay co lại để chứa các giá trị mới.

In [0]:
print('Before ', a)
a[2:7] = [99, 22, 14]
print('After ', a)

Before  ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
After  ['a', 'b', 99, 22, 14, 'h']


In [0]:
print('Before ', a)
a[2:4] = [1, 2, 3]
print('After ', a)

Before  ['a', 'b', 99, 22, 14, 'h']
After  ['a', 'b', 1, 2, 3, 14, 'h']


Nếu bạn để cả các chỉ số bắt đầu và kết thúc trống khi cắt, bạn sẽ có được một bản sao của danh sách ban đầu.

In [0]:
b = a[:]
assert b == a and b is not a

Nếu bạn gán một lát cắt không có chỉ số bắt đầu và kết thúc, bạn sẽ thay thế toàn bộ nội dung của nó với một bản sao mà lát cắt đó tham chiếu tới (thay vì cấp phát một danh sách mới)

In [0]:
b = a
print('Before', a)
a[:] = [4, 5, 6]
assert a is b
print('After', a)

Before [101, 102, 103]
After [4, 5, 6]


### Những thứ cần nhớ


*   Tránh quá chi tiết: đừng sử dụng 0 như là chỉ số bắt đầu hoặc độ dài của sequence cho chỉ số kết thúc
*   Phép cắt cho phép ta dễ dàng biểu diễn các phạm vi trước và sau của một sequence (như là ```a[:20]``` hay ```a[-20:]```)
* Gán cho một dải trong một sequence một dải giá trị khác sẽ thay thế dải đó trong danh sách ban đầu với dải cung cấp ngay cả khi kích thước của các dải khác nhau.



## Tận dụng lợi thế của mỗi khối try/except/else/finally

Khi lập trình đôi lúc bạn muốn xử lý các ngoại lệ xảy ra. Các ngoại lệ này được bắt lại trong các khối ```try```, ```except```, ```else```, và ```finally```. Mỗi khối đảm nhiệm mỗi nhiệm vụ riêng biệt, và có những sự kết hợp giữa các khối này trở nên hữu dụng.

### Khối Finally
Sử dụng ```try/finally``` khi bạn muốn các ngoại lệ được truyền rộng rãi đi, nhưng bạn cũng muốn chạy các mã dọn dẹp (cleanup code) ngay cả khi các ngoại lệ xảy ra. Một ứng dụng phổ biến của ```try/finally``` đó là đóng các file handles.

In [0]:
handle = open('random_data.txt') # Có thể gây ra ngoại lệ IOError
try:
  data = handle.read() # Có thể gây ra ngoại lệ UnicodeDecodeError
finally:
  handle.close()

Bất cứ ngoại lệ nào được gây ra bởi phương thức ```read``` sẽ được lan tới code gọi phương thức đó (calling code), phương thức ```close``` của handle được đảm bảo chạy trong khối ```finally```. Bạn phải gọi ```open``` trước khối ```try``` bởi vì các ngoại lệ thường xảy ra khi mở file (như ```IOError``` nếu file không tồn tại) nên bỏ qua khối ```finally```.

### Khối Else

Sử dụng ```try/except/else``` để làm cho rõ ràng ngoại lệ nào sẽ được xử lý bởi code của bạn và ngoại lệ nào sẽ lan truyền đi. Khi khối ```try``` không khởi lên một ngoại lệ, khối ```else``` sẽ chạy. Khối ```else``` giúp bạn tối thiểu hoá lượng code trong khối ```try``` và làm cho code dễ đọc hơn. Ví dụ, bạn muốn nạp (load) dữ liệu từ diển JSON và trả về giá trị của một key dựa trên một string được cung cấp. Nhìn vào ví dụ sau:

In [0]:
def load_json_key(data, key):
  try:
    result_dict = json.loads(data) # Có thể tạo ra ValueError
  except ValueError as e:
    raise KeyError from e 
  else:
    return result_dict[key] # Có thể tạo ra KeyError

Nếu dữ liệu không phải là JSON hợp lệ, khi đó giải mã sử dụng ```json.loads``` sẽ tạo ra một ```ValueError```. Ngoại lệ này được bắt bởi khối ```except``` và được xử lý ở đó. Nếu việc giải mã thành công, khi đó chìa khoá được yêu cầu sẽ được trả về trong khối ```else```. Nếu việc dò chìa khoá tạo ra bất cứ ngoại lệ nào, chúng sẽ lan truyền tới code gọi bởi vì chúng nằm bên ngoài khối ```try```. Khối ```else``` đảm bảo rằng những gì đi theo sau ```try/except``` được tách biệt rõ ràng khỏi khối ```except```. Điều này làm cho việc lan toả ngoại lệ trở nên rõ ràng hơn. 

### Mọi thứ cùng với nhau 

Sử dụng ```try/except/else/finally``` khi bạn muốn làm tất cả trong cùng một câu tổng hợp. Ví dụ, bạn muốn đọc mô tả công việc cần làm từ một file, xử lý nó, và sau đó cập nhật file này. Ở đây, khối ```try``` được sử dụng để đọc file và xử lý nó. Khối ```except``` được sử dụng để xử lý các ngoại lệ được mong đợi từ khối ```try```. Khối ```else``` được sử dụng để cập nhật file và cho phép các ngoại lệ liên quan được lan toả. Khối ```finally``` dọn dẹp file handle

In [0]:
UNDEFINED = object()

def divide_json(path):
  handle = open(path, 'r+') # Có thể tạo ra lỗi IOError
  try:
    data = handle.read() # Có thể tạo ra lỗi UnicodeDecodeError 
    op = json.loads(data) # Có thể tạo ra lỗi ValueError 
    value = (op["numerator"] / op["denominator"])
  except ZeroDivisionError as e:
    return UNDEFINED
  else:
    op['result'] = value 
    result = json.dumps(op)
    handle.seek(0)
    handle.write(result) # Có thể tạo ra lỗi IOError 
    return value 
  finally:
    handle.close() # Luôn luôn chạy 

Cấu trúc trên đặc biệt hữu dụng bởi vì tất cả các khối cùng làm việc với nhau một cách hợp lý. Ví dụ, nếu một ngoại lệ xảy ra trong khối ```else``` trong khi ghi lại dữ liệu kết quả, khối ```finally``` sẽ vẫn chạy và đóng file handle.

### Những điều cần nhớ.


*   Sử dụng ```try/finally``` giúp bạn chạy các khối code dọn dẹp bất kể các ngoại lệ xảy ra trong khối ```try```
*   Khối ```else``` giúp bạn tối thiểu hoá lượng code trong các khối ```try``` và tách biệt trường hợp thành công từ các khối ```try/except```. 
* Khối ```else``` có thể được sử dụng để thực hiện các hành động bổ sung sau một khối ```try``` thành công nhưng trước khối ```finally``` được sử dụng để dọn dẹp.



## Nên dùng các ngoại lệ thay vì trả về None

Khi viết các hàm tiện ích (utility functions), các lập trình viên thường đứng trước một lựa chọn cho việc trả về giá trị ```None``` có mang một ý nghĩa gì hay không trong một số trường hợp. Ví dụ, bạn muốn một hàm trợ giúp (helper function) cho việc chia một số cho một số khác. Trong trường hợp chia cho số 0, trả lại ```None``` dường như tự nhiên bởi vì kết quả chưa được định nghĩa.

In [0]:
def divide(a, b):
  try:
    return a/b
  except ZeroDivisionError:
    return None

Cod sử dụng hàm này có thể diễn giải kết quả trả về tương ứng.

In [0]:
result = divide(3, 0)
if result is None:
  print("Invalid inputs")

Invalid inputs


Điều gì xảy ra khi số được chia hay tử số bằng 0? Thực hiện phép chia này sẽ tạo ra kết quả bằng 0 (nếu số bị chia hay mẫu số khác 0). Điều này có thể tạo ra các vấn đề khi bạn đánh giá kết quả trong một điều kiện như là câu lệnh ```if```. Bạn có thể tìm kiếm các giá trị ```False``` khi bạn nhắc tới các lỗi thay vì ```None```. 

In [0]:
x, y= 0, 5
result = divide(x, y)

if not result:
  print("Invalid inputs") # Điều này sai

Invalid inputs


Đây là một lỗi phổ biến khi ```None``` có ý nghĩa đặc biệt. Đó là lý do tại sao trả về ```None``` từ một hàm dễ sai. Có hai cách để giảm đi các lỗi như vậy.

Cách đầu tiên là chia giá trị trả về thành một một tuple có hai phần tử. Phần đầu tiên của tuple chỉ ra rằng phép tính thành công hay thất bại. Phần thứ hai là kết quả thực sự được tính toán



In [0]:
def divide(a, b):
  try:
    return True, a/b
  except ZeroDivisionError:
    return False, None

Các lời gọi tới hàm này phải rã tuple trả về. Điều này bắt họ (các hàm gọi) phải xem xét phần nào trong tuple là kết quả, và phần nào là trạng thái của phép tính. 

In [0]:
success, result = divide(4, 0)
if not success:
  print("Invalid inputs")

Invalid inputs


Vấn đề là ở chỗ các lời gọi hàm có thể dễ dàng lờ đi phần đầu của tuple trả về (sử dụng biến có hai dấu gạch châu ```__````, một quy ước của Python dành cho các biến không được sử dụng). Đoạn code sử dụng dưới đây nhìn không sai nếu chỉ xét thoáng qua. Nhưng nó trở nên tệ khi kết quả trả về là ```None```

In [0]:
_, result = divide(0, 3)

if not result:
  print("Invalid inputs")

Invalid inputs


Ở ví dụ trên, dù phép tính là hợp lệ nhưng đoạn mã vẫn in ra kết quả sai, bởi vì ta đã kiểm tra sai biến.

Cách thứ hai tốt hơn là không bao giờ trả về ```None```. Thay vào đó, khởi lên một ngoại lệ cho người gọi và để họ xử lý nó. Ở đây, tôi chuyển ```ZeroDivisionError``` sang ```ValueError``` để nói cho người gọi biết rằng giá trị nhập vào là tệ.

In [0]:
def divide(a, b):
  try:
    return a / b
  except ZeroDivisionError as e:
    raise ValueError('Invalid inputs') from e

In [0]:
divide(1, 0)

ValueError: ignored

Bây giờ người gọi nên xử lý ngoại lệ trong trường hợp input nhập vào không hợp lệ. NGười gọi không cần thiết phải yêu cầu một câu điều kiện trên giá trị trả về của một hàm. Nếu hàm này không gây ra một ngoại lệ, khi đó giá trị trả về phải là tốt. Kết quả của của việc xử lý ngoại lệ thật rõ ràng.

In [0]:
x, y = 5, 2
try:
  result = divide(x, y)
except ValueError:
  print("Invalid inputs")
else:
  print("Result is %.1f" %result)

Result is 2.5


In [0]:
x, y = 5, 0
try:
  result = divide(x, y)
except ValueError:
  print("Invalid inputs")
else:
  print("Result is %.1f" %result)

Invalid inputs


### Những điều cần nhớ


*   Các hàm trả về ```None``` để ám chỉ một ý nghĩa đặc biệt dễ bị sai bởi vì ```None``` và các giá trị khác (ví dụ như số 0, hoặc một chuỗi rỗng) đều được đánh giá là ```False``` trong các câu điều kiên
*   Khởi lên các ngoại lệ để ám chỉ các tình huống đặc biệt thay vì trả về ```None```. Mong đợi code gọi xử lý các ngoại lệ hợp khi khi chúng được mô tả. 



In [0]:
a = None
assert not a == False

## Xem xét sử dụng các Generators thay vì trả về các danh sách 

Lựa chọn đơn giản nhất cho các hàm muốn trả về một chuỗi các kết quả là trả về một danh sách các phần tử. Ví dụ, bạn muốn tìm chỉ số của mỗi từ trong một chuỗi. Trường hợp này, tôi dồn các kết quả vào trong một danh sách sử dụng phương thức ```append``` và trả nó về vào cuối hàm.


In [0]:
def index_words(text):
  result = []
  if text:
    result.append(0)
  for index, letter in enumerate(text):
    if letter == " ":
      result.append(index + 1)
  return result 

Đoạn mã hoạt động đối với một vài input

In [0]:
address = 'Four score and seven years ago...'
result = index_words(address)
print(result[:3])

[0, 5, 11]


Có hai vấn đề với hàm ```index_words```. 

Vấn đề thứ nhất là đoạn mã được biết nhìn hơi dày và rắc rối. Mỗi lần một kết quả mới được gọi, tôi gọi phương thức ```append```. Kích thước của lời gọi (```result.append```) làm giảm đi tầm quan trọng của giá trị được thêm vào trong danh sách (```index + 1```). Có một dòng để tạo danh sách kết quả và một dòng khác trả lại kết quả. Trong khi thân hàm chứa khoảng 130 kí tự (trừ ra khoảng trắng), chỉ có 75 kí tự là quan trọng.

Có một cách tốt hơn để viết hàm này đó là sử dụng một *generator*. Các generators là những hàm sử dụng các câu lệnh ```yield```. Khi được gọi, các hàm generator không chạy gì cả mà thay vào đó nó trả về một iterator. Với mỗi lời gọi hàm ```next``` có sẵn trong python sẽ làm cho generator tiến tới câu lệnh ```yield``` tiếp theo. Mỗi giá trị được truyền tới ```yield``` bởi generator sẽ được trả về tới người gọi bởi iterator. 

Ở đây tôi định nghĩa một hàm generator tạo ra kết quả giống như cách làm sử dụng danh sách phía trên.

In [0]:
def index_words_iter(text):
  if text:
    yield 0
  for index, letter in enumerate(text):
    if letter == " ":
      yield index + 1

Đoạn code phía trên dễ đọc hơn rất nhiều bởi vì tất cả các tương tác với danh sách kết quả đều được loại bỏ. Thay vào đó các kết quả được đưa cho các biểu thức ```yield```. Iterator được trả về bởi lời gọi generator có thể dễ dàng được chuyển thành mọt danh sách bằng cách truyền nó cho hàm có sẵn ```list```. 

In [0]:
result = list(index_words_iter(address))

In [0]:
result

[0, 5, 11, 15, 21, 27]

Vấn đề thứ hai với ```index_words``` đó là hàm này yêu cầu tất cả các kết quả được lưu vào trong một danh sách trước khi được trả về. Đối với các inputs lớn, việc này có thể làm cho chương trình của bạn tiêu tốn hết bộ nhớ và crash. Ngược lại, một phiên bản generator của hàm này có thể dễ dàng được thích ứng để nhận các inputs với bất cứ chiều dài nào.

Ở đây tôi định nghĩa một generator lấy input từ một file, mỗi thời điểm một dòng và xuất ra các kết quả mỗi từ một lần. Bộ nhớ của hàm nà được giới hạn tới độ dài cực đại của mỗi dòng input đầu vào

In [0]:
def index_file(handle):
  offset = 0
  for line in handle:
    if line:
      yield offset
    for letter in line:
      offset += 1
      if letter == ' ':
        yield offset

Chạy generator phái trên cho ra cùng kết quả

In [0]:
from itertools import islice
with open("address.txt") as f:
  it = index_file(f)
  results = islice(it, 0, 3)
  print(list(results))

[0, 2, 7]


Vấn đề của việc định nghĩa các generators như thế này đó là các lời gọi phải biết được rằng các iterators được trả về là stateful (nghĩa là máy tính sẽ lưu trữ trạng thái các tương tác) và không thể tái sử **dụng**

### Những điều cần nhớ


*   Sử dụng generators có thể làm cho code sáng sủa hơn thay vì dùng các danh sách để lưu trữ các kết quả tích luỹ
*   Iterator trả về bởi một generator tạo một tập các giá trị được gửi tới các biểu diễn ```yield``` bên trong thân hàm generator.
* Các generators có thể tạo ra một chuỗi các kết quả cho các inputs lớn tuỳ ý bởi vì bộ nhớ hoạt động của chúng không bao gồm tất cả các inputs và outputs.



## Mang tâm thế phòng vệ khi lặp qua các tham số

Khi một hàm nhận một danh sách các đối tượng như là tham số, ta thường lặp qua danh sách đó nhiều lần. Ví dụ, bạn muốn phân tích số lượng khách du lịch của bang Texax. Tưởng tượng rằng tập dữ liệu là số lượng các du khách tới mỗi thành phố (hàng triệu mỗi năm). Bạn muốn tìm phần trăm lượng du khách tổng thể mỗi thành phố trong bang nhận được.

Để làm điều này bạn cần một hàm chuẩn hoá (normalization function). Hàm này tính tổng các inputs để xác định tổng số lượng du khách mỗi năm. Sau đó nó chia mỗi số lượng khách cho con số tổng để tìm ra đóng góp của mỗi thành phố cho tổng thể.

In [0]:
def normalize(numbers):
  total = sum(numbers)
  result = []
  for value in numbers:
    percent = 100 * value / total
    result.append(percent)
  return result

Hàm này hoạt động tốt với một danh sách số lượng các chuyến thăm.

In [0]:
visits = [15, 35, 80]
percentages = normalize(visits)
print(percentages)

[11.538461538461538, 26.923076923076923, 61.53846153846154]


Để mở rộng hàm trên, bạn cần đọc dữ liệu từ một file chứa mọi thành phố trong tiểu bang Texas. Tôi định nghĩa một generator để làm điều đó bởi vì tôi có thể tái sử dụng hàm này khi tôi muốn tính toán số lượng du khách cho toàn bộ thế giới, một tập dữ liệu lớn hơn rất nhiều

In [0]:
def read_visits(data_path):
  with open(data_path) as f:
    for line in f:
      yield int(line)

Tuy nhiên gọi hàm ```normalize``` trên giá trị trả về của generator không đưa ra kết quả gì.

In [0]:
it = read_visits("my_numbers.txt")
percentages = normalize(it)
print(percentages)

[]


Lý do là bởi vì một iterator chỉ tạo ra các kết quả một lần duy nhất. Bạn phải lặp qua một iterator hoặc generator đã khởi lên một ngoại lệ ```StopIteration```, bạn sẽ không có bất cứ kết quả nào trong lần hai

In [0]:
it = read_visits("my_numbers.txt")
print(list(it))
print(list(it))

[13, 23, 12, 45, 31, 41, 23]
[]


Điều gây nhầm lẫn ở đây là bạn sẽ không thấy bắt cứ lỗi nào khi bạn lặp qua một iterator đã cạn kiệt. Các vòng lặp ```for```, các xây dựng ```list```, và nhiều hàm khác trong thư viện chuẩn Python mong đợi ```StopIteration``` được khởi lên trong những hoạt động bình thường. Các hàm này không thể nói lên sự khác biệt giữa một iterator không có output và một iterator có output và bị cạn kiệt.


Để giải vấn đề này, ban có thể làm cạn kiệt một iterator đầu vào và giữ một bản sao của tất cả nội dung trong một danh sách. Bạn có thể lặp qua phiên bản danh sách của dữ liệu bao nhiêu lần bạn muốn. Dưới đây là cùng một hàm như trước , nhưng hàm mới này sao chép iterator đầu vào.

In [0]:
def normalize_copy(numbers):
  numbers = list(numbers) # Sao chép iterator
  total = sum(numbers)
  result = []
  for value in numbers:
    percent = 100 * value / total
    result.append(percent)
  return result 

Hàm mới bây giờ hoạt động đúng trên giá trị trả về của generator

In [0]:
it = read_visits('my_numbers.txt')
percentages = normalize_copy(it)
print(percentages)

[6.914893617021277, 12.23404255319149, 6.382978723404255, 23.93617021276596, 16.48936170212766, 21.80851063829787, 12.23404255319149]


Vấn đề với cách tiếp cận này đó là bản sao nội dung của iterator đầu vào có thể lớn. Sao chép iterator lớn này có thể làm cho chương trình sử dụng hết bộ nhớ và crash. Có một cách để giải quyết là chấp nhật một hàm và trả về một iterator mới mỗi lần hàm này được gọi.

In [0]:
def normalize_func(get_iter):
  total = sum(get_iter()) # iterator mới
  result = []
  for value in get_iter(): # Iterator mới 
    percent = 100 * value / total
    result.append(percent)

Để sử dụng ```normalize_func```, bạn có thể truyền cho nó một biểu diễn ```lambda```, lambda này gọi generator và tạo ra một iterator mỗi lần

In [0]:
percentages = normalize_func(lambda: read_visits("my_numbers.txt"))
percentages

Mặc dù cách này chạy được, nhưng phải truyền vào một hàm lambda nhìn hơi rắc rối. Có một cách tốt hơn để có được cùng kết quả là cung cấp một lớp chứa mới (container class) thực hiện giao thức iterator (iterator protocol)

Giao thức iterator là cách các vòng lặp ```for``` và các biểu diễn liên quan đi qua các nội dung của một kiểu chứa (container type). Khi Python nhìn thấy một câu lệnh như ```for x in foo``` nó sẽ thực sự gọi ```iter(foo)```. Hàm có sẵn ```iter``` sau đó gọi phương thức đặc biệt ```foo.__iter__```. Phương thức ```__iter__``` phải trả về một đối tượng iterator (chính đối tượng này thực hiện phương thức đặc biệt ```__next__```). Sau đó vòng lặp ```for``` lặp lại gọi hàm có sẵn ```next``` trên đối tượng iterator cho đến khi nó cạn kệt (và khởi lên một ngoại lệ ```StopIteration```)

Nghe có vẻ phức tập, nhưng bạn có thể đạt được tất cả điều này thông qua việc triển khai phương thức ```__iter__``` như là một generator. Ở đây, tôi định nghĩa một lớp chứa có thể lặp (iterable container class) lớp này đọc các tệp tin chứa nội dung khách du lịch

In [0]:
class ReadVisits(object):
  def __init__(self, data_path):
    self.data_path = data_path

  def __iter__(self):
    with open(self.data_path) as f:
      for line in f:
        yield int(line)

Container mới này hoạt động đúng khi được truyền cho hàm ban đầu mà không phải chỉnh sửa gì cả

In [0]:
visits = ReadVisits("my_numbers.txt")
percentages = normalize(visits)
print(percentages)

[6.914893617021277, 12.23404255319149, 6.382978723404255, 23.93617021276596, 16.48936170212766, 21.80851063829787, 12.23404255319149]


Cách làm trên chạy được là bởi vì phương thức ```sum``` trong ```normalize``` sẽ gọi ```ReadVisits.__iter__``` để cấp phát một đối tượng iterator mới. Vòng lặp ```for``` qua các số cũng sẽ gọi ```__iter__``` để cấp phát một đối tượng iterator thứ hai. Mỗi iterator sẽ được đẩy lên và cạn kiệt độc lập với nhau, đảm bảo rằng mỗi vòng lặp nhìn thấy tất cả cá dữ liệu đầu vào. Chỉ có một điểm trừ của cách tiếp cận này đó là nó đọc dữ liệu đầu vào nhiều lần. 

Bây giờ bạn đã biết được các containers như ```ReadVisits``` hoạt động thế nào, bạn có thể viết các hàm của mình để đảm bảo rằng các tham số không phải là các iterators. Giao thức chỉ ra rằng khi một iterator được truyền vào hàm có sẵn ```iter```, ```iter``` sẽ trả về chính iterator đó. Ngược lại, khi một kiểu chứa được truyền vào ```iter```, một đối tượng iterator sẽ được trả về mỗi lần gọi. Do đó, bạn có thể kiểm tra một giá trị đầu vào cho kiểu hành xử này và khởi lên một ngoại lệ ```TypeError``` để từ chối các iterators.

In [0]:
def normalize_defensive(numbers):
  if iter(numbers) is iter(numbers): # Một iterator -- không tốt!
    raise TypeError('Must supply a container')
  
  total = sum(numbers)
  result = []
  for value in numbers:
    percent = 100 * value / total
    result.append(percent)
  return result

Hàm trên hiệu quả nếu bạn không muốn sao chép toàn bộ iterator đầu vào như hàm ```normalize_copy``` ở phía trên, nhưng bạn cần lặp qua dữ liệu liệu đầu vào nhiều lần. Hàm này hoạt động tốt với ```list``` và ```ReadVisits``` bởi vì chúng là các đối tượng chứa (containers). Nó sẽ hoạt động cho bất cứ kiểu chứa nào tuân theo giao thức iterator. 

In [0]:
visits = [15, 35, 80]
normalize_defensive(visits)
visits = ReadVisits("my_numbers.txt")
normalize_defensive(visits)

[6.914893617021277,
 12.23404255319149,
 6.382978723404255,
 23.93617021276596,
 16.48936170212766,
 21.80851063829787,
 12.23404255319149]

Hàm này sẽ khởi lên một ngoại lệ nếu giá trị đầu vào có  thể lặp (iterable) nhưng không phải là đối tượng chứa.

In [0]:
it = iter(visits)
normalize_defensive(it)

TypeError: ignored

### Những điều cần nhớ


*   Biết được các hàm lặp qua các tham số nhiều lần. Nếu các tham số là các iterators, bạn có thể thấy cư xử hơi lệ và các giá trị bị mất
*   Giao thức iterator của Python định nghĩa cách các đối tượng chứa và các iterators tương tác với các hàm có sẵn ```iter``` và ```next```, các vòng lặp, và các biểu diễn liên quan.
* Bạn có thể dễ dàng định nghĩa kiểu chứa có thể lặp của bạn thông qua phương thức ```__iter__``` như là một generator.
* Bạn có thể phát hiện xem một giá trị có là một iterator hay không (hay là một đối tượng chứa) nếu gọi ```iter``` trên đối tượng đó hai lần, hàm này sau đó gọi hàm có sẵn ```next```



## Nên sử dụng các lớp trợ giúp hơn là sử dụng các từ điển và tuples để giúp các bản ghi

Kiểu từ điển có sẵn của Python giúp duy trì trang thái nội tại động (dynamic internal state) của một đối tượng qua thời gian. Ở đây *động* có nghĩa là trong những hoàn cảnh bạn cần lưu giữ các bản sao cho một tập hợp các đối tượng không được mong đợi. Ví dụ bạn muốn lưu lại điểm số của một tập hợp các học sinh nhưng bạn không biết trước tên của các học sinh này. Bạn có thể định nghĩa một lớp để lưu tên trong một từ điển thay vì sử dụng một thuộc tính được định nghĩa sẵn cho mỗi học sinh 

In [0]:
class SimpleGradebook(object):
  def __init__(self):
    self._grades = {}

  def add_student(self, name):
    self._grades[name] = []

  def report_grade(self, name, score):
    self._grades[name].append(score)

  def average_grade(self, name):
    grades = self._grades[name]
    return sum(grades) / len(grades)

Sử dụng lớp đơn giản hơn

In [0]:
book = SimpleGradebook()
book.add_student('Isaac Newton')
book.report_grade('Isaac Newton', 90)
print(book.average_grade('Isaac Newton'))

90.0


Từ điển rất dễ sử dụng nhưng khi bạn mở rộng nó quá trớn để viết đoạn mã không ổn định thì nó lại nguy nhiểm. Ví dụ, bạn muốn mở rôgnj lớp ```SimpleGradebook``` để giữ một danh sách các điểm cho mỗi môn, chứ không phải là điểm tổng kết. Bạn có thể làm điều đó bằng cách thay đổi từ điển ```_grades``` để ánh xạ các tên học sinh (các chìa khoá) tới một từ điẻn khác (các giá trị). Từ điển phía trong sẽ ánh xạ các chủ thể (các chìa khoá) tới các các điểm số (các giá trị)

In [0]:
class BySubjectGradebook(object):
  def __init__(self):
    self._grades = {}
  def add_student(self, name):
    self._grades[name] = {}

  def report_grade(self, name, subject, grade):
    by_subject = self._grades[name]
    grade_list = by_subject.setdefault(subject, [])
    grade_list.append(grade)
    grade_list.append(grade)

  def average_grade(self, name):
    by_subject = self._grades[name]
    total, count = 0, 0
    for grades in by_subject.values():
      total += sum(grades)
      count += len(grades)
    return total / count


Cách này đủ dễ hiểu. Các phương thức ```report_grade``` và ```average_grade``` sẽ phức tạp hơn chút ít nhưng vẫn có thể quản lý được.

Sử dụng lớp vẫn thấy đơn giản

In [0]:
book = BySubjectGradebook()
book.add_student('Albert Einstein')
book.report_grade('Albert Einstein', 'Math', 74)
book.report_grade('Albert Einstein', 'Math', 42)
book.report_grade('Albert Einstein', 'Gym', 12)
book.report_grade('Albert Einstein', 'Gym', 123)

Nào hãy tưởng tượng các yêu cầu cho chương trình thay đổi nữa. Bạn vẫn muốn theo dõi điểm từng môn tương quan điểm tổng kết, vì vậy các điểm kiểm tra giữa kì và cuối kì quan trọng hơn các kiểm tra miệng. Một cách để làm điều này đó là thay đổi từ điển bên trong; thay vì ánh xạ các đối tượng (các chìa khoá) tới các điểm thi (các giá trị), tôi có thể sử dụng tuple ```(score, weight)``` như là các giá trị. 

In [0]:
class WeightedGradebook(object):
  def __init__(self):
    self._grades = {}
  def add_student(self, name):
    self._grades[name] = {}

  def report_grade(self, name, subject, score, weight):
    by_subject = self._grades[name]
    grade_list = by_subject.setdefault(subject, [])
    grade_list.append((score, weight))

  def average_grade(self, name):
    by_subject = self._grades[name]
    score_sum, score_count = 0, 0
    for subject, scores in by_subject.items():
      subject_avg, total_weight = 0, 0
      for score, weight in scores:
        

Mặc dù các thay đổi đối với phương thức ```report_grade``` nhìn có vẻ đơn giản, chỉ là dùng tuple như là một giá trị - phương thức ```average_grade``` bây giờ cần có một vòng lặp bên trong một vòng lặp và trở nên khó để đọc.

Sử dụng lớp cũng trở nên khó khăn hơn. Khi cung cấp các tham số theo vị trí, ý nghĩa của chúng cũng không thực sự rõ ràng

In [0]:
book.report_grade('Albert Einstein', 'Math', 80, 0.10)

Khi độ phức tạp trong triển khai các từ điển và tuples tăng lên, đó là thời điểm bạn có thể chuyển qua dùng một phân tầng của các lớp (hierachy of classes)

Khi bạn mới phát triển chương trình, bạn không biết rằng bạn cần hỗ trợ các điểm số được đánh trọng lượng, vì vậy độ phức tạp của các lớp trợ giúp dường như không được đáp ứng. Các kiểu từ điển và tuple giúp cho việc lưu trữ, thêm từng lớp vào đối tượng lưu trữ phía trong. Nhưng bạn nên tránh việc lồng kiểu vào nhau (ví dụ, tránh các từ điển chứa các từ điển). Nó làm cho đoạn mã của bạn khó đọc và việc bảo trì trở thành một cơn ác mộng. 

Khi bạn nhận ra rằng việc lưu trữ các bản ghi trở nên phức tạp, hãy chia nó ra thành những lớp. Điều này giúp bạn định nghĩa các giao tiếp được dành riêng cho việc bao dữ liệu của bạn. Điều này cũng cho phép bạn tạo ra một lớp trừu tượng (abstraction) giữa các giao tiếp của bạn và các chi tiết triển khai phía sau.

### Tái cấu trúc sang các lớp

Bạn có thể bắt đầu chuyển sang dùng các lớp từ đáy của cây phụ thuộc (dependency tree): một điểm thi duy nhất. Một lớp dường như to lớn cho việc lưu trữ thông tin đơn giản này. Một tuple có vẻ thích hợp hơn bởi vì các điểm số là không thể thay đổi sau khi đã được định nghĩa (immutable). Ở đây tôi sử dụng tuple ```(score, weight)``` để theo dõi các điểm số trong một danh sách.

In [0]:
grades = []
grades.append((95, 0.45))

total = sum(score * weight for score, weight in grades)
total_weight = sum(weight for _, weight in grades)
average_grade = total / total_weight

Vấn đề với các tuples bình thường (plain tuples) này đó là vị trí. Khi bạn muốn gắn kết nhiều thông tin hơn với một điểm số, ví dụ một tập hợp các ghi chú từ giáo viên, bạn sẽ cần viết lại mọi chỗ bạn sử dụng tuple với hai phần tử để đảm bảo rằng chúng phải có ba phần tử. Ở đây, tôi sử dụng dấu gạch chân ```_``` (một quy ước của Python dùng cho các biến không được sử dụng) để lấy ra thành phần thứ ba trong tuple và không làm gì với nó cả.

In [0]:
grades = []
grades.append((95, 0.45, 'Great job'))
total = sum(score * weight for score, weight, _ in grades)
total_weight = sum(weight for _, weight, _ in grades)
average_grade = total / total_weight

Làm theo kiểu mở rộng tuples như thế này tương tự như làm cho các từ điển sâu hơn. Khi bạn thấy rằng bạn cần các tuples nhiều hơn hai phần tử, lúc đó bạn cần một cách giải quyết khác. 

Kiểu ```namedtuple``` trong module ```collections``` đáp ứng những gì bạn cần. Nó giúp bạn định nghĩa các lớp nhỏ và immutable. 

In [0]:
import collections
Grade = collections.namedtuple('Grade', ('score', 'weight'))

Các lớp này có thể được xây dựng với các tham số vị trí (positional) hay là từ khoá (keyword). Các trường trong ```namedtuple``` có thể được truy cập với các thuộc tính được đặt tên (named attributes). Có các thuộc tính được đặt trên làm cho việc chuyển từ một ```namedtuple``` sang lớp riêng của bạn trở nên dễ dàng hơn nếu các yêu cầu cứ thay đổi và bạn cần tránh dùng các đối tượng chứa đơn giản. 

### Các giới hạn của ```namedtuple```

Mặc dù ```namedtuple``` hữu dụng trong nhiều trường hợp, điều quan trạng là bạn cần hiểu khi nào ```namedtuple``` có thể gây hại cho bạn 


*   Bạn không thể chỉ định các giá trị mặc định cho tham số trong các lớp ```namedtuple```. Điều này làm cho chúng khó có thể linh động khi dữ liệu của bạn có thể có nhiều thuộc tính lựa chọn khác. Nếu bạn thấy mình sử dụng nhiều các thuộc tính, định nghĩa một lớp riêng có thể là một lựa chọn tốt hơn
*   Các giá trị thuộc tính của các hiện thực ```namedtuple``` cũng có thể truy cập sử dụng các chỉ số và lặp. Đặc biệt trong các APIs được thiết kế để sử dụng từ bên ngoài, điều này có thể tạo ra những việc sử dụng sai, dẫn tới việc chuyển sang lớp của bạn khó khăn hơn. Nếu bạn không nắm rõ tất cả việc sử dụng của các hiện thực ```namedtuple```, cách tốt hơn là định nghĩa các lớp của riêng bạn.



Tiếp theo, bạn có thể viết một lớp để biểu diễn một chủ thể đơn lẻ, chứa một tập hợp các điểm số

In [0]:
class Subject(object):
  def __init__(self):
    self._grades = []

  def report_grade(self, score, weight):
    self._grades.append(Grade(score, weight))

  def average_grade(self):
    total, total_weight = 0, 0
    for grade in self._grades:
      total += grade.score * grade.weight 
      total_weight += grade.weight 
    return total / total_weight 
    

Sau đó bạn viết một lớp để biểu diễn một tập hợp các môn một sinh viên được học.

In [0]:
import collections
Grade = collections.namedtuple('Grade', ('score', 'weight'))

In [0]:
class Student(object):
  def __init__(self):
    self._subjects = {}
  
  def subject(self, name):
    if name not in self._subjects:
      self._subjects[name] = Subject()
    return self._subjects[name]

  def average_grade(self):
    total, count = 0, 0
    for subject in self._subjects.values():
      total += subject.average_grade()
      count += 1
    return total / count

Cuối cùng, bạn viết một đối tượng chứa (container) cho tất cả các sinh viên với các chìa khoá được định nghĩa động bằng tên của họ.

In [0]:
class Gradebook(object):
  def __init__(self):
    self._students = {}

  def student(self, name):
    if name not in self._students:
      self._students[name] = Student()
    return self._students[name]


Lượng code ta viết nhiều gần như gấp đôi so với cách triển khai trước đó. Nhưng đoạn code mới này dễ đọc hơn. Ví dụ dưới đây cho ta thấy điều đó, code rõ ràng và có thể dễ dàng mở rộng.

In [0]:
book = Gradebook()

In [0]:
albert = book.student('Albert Einstein')
math = albert.subject('Math')
math.report_grade(80, 0.10)
print(albert.average_grade())

80.0


Nếu cần thiết, bạn có thể viết các phương thức tương thích với các phiên bản API cũ, để chuyển các API này sang các đối tượng lớp có phân tầng.

### Những điều cần nhớ


*   Tránh tạo ra các từ điển mà từ điển này chứa các giá trị là các từ điển hay các tuples dài khác. 
*   Sử dụng ```namedtuple``` cho các đối tượng chứa dữ liệu nhẹ và immutable trước khi bạn cần đến tính mềm dẻo của một lớp.
* Chuyển đoạn mã chịu trách nhiệm giữ các bản ghi thành các lớp trợ giúp khi các từ điển nội tại trong đó trở nên phức tạp. 



## Sử dụng các hàm với các giao tiếp đơn giản thay vì các lớp

Nhiều APIs có sẵn trong Python cho phép bạn tuỳ chỉnh cư xử bằng cách truyền vào một hàm. Các móc (hooks) này được sử dụng bởi APIs để gọi lại (call back) code của bạn khi chúng thực thi. Ví dụ, phương thức ```sort``` của kiểu danh sách chấp nhận một tham số ```key``` dưới dạng tuỳ chọn được sử dụng để xác định giá trị của chỉ số cho việc sắp xếp. Ở đây tôi sắp xếp một danh sách các tên dựa trên đội dài của nó thông qua một biểu diễn ```lambda``` như là móc ```key``` 


In [0]:
names = ["Socrates", "Archimedes", "Plato", "Aristotle"]
names.sort(key=lambda x: len(x))
print(names)

['Plato', 'Socrates', 'Aristotle', 'Archimedes']


Trong các ngôn ngữ, bạn có thể thấy các móc được định nghĩa bởi một lớp trừu tượng. Trong Python, nhiều móc chỉ là các hàm không trạng thái với các tham số và giá trị trả về được định nghĩa rất tốt. Các hàm là những đối tượng tốt cho các móc bởi vì chúng có thể được mô tả dễ dàng và dễ dàng được định nghĩa hơn các lớp. Các hàm hoạt động như là các móc bởi vì Python có các hàm ```first-class```: Các hàm và các phương thức có thể được truyền và nhận như bất cứ giá trị nào trong Python. 

Ví dụ, bạn muốn tuỳ chỉnh cư xử của lớp ```defaultdict```. Cấu trúc dữ liệu này cho phép bạn cung cấp một hàm sẽ được gọi mỗi lần một từ khoá không tồn tại được truy cập tới. Hàm này phải trả về giá trị mặc định mà chìa khoá bị khuyết này nên có trong từ điển. Ở đây tôi định nghĩa một móc ghi lại mỗi lần một chìa khoá bị khuyết và trả về ```0``` cho giá trị mặc định

In [0]:
def log_missing():
  print("Key added")
  return 0

Cho trước một từ điển ban đầu và một tập hợp các ...., tôi có thể làm cho hàm ```log_missing``` chạy và in ra (cho 'red' và 'orange')

In [0]:
from collections import defaultdict
current = {'green': 12, 'blue': 3}
increments = [
              ('red', 5), 
              ('blue', 17),
              ('orange', 9),
]
result = defaultdict(log_missing, current)
print('Before: ', dict(result))
for key, amount in increments:
  result[key] += amount 
print("After: ", dict(result))

Before:  {'green': 12, 'blue': 3, 'red': 4}
Key added
After:  {'green': 12, 'blue': 20, 'red': 9, 'orange': 9}


Cung cấp các hàm như ```log_missing``` làm cho các APIs dễ dàng xây dựng và kiểm tra bởi vì nó tách biệt các hiệu ứng phụ khỏi các hành vi xác định. Ví dụ, bạn muốn móc của giá trị mặc định được truyền vào hàm ```defaultdict``` để đếm tổng số lượng chìa khó bị thiếu. Có một cách để làm điều này đó là dùng một bộ đóng lưu trữ trạng thái (stateful closure). Ở đây, tôi định nghĩa một hàm trợ giúp sử dụng một bộ đóng như vậy như là móc giá trị mặc định.

In [0]:
def increment_with_report(current, increments):
  added_count = 0
  def missing():
    nonlocal added_count # bộ đóng lưu trữ trạng thái
    added_count += 1
    return 0
  result = defaultdict(missing, current)
  for key, amount in increments:
    result[key] += amount 
  return result, added_count 

Chạy hàm này cho ra kết quả mong đợi (2), mặc dù ```defaultdict``` không biết rằng móc ```missing``` duy trì trạng thái. Đây là một lợi thế khác của việc dùng các hàm bình thường cho các giao diện. Rất dễ để thêm tính năng sau này thông qua việc ẩn đi trạng thái trong một bộ đóng. 

In [0]:
result, count = increment_with_report(current, increments)
assert count == 1

Vấn đề với việc định nghĩa một bộ đóng (closure) cho các móc có trang thái đó là code khó đọc hơn các trường hợp hàm không trạng thái. Một cách tiếp cân khác là định nghĩa một lớp nhỏ bao trạng thái bạn muốn theo dõi

In [0]:
class CountMissing(object):
  def __init__(self):
    self.added = 0 

  def missing(self):
    self.added += 1 
    return 0

Trong các ngôn ngữ khác, bạn có thể mong đợi rằng ```defaultdict``` phải được thay đổi để chứa giao tiếp của ```CountMissing```. Trong trong Python, cảm ơn các hàm first-class, bạn có thể tham chiếu phương thức ```CountMissing.missing``` trực tiếp trên một đối tượng và truyền nó vào ```defaultdict``` như là một móc giá trị mặc định. Rất dễ để có được một phương thức thoả mãn giao diện hàm này.

In [0]:
from collections import defaultdict

current = {'green': 12, 'blue': 3}
increments = [
              ('red', 5), 
              ('blue', 17),
              ('orange', 9),
]
counter = CountMissing()
result = defaultdict(counter.missing, current) # Tham chiếu phương thức

for key, amount in increments:
  result[key] += amount 

assert counter.added == 2

Sử dụng một lớp trợ giúp như vậy cung cấp chức năng của một bộ đóng có trạng thái rõ ràng hơn hàm ```increment_with_report``` ở trên. Tuy nhiên khi đứng tách biệt, ta sẽ không biết được ngay mục đích của lớp ```CountMissing```. Ai tạo ra một đối tượng ```CountMissing```? Ai gọi phương thức ```missing```? Lớp này sẽ cần thêm vào các phương thức công cộng khác trong tương lai hay không? Chỉ đến khi bạn thấy nó được sử dụng với ```defaultdict``` bạn mới rõ. 

Để làm rõ mục đích của lớp này, Python cho phép các lớp định nghĩa phương thức đặc biệt gọi là ```__call__```. ```__call__``` cho phép một đối tượng được gọi như là một hàm. Nó cũng làm cho hàm có sẵn ```callable``` trả về ```True``` cho hiện thực như vậy.

In [0]:
class BetterCountMissing(object):
  def __init__(self):
    self.added = 0 

  def __call__(self):
    self.added += 1
    return 0
    

In [0]:
counter = BetterCountMissing()
counter()
assert callable(counter)

Ở đây, tôi sử dụng một hiện thưucj ```BetterCountMissing``` như là móc giá trị mặc định cho một ```defaultdict``` để theo dõi số lượng các khoá không tồn tại trước đó được thêm vào.

In [0]:
counter = BetterCountMissing()
result = defaultdict(counter, current) # Dựa trên __call__
for key, amount in increments:
  result[key] += amount 

assert counter.added == 2

Cách làm này rõ ràng hơn rất nhiều so với trường hợp ```CountMissing.missing```. Phương thức ```__call__``` chỉ ra rằng các hiện thực lớp sẽ được sử dụng ở đâu đó như là một tham số cho một hàm (giống như các móc API). Nó hướng những người mới đọc code của bạn tới điểm đầu vào (entry point) chịu trách nhiệm chính cho hành vi chính của lpws. Nó cung cấp một gợi ý mạnh mẽ rằng mục đích của lớp này là một bộ đóng có trạng thái. 

```defaultdict``` vẫn không biết điều gì xảy ra khi bạn gọi ```__call__```. Tất cả những gì ```defaultdict``` yêu cầu đó là một hàm dành cho móc giá trị mặc định. Python cung cấp nhiều cách để thoả mãn một giao tiếp hàm đơn giản phụ thuộc vào bạn cần hoàn thành những gì. 

### Những thứ cần nhớ. 


*   Thay vì định nghĩa và khởi tạo các lớp, các hàm thường được dùng cho các giao tiếp đơn giản giữa các thành phần trong Python
*   Các tham chiếu tới các hàm và các phương thức trong Python là first class, nghĩa là chúng có thể được sử dụng trong các biểu diễn (expressions) như bất cứ kiểu nào khác. 
* Phương thức đặc biệt ```__call__``` cho phép các hiện thực của một lớp được gọi như là các hàm thông thường. 
* Khi bạn cần một hàm duy trì trạng thái, xem xét giải pháp định nghĩa một lớp cung cấp phương thức ```__call__``` thay vì định nghĩa một bộ đóng trạng thái. 



## Sử dụng ```@classmethod``` đa hình để xây dựng các đối tượng chung 

Trong Python, không chỉ các đối tượng hỗ trợ đa hình, mà các lớp cũng hỗ trợ đa hình. Vậy đa hình là gì, nó tốt cho cái gì?

Đa hình là một cách để các lớp trong một hệ thống cấp bậc triển khai các phiên bản riêng của một phương thức. Điều này cho phép nhiều lớp thoả mãn cùng một giao tiếp hoặc một lớp cơ sở trừu tượng trong khi cung cấp cư xử khác nhau. 

Ví dụ, bạn đang viết một triển khai ```MapReduce``` và bạn muốn một lớp chung để biểu diễn dữ liệu đầu vào. Ở đây tôi định nghĩa một lớp như vậy với phương thức ```read```, phương thức phải được định nghĩa bởi các lớp con. 

In [0]:
class InputData(object):
  def read(self):
    raise NotImplementedError

Ở đây, tôi có một lớp con cụ thể của ```InputData``` đọc dữ liệu từ một file trên đĩa. 

In [0]:
class PathInputData(InputData):
  def __init__(self, path):
    super().__init__()
    self.path = path 

  def read(self):
    return open(self.path).read()

Bạn có thể có bất cứ số lượng các lớp con của ```InputData``` như ```PathInputData``` và mỗi lớp con có thể triển khai một giao tiếp chuẩn cho phương thức ```read``` để trả về các bytes dữ liệu để xử lý. Các lớp con của ```InputData``` có thể đọc từ mạc, giải nén dữ liệu một cách trong suốt, vân vân. 

Bạn có thể muốn một giao tiếp trừu tượng tương tự cho MapReduce worker để lấy dữ liệu đầu vào theo một cách chuẩn. 

In [0]:
class Worker(object):
  def __init__(self, input_data):
    self.input_data = input_data 
    self.result = None 

  def map(self):
    raise NotImplementedError

  def reduce(self, other):
    raise NotImplementedError
    

Ở đây, tôi định nghĩa một lớp con cụ thể của ```Worker``` để triển khai một hàm MapReduce cụ thể bạn muốn áp dụng: một bộ đếm dòng mới đơn giản. 

In [0]:
class LineCountWorker(Worker):
  def map(self):
    data = self.input_data.read()
    self.result = data.count("\n")

  def reduce(self, other):
    self.result += other.result

Cách triển khai trên dường như tốt, nhưng có một khó khăn đó là tìm ra cái kết nối tất cả các mảnh trên. Tôi có một tập hợp các lớp với các giao tiếp và trừu tượng tốt - nhưng chúng chỉ hữu dụng khi các đối tượng được xây dựng. Cái gì chịu trách nhiệm cho việc xây dựng các đối tượng và kết nối MapReduce?

Cách đơn giản nhất là xây dựng và kết nối các đối tượng với một số hợp trợ giúp một cách thủ công. Ở đây, tôi liệt kê các nội dung của một thư mục và xây dựng một hiện thực ```PathInputData``` cho mỗi file trong nó:

In [0]:
import os
def generate_inputs(data_dir):
  for name in os.listdir(data_dir):
    yield PathInputData(os.path.join(data_dir, name))

Tiếp theo, tôi tạo các hiện thực ```LineCountWorker``` sử dụng các hiện thực ```InputData``` được trả về bởi ```generate_inputs```.

In [0]:
def create_workers(input_list):
  workers = []
  for input_data in input_list:
    workers.append(LineCountWorker(input_data))
  return workers  

Tôi thực hiện các hiện thực 

## Khởi tạo các lớp cha với ```super``` 

Cách cũ để khởi tạo một lớp cha từ một lớp con đó là gọi trực tiếp phương thức ```__init__``` của lớp cho với hiện thực lớp con

In [0]:
class MyBaseClass(object):
  def __init__(self, value):
    self.value = value 

class MyChildClass(MyBaseClass):
  def __init__(self):
    MyBaseClass.__init__(self, 5)

Cách thức này hoạt động tốt cho các phân cấp đơn giản nhưng sẽ không hoạt động trong nhiều trường hợp. 

Nếu lớp của bạn bị ảnh hưởng bởi nhiều thừa kế, gọi các phương thức ```__init__``` của các lớp cha có thể dẫn tới những hành vì không thể dự đoán được. 

Một vấn đề đó là thứ tự lời gọi ```__init__``` không được chỉ định đối với tất cả các lớp con. Ví dụ, ở đây tôi định nghĩa hai lớp cha hoạt động trên phương thức ```value``` của các hiện thực. 

In [0]:
class TimesTwo(object):
  def __init__(self):
    self.value *= 2

class PlusFive(object):
  def __init__(self):
    self.value += 5 

Lớp này định nghĩa các lớp cha theo thứ tự như dưới đây

In [0]:
class OneWay(MyBaseClass, TimesTwo, PlusFive):
  def __init__(self, value):
    MyBaseClass.__init__(self, value)
    TimesTwo.__init__(self)
    PlusFive.__init__(self)

Xây dựng lớp trên dẫn tới việc khởi tạo giá trị theo thứ tự sau. 

In [0]:
foo = OneWay(5)
print("First ordering is (5 * 2) + 5", foo.value)

First ordering is (5 * 2) + 5 15


Ta có thêm một lớp khác với cùng các lớp cha nhưng thứ tự khác đi

In [0]:
class AnotherWay(MyBaseClass, PlusFive, TimesTwo):
  def __init__(self, value):
    MyBaseClass.__init__(self, value)
    TimesTwo.__init__(self)
    PlusFive.__init__(self)

Tuy nhiên trong hàm khởi tạo tôi vẫn để thứ tự các lời gọi như trước, lần này thì thứ tự trong danh sách các tham số không giống với thứ tự chúng được gọi trong hàm ```__init__```

In [0]:
bar = AnotherWay(5)
print('Second ordering still is', bar.value)

Second ordering still is 15


Một vấn đề khác đó là thừa hưởng kim cương (diamond inheritance). Thừa hưởng kim cương xảy ra khi một lớp con thừa hưởng từ hai lớp riêng biệt nhưng có cùng một lớp cha ở đâu đó trong phân tầng. Thừa hưởng kim cương làm cho phương thức ```__init__``` của các lớp cha chạy nhiều lần, tạo ra hành vi không như mong đợi. Ví dụ, ở đây tôi định nghĩa các lớp con thừa hưởng từ ```MyBaseClass```.

In [0]:
class TimesFive(MyBaseClass):
  def __init__(self, value):
    MyBaseClass.__init__(self, value)
    self.value *= 5

class PlusTwo(MyBaseClass):
  def __init__(self, value):
    MyBaseClass.__init__(self, value)
    self.value += 2

Sau đó tôi định nghĩa một lớp thừa hưởng từ cả hai lớp này, việc này làm cho ```MyBaseClass``` trở thành đỉnh của viên kim cương

In [0]:
class ThisWay(TimesFive, PlusTwo):
  def __init__(self, value):
    TimesFive.__init__(self, value)
    PlusTwo.__init__(self, value)

In [0]:
foo = ThisWay(5)
print("Should be (5 * 5) + 2 = 27 but is", foo.value)

Should be (5 * 5) + 2 = 27 but is 7


Kết quả nên là 27 bởi vì ```(5*5) + 2 = 27```. Nhưng lời gọi tới phương thức ```__init__``` của ```PlusTwo``` khiến cho ```self.value``` được gán trở lại 5 khi ```MyBaseClass.__init__``` được gọi lần thứ hai. 

Để giải quyết vấn đề này, Python 2.2 thêm vào hàm có sẵn ```super``` và định nghĩa thứ tự phân giải phương thức (method resolution order (MRO)). MRO chuẩn hoá thứ tự các lớp cha được khởi tạo (ví dụ độ sâu đầu tiên, từ trái sang phải). Nó cũng đảm bảo rằng các lớp cha phổ biến trong các phân tầng viên kim cương chỉ được chạy một lần. 

Ở đây, tôi tạo một phân tầng lớp hình dạng kim cương, nhưng lần này tôi sử dụng ```super``` (viết theo kiểu Python 2) để khởi tạo lớp cha.

In [0]:
class TimesFiveCorrect(MyBaseClass):
  def __init__(self, value):
    super(TimesFiveCorrect, self).__init__(value)
    self.value *= 5 

class PlusTwoCorrect(MyBaseClass):
  def __init__(self, value):
    super(PlusTwoCorrect, self).__init__(value)
    self.value += 2

Bây giờ trên điển của viên kim cương, ```MyBaseClass.__init__``` chỉ chạy một lần. Các lớp cha khác được chạy theo thứ tự trong câu lệnh ```class```.

In [0]:
class GoodWay(TimesFiveCorrect, PlusTwoCorrect):
  def __init__(self, value):
    super(GoodWay, self).__init__(value)

foo = GoodWay(5)
print("Should be 5 * (5 + 2) = 35 and is", foo.value)


Should be 5 * (5 + 2) = 35 and is 35


Thứ tự tính toán dường như thực hiện theo chiều từ dưới lên. Ta đặt câu hỏi là tại sao ```TimesFiveCorrect.__init__``` không chạy trước, như vậy thì kết quả sẽ ra ```(5 * 5) + 2 = 27``` ?
Kết quả là không phải như vậy. Thứ tự này khớp với những gì MRO định nghĩa cho lớp này. Thứ tự MRO có thể thấy sử dụng phương thức ```mro```

In [0]:
from pprint import pprint 
pprint(GoodWay.mro())

[<class '__main__.GoodWay'>,
 <class '__main__.TimesFiveCorrect'>,
 <class '__main__.PlusTwoCorrect'>,
 <class '__main__.MyBaseClass'>,
 <class 'object'>]


Khi bạn gọi ```GoodWay(5)```, theo thứ tự nó gọi ```TimesFiveCorrect.__init__```, phương thức này gọi ```PlusTwoCorrect.__init__```, phương thức này lại gọi ```MyBaseClass.__init__```. Mỗi khi nó đạt tới đỉnh của viên kim cương, khi đó tất cả các phương thức khởi tạo thực hiện công việc của mình theo thứ tự ngược lại bắt đầu với việc ```MyBaseClass.__init__``` gán ```value``` cho 5. ````PlusTwoCorrect.__init__``` cộng thêm 2 để làm cho ```value``` bằng 7. ```TimesFiveCorrect.__init__``` nhân nó với 5 làm cho ```value``` bằng 35. 

Hàm ```super``` thực hiện điều này tốt, nhưng vẫn còn có hai vấn đề có thể thấy trong Python 2:


*   Cú pháp của nó vẫn rườm rà. Bản phải chỉ định lớp hiện tại, đối tượng ```self```, tên phương thức (thường là ```__init__```), và tất cả các tham số. Việc có quá nhiều thứ như vậy có thể gây ra nhầm lần cho các lập trình viên Python mới. 
*   Bạn phải chỉ định lớp hiện hành bằng tên trong lời gọi tới ```super```. Nếu bạn thay đổi tên của lớp này - đây là một hành động khá phổ biến khi cải tiến một phân tầng của một lớp - bạn cần phải cập nhật lại mọi lời gọi tới ```super```



Trong Python 3, các vấn đề trên được giải quyết, bạn có thể gọi ``super``` mà không cần phải chỉ định các trường như trên. Và bạn nên luôn luôn sử dụng ```super``` bởi vì nó rõ ràng, chính xác, và luôn luôn làm đúng công việc.

In [0]:
class Explicit(MyBaseClass):
  def __init__(self, value):
    super(__class__, self).__init__(value * 2)

class Implicit(MyBaseClass):
  def __init__(self, value):
    super().__init__(value * 2)

assert Explicit(10).value == Implicit(10).value

Cách này hoạt động bởi vì Python 3 cho phép bạn tham chiếu tới lớp hiện hành trong các phương thức sử dụng biến ```__class__```. Trong Python 2 thì không được bởi vì ```__class__``` không được định nghĩa. Bạn có thể đoán rằng bạn có thể dùng ```self.__class__``` như là một tham số cho ```super```, nhưng nó không chạy bởi vì cách ```super``` được triển khai trong Python 2. 

### Những điều cần nhớ


*   Thứ tự phân giải phương thức chuẩn của Python (MRO) giải quyết vấn đề về thừa hưởng kim cương và thứ tự khởi tạo các lớp cha. 
*   Luôn luôn sử dụng hàm có sẵn ```super``` để khởi tạo các lớp cha. 



## Sử dụng đa thừa kế chỉ với các lớp đa tiện ích 

Python là một ngôn ngữ huonwgs đối tượng với các công cụ giúp điều khiển đa thừa hưởng dễ dàng. Tuy nhiên, tốt hơn là tránh đa thừa hưởng. 

Nếu bạn muốn viết một lớp sử dụng đa thừa hưởng, bạn có thể xem xét sử dụng một lớp trộn ```mix-in```. Một lớp trộn là một lớp nhỏ chỉ định nghĩa một tập hợp các phương thức bổ sung mà một lớp nên cung cấp. Các lớp trộn không định nghĩa các thuộc tính hiện thực riêng của chúng, cũng không yêu cầu gọi phương thức xây dựng ```__init__```. 

Viết một lớp trộn thật dễ dàng bởi vì Python cho phép lấy ra thông tin về trạng thái hiện hành của bất cứ đối tượng nào dẫu cho kiểu của nó là gì. Việc quan sát các đối tượng một cách động này cho viết bạn viết tính năng chung chỉ một lần trong lớp trộn, mà có thể được áp dụng cho nhiều lớp khác. Các lớp trộn có thể được tổng hợp và sắp xếp để giảm thiểu các mã lặp lại và tối đa hoá việc sử dụng lại code. 

Ví dụ, bạn muốn chuyển một đối tượng Python từ biểu diễn trong bộ nhớ của nó sang một từ điển, để cho việc tuần tự hoá (serialization). Tại sao không viết tính năng này một cách tổng quát vì thế bạn có thể sử dụng nó với tất cả các lớp của bạn. 

Ở đây tôi định nghĩa một ví dụ của lớp trộn để hoàn thành công việc này với một lớp công cộng mới được thêm vào cho bất cứ lớp nào thừa hưởng từ nó

In [0]:
class ToDictMixin(object):
  def to_dict(self):
    return self._traverse_dict(self.__dict__)

Các chi tiết triển khai thật rõ ràng và dựa trên việc truy cập thuộc tính động sử dụng ```hasattr```, phương thức cho phép lấy thông tin kiểu động ```isinstance```, và truy cập vào tử điển của đối tượng ```__dict__```. 

In [0]:
def _traverse_dict(self, instance_dict):
  output = {}
  for key, value in instance_dict.items():
    output[key] = self._traverse(key, value)
  return output 

def _traverse(self, key, value):
  if isinstance(value, ToDictMixin):
    return value.to_dict()
  elif isinstance(value, dict):
    return self._traverse_dict(value)
  elif isinstance(value, list):
    return [self._traverse(key, i) for i in value]
  elif hasattr(value, '__dict__'):
    return self._traverse_dict(value.__dict__)
  else:
    return value  

Ở đây tôi định nghĩa một lớp ví dụ sử dụng lớp trộn để tạo ra một biểu diễn từ điển của một cây nhị phân:

In [0]:
class BinaryTree(ToDictMixin):
  def __init__(self, value, left=None, right=None):
    self.value = value 
    self.left = left 
    self.right = right 

Chuyển một số lượng lớn các đối tượng Python liên quan thành một từ điển trở nên dễ dàng

In [0]:
tree = BinaryTree(10, left=BinaryTree(7, right=BinaryTree(9)), right=BinaryTree(13, left=BinaryTree(11)))
print(tree.to_dict())

AttributeError: ignored

Với lớp trộn bạn có thể tạo ra các tính năng có thể được gắn vào thêm (pluggable) vì vậy các cư xử có thể được ghi đè khi được yêu cầu. Ví dụ ở đây tôi định nghĩa một lớp con của ```BinaryTree``` giữa một tham chiếu cha của nó. Tham chiếu vòng như vậy có thể làm triển khai mặc định của ```ToDictMixin.to_dict``` lặp vô hạn. 

In [0]:
class BinaryTreeWithParent(BinaryTree):
  def __init__(self, value, left=None, right=None, parent=None):
    super().__init__(value, left=left, right=right)
    self.parent = parent 

Giải pháp ở đây là ghi đè phương thức ```ToDictMixin._traverse``` trong lớp ```BinaryTreeWithParent``` để chỉ xử lý các giá trị cần thiết, ngăn các vòng tròn lặp lại xảy ra bởi lớp trộn. Ở đây, tôi ghi đè phương thức ```_traverse``` để đi qua lớp cha và chèn giá trị số của nó vào. 

In [0]:
def _traverse(self, key, value):
  if (isinstance(value, BinaryTreeWithParent) and key == 'parent'):
    return value.value # Ngăn các vòng tròn 
  else:
    return super()._traverse(key, value)

Gọi ```BinaryTreeWithParent.to_dict``` sẽ hoạt động mà không gặp vấn đề về tham chiếu tròn.

In [0]:
root = BinaryTreeWithParent(10)
root.left = BinaryTreeWithParent(7, parent=root)
root.left.right = BinaryTreeWithParent(9, parent=root.left)
print(root.to_dict())

AttributeError: ignored

Các lớp trộn có thể được kết hợp cùng nhau. Ví dụ bạn muốn một lớp trộn cung cấp sắp xếp tuần tự cho bất cứ lớp nào. Bạn có thể làm điều này bằng cách giả định rằng một lớp cung cấp phương thức ```to_dict``` (phương thức có thể hoặc không thể được cung cấp bởi lớp ```ToDictMixin```)

In [0]:
class JsonMixin(object):
  @classmethod
  def from_json(cls, data):
    kwargs = json.loads(data)
    return cls(**kwargs)

  def to_json(self):
    return json.dums(self.to_dict())

Chú ý cách lớp ```JsonMixin``` định nghĩa các phương thức của đối tượng và các phương thức lớp. Các lớp trộn cho phép bạn thêm vào kiểu hành vi. Trong ví dụ này, các yêu cầu duy nhất của ```JsonMixin``` là lớp này có phương thức ```to_dict``` và phương thức ```__init__``` nhận vào các tham số từ khoá. 

Lớp trộn này làm cho việc tạo các phân tầng của các lớp tiện ích có thể được tuần tự hoá tới và từ Json với một ít bản mẫu. Ví dụ, ở đây tôi có một phân tầng các lớp dữ liệu biểu diễn các phần của một mô hình trung tâm dữ liệu

In [0]:
class DatacenterRack(ToDictMixin, JsonMixin):
  def __init__(self, switch=None, machines=None):
    self.switch = Switch(**switch)
    self.machies = [
                    Machine(**kwargs) for kwargs in machines
    ]

class Switch(ToDictMixin, JsonMixin):
  #
  pass

class Machine(ToDictMixin, JsonMixin):
  pass

Tuần tự hoá các lớp nà đến và từ JSON thì đơn giản. Ở đây, tôi kiểm tra xem dữ liệu có thể gửi tới và về (roundtrip) thông qua việc tuần tự hoá và nghịch tuần tự hoá (deserializing):

In [0]:
import json
serialized = """
{"switch": {"ports": 5, "speed": 1e9}, "machines": [{"cores": 8, "ram":32e9, "disk": 5e12}, 
{"cores": 4, "ram": 1629, "disk": 1e12},
{"cores": 2, "ram": 4e9, "disk": 500e9}
]
"""
deserialized = DatacenterRack.from_json(serialized)
roundtrip = deserialized.to_json()
assert json.loads(serialized) == json.loads(roundtrip)

JSONDecodeError: ignored

Khi bạn sử dụng các lớp trộn như vậy, lớp trộn đã thừa hưởng từ ```JsonMixin``` đi lên cao trong phân tầng đối tượng. Lớp kết quả sẽ cư xử theo cùng một cách. 

### Những thứ cần nhớ


*   Tránh sử dụng đa thừa kế nếu các lớp trộn có thể làm điều tương tự
*   Sử dụng các hành vi có thể được gắn vào thêm tại cấp độ đối tượng để cung cấp tuỳ chỉnh cho từng lớp khi các lớp trộn có thể yêu cầu nó.
* Sắp xếp các lớp trộn để tạo ra các tính năng phức tạp từ các hành vi đơn giản. 



## Nên sử dụng các thuộc tính công cộng thay vì các thuộc tính riêng tư

Trong Python có hai kiểu thuộc tính được sử dụng cho thuộc tính của lớp: công cộng (public) và riêng tư (private)

In [0]:
class MyObject(object):
  def __init__(self):
    self.public_field = 5 
    self.__private_field = 10 

  def get_private_field(self):
    return self.__private_field

Các thuộc tính công cộng có thể được truy cập bởi bất cứ ai

In [0]:
foo = MyObject()
assert foo.public_field == 5 
foo.__private_field

AttributeError: ignored

Các trường riêng tư được chỉ định bởi hai dấu gạch chân phía trước. Chúng có thể truy cập trực tiếp bởi cách phương thức của cùng lớp đó. 

In [0]:
assert foo.get_private_field() == 10 

Truy cập trực tiếp tới các lớp riêng tư từ bên ngoài có thể tạo ra một ngoại lệ.

In [0]:
foo.__private_field__

SyntaxError: ignored

Các phương thức của lớp cũng có thể truy cập tới các thuọc tính riêng tư bởi vì chúng được khai biết bên trong khối ```class```

In [0]:
class MyOtherObject(object):
  def __init__(self):
    self.__private_field = 71 

  @classmethod
  def get_private_field_of_instance(cls, instance):
    return instance.__private_field

In [0]:
bar = MyOtherObject()
assert MyOtherObject.get_private_field_of_instance(bar) == 71

Với các trường riêng tư, một lớp con không thể truy cập vào các trường riêng tư của lớp cha của nó

In [0]:
class MyParentObject(object):
  def __init__(self):
    self.__private_field = 71

In [0]:
class MyChildObject(MyParentObject):
  def get_private_field(self):
    return self.__private_field

In [0]:
baz = MyChildObject()
baz.get_private_field()

AttributeError: ignored

Thuộc tính riêng tư được triển khai với một biểu diễn đơn giản của tên thuộc tính. Khi Python compiler nhìn thấy một truy cập thuộc tính trong các phương thức như ```MyChildObject.get_private_field```, nó dịch ```___private_field``` sang truy cập ```_MyChildObject__private_field```. Trong ví dụ này, ```__private_field``` chỉ được định nghĩa trong ```MyParentObject.__init__```, nghĩa là các tên thực của thuộc tính là ```_MyParentObject__private_field```. Truy cập thuộc tính riêng tư của lớp cha từ lớp con thất bại là bởi vì tên thuộc tính được chuyển đổi không khớp. 

Biết được cơ chế này, bạn có thể dễ dàng truy cập các thuộc tính riêng tư của bất cứ lớp nào từ một lớp con hoặc từ bên ngoài, mà không cần phải yêu cầu quyền hạn. 

In [0]:
assert baz._MyParentObject__private_field == 71

Nếu bạn nhìn vào từ điển thuộc tính của đối tượng bạn sẽ thấy các thuộc tính riêng tư thực sự với các tên như là chúng xuất hiện sau khi chuyển đổi.

In [0]:
print(baz.__dict__)

{'_MyParentObject__private_field': 71}


In [0]:
class MyFirstChildObject(MyParentObject):
  def __init__(self):
    self.name = "Henry"
  def get_private_field(self):
    return self.__private_field

In [0]:
MyFirstChildObject().__dict__

{'name': 'Henry'}

In [0]:
baz = MyFirstChildObject()
baz.__dict__

{'name': 'Henry'}

Tại sao cú pháp cho các thuộc tính riêng tư như này lại không thực sự được áp đặt một cách dễ nhìn? Câu trả lời đơn giản nhất đó là câu khẩu hiệu của Python: "Chúng ta đang cho phép người lớn ở đây" (We are all consenting adults here). Lập trình viên Python tin rằng lợi ích của việc mở tốt hơn nhiều so với những giới hạn của việc đóng. 

Ngoài ra, có được khả năng móc các thuộc tính ngôn ngữ như truy cập thuộc tính cho phép bạn tìm hiểu các chi tiết bên trong của các đối tượng bất cứ khi nào bạn muốn. Nếu bạn có thể làm như vậy thì câu hỏi là việc ngăn các truy cập thuộc tính riêng tư đem lại giá trị gì. 

Để làm giảm thiểu các thương tổn từ việc truy cập các chi tiết bên trong một cách lặng lẽ, các lập trình viên Python tuân theo một chuẩn được định nghĩa trong PEP 8. Các trường có một dấu gạch chân ở đầu (giống như ```_protected_field```) được bảo vệ (protected), nghĩa là các người dùng bên ngoài của lớp này nên thực hiện nó thận trọng. 

Tuy nhiên nhiều lập trình viên mới sử dụng các trường riêng tư để ám chỉ một API nội tại, không nên được truy cập bởi các lớp con hoặc bên ngoài.

In [0]:
class MyClass(object):
  def __init__(self, value):
    self.__value = value 

  def get_value(self):
    return str(self.__value)

foo = MyClass(5)
assert foo.get_value() == '5'

Đây là một cách tiếp cận sai. Chắc chắn là một ai đó, bao gồm cả bạn, sẽ muốn tạo ra các lớp con để thêm vào các tính năng mới hay giải quyết các vấn đề tồn đọng trong các phương thức hiện hành (ví dụ như cách ```MyClass.get_value``` luôn luôn trả về một chuỗi). Thông qua việc chọn các thuộc tính riêng tư, bạn chỉ đang tạo ra các lớp con ghi đè lên lớp cha và các phần mở rộng cồng kềnh và dễ vỡ. Các lớp con tiềm năng của bạn sẽ vẫn truy cập tới các trường riêng tư khi chúng cần phải làm như vậy. 

In [0]:
class MyIntegerSubclass(MyClass):
  def get_value(self):
    return int(self._MyClass__value)



In [0]:
foo = MyIntegerSubclass(5)
assert foo.get_value() == 5

Nhưng nếu lớp dưới phân cấp thay đổi, các lớp này sẽ phá vỡ bởi vì các tham chiếu riêng tư không còn hợp lệ nữa. Ở đây lớp cha gần nhất của ```MyIntegerSubclass```, ```MyClass```, có một lớp cha khác được thêm vào gọi là ```MyBaseClass``` 

In [0]:
class MyBaseClass(object):
  def __init__(self, value):
    self.__value = value 

class MyClass(MyBaseClass):
  # ...

class MyIntegerSubclass(MyClass):
  def get_value(self):
    return int(self._MyClass__value)

Thuộc tính ```__value``` được gán trong lớp cha ```MyBaseClass```, không phải lớp cha ```MyClass```. 
Điều này làm cho tham chiếu thuộc tính riêng tư ```self._MyClass__value``` phá vỡ ```MyIntegerSubclass```. 

In [0]:
foo = MyIntegerSubclass(5)
foo.get_value()

Nói chung, tốt hơn là nếu có lỗi thì hãy là lỗi ở các lớp con được cho phép sử dụng các thuộc tính được bảo vệ. Ghi chú mỗi trường được bảo về và giải thích các APIs nội bộ nào có sẵn và các APIs nào nên được được để một mình. Đây là những lời khuyên cho các lập trình viên khác và cũng như là hướng dẫn cho chính bạn để sau này mở rộng code của bạn. 

In [0]:
class MyClass(object):
  def __init__(self, value):
    #Lưu giá trị được cung cấp bởi người dùng cho đối tượng.
    # Nó nên là một chuỗi khi được gán.
    # Đối tượng nên được xử lý như là immutable
    self._value = value
 

Bạn chỉ xem xét sử dụng các thuộc tính riêng tư khi bạn lo lắng về việc xung đột tên với các lớp con. Vấn đề này xảy ra khi một lớp con vô tình định nghĩa một thuộc tính đã được định nghĩa ở lớp cha

In [0]:
class ApiClass(object):
  def __init__(self):
    self._value = 5 
  
  def get(self):
    return self._value 



In [0]:
class Child(ApiClass):
  def __init__(self):
    super().__init__()
    self._value = 'hello' # Xung đột tên

In [0]:
a = Child()
print(a.get(), 'and', a._value, 'should be different')

hello and hello should be different


Đây là một vấn đề chính với các lớp là một phần của một API công cộng, các lớp con vượt ra ngoài tầm kiểm soát, vì thế bạn không thể cấu trúc lại code để giải quyết vấn đề. 

Conflict như vậy thường xảy ra với các tên thuộc tính phổ biến (ví dụ như ```value```). Để giảm rủi ro của vấn đề này, bạn có thể sử dụng một thuộc tính riêng tư ở lớp cha để đảm bảo rằng không có tên thuộc tính nào chồng lấn với các lớp con.

In [0]:
class ApiClass(object):
  def __init__(self):
    self.__value = 5

  def get(self):
    return self.__value 

In [0]:
class Child(ApiClass):
  def __init__(self):
    super().__init__()
    self._value = 'hello' # OK!

In [0]:
a = Child()
print(a.get(), 'and', a._value, 'are different')

5 and hello are different


### Những điều cần nhớ


*   Các thuộc tính riêng tư không được thi hành một cách cẩn thận bởi Python compiler.
*   Có kế hoạch từ lúc đầu cho phép các lớp con làm nhiều thứ hơn với các APIs nội tại và các thuộc tính thay vì khoá chính một cách mặc định
* Sử dụng tài liệu của các trường được bảo vệ để hướng dẫn các lớp con thay vì cố gắng tạo ra các điều khiển truy nhập tới các thuộc tính riêng tư.
* Chỉ xem xét sử dụng các thuộc tính riêng tư để tránh việc xung đột tên với các lớp con, nơi bạn không có quyền điều khiển.



## Thừa hưởng từ ```collections.abc``` cho các kiểu chứa tuỳ chỉnh 

Đa số việc lập trình trong Python là định nghĩa các lớp chứa dữ liệu và mô tả cách các đối tượng như vậy liên quan lẫn nhau. Mỗi lớp Python là một đối tượng chứa của một vài kiểu khác, đóng gói các thuộc tính và tính năng cùng với nhau. Python cũng cung cấp các kiểu chứa có sẵn cho việc quản lý dữ liệu: các danh sách, tuples, các sets và các từ điển. 

Khi bạn đang thiết kế các lớp để sử dụng cho tác vụ đơn giản như chuỗi (sequences), sẽ là bình thường nếu bạn muốn tạo một lớp con của kiểu ```list``` trực tiếp. Ví dụ, bạn muốn tạo một kiểu danh sách tuỳ chỉnh có thêm các phương thức cho việc đếm tần số của các thành viên. 

In [0]:
class FrequencyList(list):
  def __init__(self, members):
    super().__init__(members)

  def frequency(self):
    counts = {}
    for item in self:
      counts.setdefault(item, 0)
      counts[item] += 1
    return counts 

Qua việc tạo lớp con của ```list```, bạn có được tất cả các tính năng chuẩn của nó và duy trì được ngữ nghĩa quen thuộc với tất cả các lập trình viên Python. Các phương thức bổ sung khác của bạn có thể thêm bất cứ cư xử tuỳ chỉnh nào bạn cần 

In [0]:
foo = FrequencyList(['a', 'b', 'a', 'c', 'b', 'a', 'd'])

In [0]:
print('Length is ', len(foo))
foo.pop()
print('After pop: ', repr(foo))
print('Frequency:', foo.frequency())

Length is  7
After pop:  ['a', 'b', 'a', 'c', 'b', 'a']
Frequency: {'a': 3, 'b': 2, 'c': 1}


Nào bây giờ tưởng tượng bạn muốn cung cấp một đối tượng, cảm giác giống như một danh sách, cho phép dùng các chỉ số, nhưng không phải là một lớp con của một danh sách. Ví dụ, bạn muốn cung cấp các ngữ nghĩa tuần tự (sequence semantics) như là danh sách hay tuple cho một lớp cây nhị phân

In [0]:
class BinaryNode(object):
  def __init__(self, value, left=None, right=None):
    self.value = value
    self.left = left
    self.right = right 

Làm thế nào bạn tạo ra một kiểu liên tục (sequence) như vậy? Python triển khai các hành vi bộ chứa của nó với các phương thức của đối tượng có các tên đặc biệt. Khi bạn muốn truy cập vào một sequence thông qua chỉ số

In [0]:
bar = [1, 2, 3]
bar[0]

1

thực chất nó sẽ gọi ```__getitem__``` trên đối tượng ```bar```

In [0]:
bar.__getitem__(0)

1

Để làm cho lớp ```BinaryNode``` hoạt động như là một sequence, bạn có thể cung cấp một triển khai tuỳ chỉnh của ```__getitem__``` thực hiện việc duyệt qua cây đối tượng theo chiều sâu.

In [0]:
class IndexableNode(BinaryNode):
  def _search(self, count, index):
    #
    pass

  def __getitem__(self, index):
    found, _ = self._search(0, index)
    if not found:
      raise IndexError('Index out of range')
    return found.value 

Bạn có thể xây dựng cây nhị phân như bình thường

In [0]:
tree = IndexableNode(10, left=IndexableNode(5, left=IndexableNode(2), right=IndexableNode(6, right=IndexableNode(7))), right=IndexableNode(15, left=IndexableNode(11)))

Nhưng bạn vẫn có thể truy cập tới nó như là một danh sách ngoài việc duyệt cây

In [0]:
print('LRR = ', tree.left.right.right.value)
print('Index 0=', tree[0])
print('Index 1 = ', tree[1])
print('11 in the tree?', 11 in tree)
print('17 in the tree?', 17 in tree)
print('Tree is', list(tree))

LRR =  7


TypeError: ignored

Vấn đề là triển khai ```__getitem__``` không đủ để cung cấp tất cả các ngữ nghĩa sequence như mong đợi.

In [0]:
len(tree)

TypeError: ignored

Hàm có sẵn ```len``` yêu cầu một phương thức đặc biệt khác có tên là ```__len__```, ta phải thực hiện phương thức này cho kiểu tuỳ chỉnh

In [0]:
class SequenceNode(IndexableNode):
  def __len__(self):
    _, count = self._search(0, None)
    return count

Rủi thay, những điều trên chưa đủ. Các phương thức ```count``` và ```index``` là những phương thức mà một lập trình viên Python mong đợi từ danh sách hay tuple. Định nghĩa các kiểu chứa riêng khó hơn rất nhiều.

Để tránh khó khăn này, module ```collections.abc``` định nghĩa một tập hợp các lớp trừu tượng cung cấp các hàm tiêu biểu cho mỗi kiểu chứa. Khi bạn tạo một lớp con từ các lớp trừu tượng này và quên cách triển khai các phương thức yêu câu, module này sẽ nói cho bạn những thứ nào sai

In [0]:
from collections.abc import Sequence

In [0]:
class BadType(Sequence):
  pass

In [0]:
foo = BadType()

TypeError: ignored

Khi bạn triển khai tất cả các phương thức được yêu cầu bởi một lớp cơ sở trừu tượng, như bạn làm với ```SequenceNode``` ở trên, nó sẽ cung cấp tất cả các phương thức bổ sung như ```index``` và ```count``` miễn phí.

In [0]:
class BetterNode(SequenceNode, Sequence):
  pass

tree = BetterNode()

print('Index of 7 is', tree.index(7))
print('Index of 10 is ', tree.count(10))

TypeError: ignored

Lợi thế của việc sử dụng các lớp cơ sở trừu tượng sẽ còn lớn hơn đối với các kiểu phức tạp như ```Set``` và ```MutableMapping```, các lớp có số lượng nhiều các phương thức đặc biệt cần được triển khai để khớp với các quy định của Python.

### Những thứ cần nhớ


*   Thừa kế trực tiếp từ các kiểu chứa của Python (như là danh sách hoặc từ điển) cho các trường hợp đơn giản.
*   Nhận thức rằng số lượng lớn các phương thức yêu cầu triển khai các kiểu chứa chính xác.
* Có các kiểu chứa tuỳ chỉnh thừa hưởng từ các giao tiếp được định nghĩa trong ```collections.abc``` để đảm bảo rằng các lớp của bạn khới với các giao diện và hành vi yêu cầu. 



## Metaclasses và các thuộc tính
Metaclasses thường được nhắc tới trong các đặc tính của Python, nhưng chỉ một vài trong chúng ta hiểu được tác dụng của chúng trong thực tế. Từ ```metaclass``` ám chỉ một cách mơ hồ một khái niệm phía trên và bên ngoài một lớp. Các metaclasses cho phép bạn chặn câu lệnh ```class``` và cung cấp cư xử đặc biệt mỗi lần một lớp được định nghĩa. 

Tương tự như vậy các đặc tính có sẵn của Python cho việc tuỳ chỉnh truy nhập thuộc tính rất mạnh mẽ và bí ẩn. Đi cùng với các xây dựng hướng đối tượng của Python, các công cụ này giúp cho việc chuyển đổi các lớp đơn giản sang các lớp phức tạp dễ dàng hơn. 

Tuy nhiên các tính năng này cũng có những khó khăn tiềm ẩn. Các thuộc tính động làm cho bạn ghi đè các đối tượng và tạo ra các hiệu ứng phụ không như mong đợi. Các metaclasses có thể tạo ra các cư xử lạ lùng và không thức hợp cho người mới bước chân sử dụng Python. Điều quan trọng là bạn tuân theo *luật của sự ít ngạc nhiên nhất* (rule of least surprise) và chỉ sử dụng các cơ chế này để triển khai các thành ngữ dễ hiểu. 

## Sử dụng các thuộc tính thay vì các phương thức Get và Set 

Các lập trình viên từ các ngôn ngữ khác có thể cố gắng triển khai các phương thức thiết lập (setter) và lấy thông tin (getter) trong các lớp của họ

In [0]:
class OldResistor(object):
  def __init__(self, ohms):
    self._ohms = ohms 

  def get_ohms(self):
    return self._ohms 

  def set_ohms(self, ohms):
    self._ohms = ohms

Sử dụng các setters và getter nhìn đơn giản, nhưng nó không Pythonic.

In [0]:
r0 = OldResistor(50e3)
print("Before: %5r" % r0.get_ohms())

r0.set_ohms(10e3)
print("After: %5r" % r0.get_ohms())

Before: 50000.0
After: 10000.0


Các phương thức như thế đặc biệt rườm rà cho các tác vụ như tăng giá trị một biến

In [0]:
r0.set_ohms(r0.get_ohms() + 5e3)

Các phương thức trên giúp định nghĩa các giao tiếp cho lớp của bạn, làm cho lớp trở nên dễ dàng hơn khi bao các tính năng, xác nhận việc sử dụng các thuộc tính, và định nghĩa các ranh giới. Các tính năng trên là các mục tiêu quan trọng khi thiết kê smoojt lớp để đảm bảo rằng bạn không phá vỡ các hàm gọi khi lớp của bạn phát triển thêm sau này.

Trong Python, bạn không bao giờ cần triển khai các phương thức setter và getter. Thay vào đó, bạn nên luôn luôn bắt đầu các triển khai của mình với các thuộc tính công cộng. 

In [0]:
class Resistor(object):
  def __init__(self, ohms):
    self.ohms = ohms
    self.voltage = 0
    self.current = 0

In [0]:
r1 = Resistor(50e3)
r1.ohms = 10e3

Thực hiện như trên giúp cho các hành động như tăng giá trị một biến trở nên tự nhiên và rõ ràng hơn. 

In [0]:
r1.ohms += 5e3

Sau đó, nếu bạn quyết định rằng mình cần một cư xử đặc biệt khi một thuộc tính được thiết lập, bạn có thể dùng ```@property``` decorator và thuộc tính ```setter``` tương ứng của nó. Ở đây tôi định nghĩa một lớp mới ```Resistor``` giúp tôi tuỳ chỉnh ```current``` thông qua việc gán thuộc tính ```voltage```. Chú ý rằng để chạy được đúng tên của các phương thức setter và getter phải khớp với tên thuộc tính 

In [0]:
class VoltageResistance(Resistor):
  def __init__(self, ohms):
    super().__init__(ohms)
    self._voltage = 0 

  @property
  def voltage(self):
    return self._voltage 

  @voltage.setter
  def voltage(self, voltage):
    self._voltage = voltage 
    self.current = self._voltage / self.ohms


Bây giờ, gán thuộc tính ```voltage``` sẽ chạy phương thức setter ```voltage```, cập nhật giá trị ```current``` của đối tượng.

In [0]:
r2 = VoltageResistance(1e3)
print("Before: %5r amps" % r2.current)

r2.voltage = 10 
print("After : %5r amps" % r2.current)

Before:     0 amps
After :  0.01 amps


Chỉ định một ```setter``` trên một thuộc tính còn cho phép bạn thực hiện kiểm tra kiểu và xác minh giá trị được truyền vào lớp của bạn. Ở đây, tôi định nghĩa một lớp đảm bảo các giá trị không được chấp nhận là những giới trị nhỏ hơn 0 ohms.

In [0]:
class BoundedResistance(Resistor):
  def __init__(self, ohms):
    super().__init__(ohms)

  @property
  def ohms(self):
    return self._ohms 

  @ohms.setter 
  def ohms(self, ohms):
    if ohms <= 0:
      raise ValueError('%f ohms must be > 0 ' % ohms)
    self._ohms = ohms 

Gán một giá trị không hợp lệ cho một thuộc tính sẽ tạo ra một ngoại lệ

In [0]:
r3 = BoundedResistance(1e3)
r3.ohms = 0

ValueError: ignored

Một ngoại lệ sẽ xảy ra nếu bạn truyền vào một giá trị không hợp lý cho hàm xây dựng. 

In [0]:
BoundedResistance(-5)

ValueError: ignored

Điều này xảy ra là bởi vì ```BoundedResistance.__init__```` gọi ```Resistor.__init__```, phương thức này gán ```self.ohms - -5```. Phép gán này làm cho phương thức ```@ohms.setter``` từ ```BoundedResistance``` được gọi, và lập tức đoạn mã kiểm định giá trị thuộc tính được chạy trước khi xây dựng đối tượng được hoàn thành. 

Bạn có thể thậm chí sử dụng ```@property``` để làm cho các thuộc tính từ các lớp cho immutable.

In [0]:
class FixedResistance(Resistor):
  def __init__(self, ohms):
    super().__init__(ohms)
    
  @property
  def ohms(self):
    return self._ohms 

  @ohms.setter
  def ohms(self, ohms):
    if hasattr(self, '_ohms'):
      raise AttributeError("Can't set attribute")
    self._ohms = ohms

Cố gắng gán giá trị cho thuộc tính sau khi xây dựng tạo ra một ngoại lệ

In [0]:
r4 = FixedResistance(1e3)
r4.ohms = 2e3

AttributeError: ignored

Điểm trừ lớn nhất của ```@property``` đó là các phương thức cho một thuộc tính chỉ có thể được chia sẻ bởi các lớp con. Các lớp không liên qua không thể chia sẻ chung một triển khai. Tuy nhiên, Python cũng hỗ trợ ```descriptors``` cho phép sử dụng lại các logic của property và nhiều trường hợp khác. 

Cuối cung, khi bạn sử dụng các phương thức ```@property``` để triển khai các setters và getters, chắc chắn rằng các hành vi bạn triển khai không gây ngạc nhiên. Ví dụ, đừng thiết lập các thuộc tính khác trong các phương thức getter

In [0]:
class MysteriousResistor(Resistor):
  def __init__(self, ohms):
    super().__init__(ohms)

  @property 
  def ohms(self):
    self.voltage = self._ohms * self.current 
    return self._ohms

In [0]:
r7 = MysteriousResistor(10)
r7.current = 0.01
print("Before: %5r" % r7.voltage)
r7.ohms 
print("After: %5r" %r7.voltage)

AttributeError: ignored

Chính sách tốt nhất đó là chỉ thay đổi trạng thái đối tượng liên quan trong các phương thức ```@property.setter```. Đảm bảo rằng tránh bất cứ hiệu ứng phụ mà người gọi có thể không mong đợi ngoài phạm vi đối tượng đó, ví dụ import các modules động, chạy các hàm trợ giúp chậm, hoặc tạo ra các truy vấn cơ sở dữ liệu chậm. Người dùng lớp của bạn sẽ mong đợi các thuộc tính của nó sẽ giống như bất cứ đối tượng Python nào khác: nhanh và dễ dàng. Sử dụng các phương thức bình thường để làm bất cứ thứ gì phức tạp và chậm. 

### Những điều cần nhớ


*   Định nghĩa các giao tiếp lớp mới sử dụng các thuộc tính công cộng, tránh các phương thức set và get
*   Sử dụng ```@property``` để định nghĩa cư xử đặc biệt khi các thuộc tính được truy cập trên các đối tượng của chúng, nếu cần thiết. 
* Tuân theo luật ít bất ngờ nhất và tránh các hiệu ứng phụ trong các phương thức ```@property```. 
* Đảm bảo rằng các phương thức ```@property``` nhanh; thực hiện các công việc chậm và phức tạp sử dụng các phương thức bình thường. 






## Xem xét dùng ```@property``` thay cho việc tái cấu trúc các thuộc tính

Decorator có sẵn ```@property``` cho phép việc truy nhập vào các thuộc tính của hiện thực trở nên thông minh hơn. Một tính năng nâng cao nhưng phổ biến của ```@property``` là chuyển tiếp một thuộc tính số đơn giản với các phép tính toán. Điều này cực kì hữu ích bởi vì nó cho phép bạn chuyển tất cả các sử dụng có sẵn của một lớp sang các cư xử mới mà không phải viết lại tất cả các lời gọi. Nó còn cung cấp một giải pháp tạm thời cho việc cải thiện các giao tiếp của bạn. 

Ví dụ, bạn muốn triển khai định mức xô bị rò ri. Ở đây lớp ```Bucket``` biểu diễn lượng định mức của xô còn lại và khoảng thời gian định mức sẽ có sẵn. 

In [0]:
from datetime import timedelta
from datetime import datetime

In [0]:
class Bucket(object):
  def __init__(self, period):
    self.period_delta = timedelta(seconds=period)
    self.reset_time = datetime.now()
    self.quota = 0 

  def __repr__(self):
    return ('Bucket(quota=%d)' % self.quota )

Giải thuật định mức này hoạt động bằng cách đảm bảo rằng bất cứ xô nào được điền vào, lượng định mức không chuyển từ một khoảng thời gian này sang khoảng thời gian tiếp theo

In [0]:
def fill(bucket, amount):
  now = datetime.now()
  if now - bucket.reset_time > bucket.period_delta:
    bucket.quota = 0
    bucket.reset_time = now
  bucket.quota += amount 

Mỗi lần một người dùng định mức muốn làm một thứ gì đó, nó phải đảm bảo rằng nó có thể giảm lượng định mức nó cần để sử dụng

In [0]:
def deduct(bucket, amount):
  now = datetime.now()
  if now - bucket.reset_time > bucket.period_delta:
    return False 
  if bucket.quota - amount < 0:
    return False
  bucket.quota -= amount 
  return True 

In [0]:
bucket = Bucket(60)
fill(bucket, 100)
print(bucket)

Bucket(quota=100)


Sau đó bạn có thể giảm lượng định mức bạn cần

In [0]:
if deduct(bucket, 99):
  print("Had 99 quota")
else:
  print("Not enough for 99 quota")

print(bucket)

Had 99 quota
Bucket(quota=1)


Cuối cùng, bạn bị ngăn việc giảm lượng định mức nhiều hơn mức có sẵn. Trong trường hợp này, định mức của xô còn lại không thay đổi

In [0]:
if deduct(bucket, 3):
  print("Had 3 quota")
else:
  print("Not enough for 3 quota")

print(bucket)

Not enough for 3 quota
Bucket(quota=1)


Vấn đề với triển khai này đó là bạn sẽ không bao giờ biết mức định mức bắt đầu của mọt xa. Định mức được giảm đi trong suốt quá trình cho đến khi nó đạt tới 0. Tại điểm này, ```deduct``` sẽ luôn luôn trả về ```False```. Khi điều này xảy ra, sẽ hữu ích để biết các hàm gọi tới ```deduct``` bị khoá lại bởi vì ```Bucket``` hết hạn định mức hay không hay bởi vì ```Bucket``` không bao giờ có định mức từ lúc đầu.

Để giải quyết vấn đề này, tôi có thể thay đổi lớp để theo dõi ```max_quota``` trong khoảng thời gian này và ```quota_consumed```. 

In [0]:
class Bucket(object):
  def __init__(self, period):
    self.period_delta = timedelta(seconds=period)
    self.reset_time = datetime.now()
    self.max_quota = 0 
    self.quota_consumed = 0 

  def __repr__(self):
    return ("Bucket (max_quota=%d, quota_consumed=%d)" % (self.max_quota, self.quota_consumed))

Tôi sử dụng phương thức ```@property``` để tính toán mức độ định mức hiện hành sử dụng các thuộc tính mới này

In [0]:
class Bucket(object):
  def __init__(self, period):
    self.period_delta = timedelta(seconds=period)
    self.reset_time = datetime.now()
    self.max_quota = 0 
    self.quota_consumed = 0 

  def __repr__(self):
    return ("Bucket (max_quota=%d, quota_consumed=%d)" % (self.max_quota, self.quota_consumed))

  @property 
  def quota(self):
    return self.max_quota - self.quota_consumed 

Khi thuộc tính ```quota``` được gán, tôi thực hiện một hành động đặc biệt khớp vơpis giao tiếp hiện hành của lớp sử dụng ```fill``` và ```deduct```

In [0]:
class Bucket(object):
  def __init__(self, period):
    self.period_delta = timedelta(seconds=period)
    self.reset_time = datetime.now()
    self.max_quota = 0 
    self.quota_consumed = 0 

  def __repr__(self):
    return ("Buckets (max_quota=%d, quota_consumed=%d)" % (self.max_quota, self.quota_consumed))

  @property 
  def quota(self):
    return self.max_quota - self.quota_consumed 

  @quota.setter
  def quota(self, amount):
    delta = self.max_quota - amount
    if amount == 0:
      # Quota được thiết lập lại cho mỗi khoảng thời gian mới
      self.quota_consumed = 0
      self.max_quota = 0 
    elif delta < 0:
      # Quota được điền vào cho khoảng thời gian mới 
      assert self.quota_consumed == 0 
      self.max_quota = amount
    else:
      # Quota bị tiêu tốn trong suốt khoảng thời gian
      assert self.max_quota >= self.quota_consumed
      self.quota_consumed += delta

Chaỵ lại đoạn code demo phía triên để tạo ra cùng một kết quả

In [0]:
bucket = Bucket(60)
print("Initial", bucket)
fill(bucket, 100)
print("Filled", bucket)

if deduct(bucket, 99):
  print("Had 99 quota")
else:
  print("Not enough for 99 quota")

print("Now", bucket)

if deduct(bucket, 3):
  print("Had 3 quota")
else:
  print("Not enough for 3 quota")

print("Still", bucket)

Initial Buckets (max_quota=0, quota_consumed=0)
Filled Buckets (max_quota=100, quota_consumed=0)
Had 99 quota
Now Buckets (max_quota=100, quota_consumed=99)
Not enough for 3 quota
Still Buckets (max_quota=100, quota_consumed=99)


Phần tốt nhất đó là đoạn mã sử dụng ```Bucket.quota``` không phải thay đổi hay biết lớp đã thay đổi. Lớp mới sử dụng ```Bucket``` có thể làm những thứ đúng và truy cập ```max_quota``` và ```quota_consumed``` trực tiếp.

Tôi đặc biệt thích ```@property``` bởi vì nó cho phép bạn tạo một mô hình ngày càng tốt hơn. Đọc ví dụ ```Bucket``` phía trên, bạn có thể tự nghĩ rằng "```fill``` và ```deduct``` nên được triển khai ngay từ đầu" Mặc dù bạn có thể đúng rằng trong nhiều thực hợp trong thực tế các đối tượng này bắt đầu với các giao tiếp được định nghĩa không tốt và hoạt động như các bộ chứa dữ liệu ngu ngốc. Điều này xảy ra khi code phát triể, phạm vi tăng, nhiều tác giả đóng góc vào code mà không một ai quan tâm đến việc duy trì chất lượng code. 

```@property``` là một công cụ giúp bạn giải quyết các vấn đề trong thực tế. Đừng lạm dụng nó. Khi bạn thấy rằng bạn lặp lại việc mở rộng các phương thức ```@property``` quá nhiều, đây có thể là một thời điểm để cấu trúc lại lớp của bạn

### Những điều cần nhớ


*  Sử dụng ```@property``` để mang lại hiện thực đang tồn tại các tính năng mới
*   Làm cho qua trình tăng trưởng về tính năng trở nên tốt hơn thông qua việc sử dụng ```@property```
* Xem xét việc tái cấu trúc một lớp và tất cả các phía gọi khi bạn thấy lệ thuộc quá nhiều vào ```@property```



## Sử dụng Descriptors cho việc tái sử dụng các phương thức @property 

Vấn đề lớn nhất với ```@property``` đó là tái sử dụng. Các phương thức nó decorate không thể được tái sử dụng lại cho nhiều thuộc tính của cùng một lớp. Chúng cũng không thể tái sử dụng được bởi các lớp không liên quan. 

Ví dụ, bạn muốn một lớp để thẩm định kết quả bài tập về nhà nhận được từ một học sinh theo phần trăm

In [0]:
class Homework(object):
  def __init__(self):
    self._grade = 0 

  @property 
  def grade(self):
    return self._grade 

  @grade.setter 
  def grade(self, value):
    if not (0 <= value <= 100):
      raise ValueError('Grade must be between 0 and 100')
    self._grade = value 

Sử dụng ```@property``` làm cho lớp này dễ dàng sử dụng:

In [0]:
galileo = Homework()
galileo.grade = 95

Bây giờ bạn muốn cho học sinh điểm số cho một đợt thi, đợt thi này có nhiều môn, mỗi môn với một điểm riêng. 

In [0]:
class Exam(object):
  def __init__(self):
    self._writing = 0
    self._math_grade = 0

  @staticmethod 
  def _check_grade(value):
    if not (0 <= value <= 100):
      raise ValueError('Grade must be between 0 and 100')


Điều này trở nên nhàm chán. Mỗi phần của bài thi yêu cầu thêm vào một ```@property``` và các mã kiểm tra liên quan

In [0]:
class Exam(object):
  def __init__(self):
    self._writing = 0
    self._math_grade = 0

  @staticmethod 
  def _check_grade(value):
    if not (0 <= value <= 100):
      raise ValueError('Grade must be between 0 and 100')

  @property
  def writing_grade(self):
    return self._writing_grade 

  @writing_grade.setter
  def writing_grade(self, value):
    self._check_grade(value)
    self._writing_grade = value 

  @property
  def math_grade(self):
    return self._math_grade 

  @math_grade.setter 
  def math_grade(self, value):
    self._check_grade(value)
    self._math_grade = value

Ngoài ra, cách tiếp cận này không tổng quát. Nếu bạn muốn tái sử dụng đoạn mã kiểm tra bên ngoài homework và exams, bạn cần viết các đoạn mã nhỏ lặp đi lặp lại như ```@property``` (boilerplate) và ```_check_grade`.

Cách tốt hơn để làm điều này đó là sử dụng một mô tả ```descriptor```. Giao thức mô tả định nghĩa cách truy cập một thuộc tính được diễn dịch bởi ngôn ngữ. Một lớp mô tả cung cấp các phương thức ```__get__``` và ```__set__``` cho phép bạn tái sử dụng các cư xử kiểm tra điểm thi mà không cần bất cứ boiler plate. Đối với mục đích này, các mô tả tốt hơn các mix-ins bởi vì chúng cho phép tái sử dụng chung một logic cho nhiều thuộc tính khác nhau trong một lớp đơn lẻ. 

Ở đây, tôi định nghĩa một lớp mới ```Exam``` với các thuộc tính lớp là các hiện thực ```Grade```. Lớp ```Grade``` triển khai giao thức mô tả. Trước khi giải thích cách lớp ```Grade``` làm việc, điều quan trọng là hiểu cách Python sẽ làm khi mã ccuar bạn truy cập các thuộc tính mô tả trên một hiện thực ```Exam```.  

In [0]:
class Grade(object):
  def __get__(*args, **kwargs):
    pass

  def __set__(*args, **kwargs):
    pass

class Exam(object):
  math_grade = Grade()
  writing_grade = Grade()
  science_grade = Grade()

Khi bạn gán một thuộc tính 

In [0]:
exam = Exam()
exam.writing_grade = 40

## Cộng tác
Có rất nhiều tính năng trong Python giúp bạn xây dựng các APIs được định nghĩa tốt với các ranh giới giao tiếp rõ ràng. Công đồng Pyhton thiết lập các thực hành tốt nhất (best practices) qua đó tối đa hoá khả năng bảo trì  code qua thời gian. Có nhiều công cụ chuẩn đi cùng với Python cho phép các teams lớn làm việc cùng với nhau trong các môi trường khác nhau.

Hợp tác với

In [0]:
def palindrome(word):
  """Return True if the given word is a palindrome"""
  return word == word[::-1]

Bạn có thể lấy về docstring thông qua việc truy cập với thuộc tính đặc biệt ```__doc__```

In [0]:
print(repr(palindrome.__doc__))

'Return True if the given word is a palindrome'


### Ghi tài liệu cho các lớp
Mỗi lớp nên có một docstring ở mức lớp. Thực hiện việc này giống như docstring mức module. Dòng đầu tiên là một câu chỉ rõ mục đích của lớp. Các đoạn phía sau thảo luận các chi tiết quan trọng về hoạt động của lớp. 

Các thuộc tính và phương thức công cộng của lớp nên được highlight trong docstring mức lớp. Docstring này cũng nên cung cấp các hướng dẫn cho các lớp con làm thế nào tương tác với các thuộc tính được bảo vệ và các lớp cha. 

Dưới đây là một ví dụ của một docstring của một lớp:

In [0]:
class Player(object):
  """Represents a player of the game.
  
  Subclasses may override the 'tick' method to provide
  custom animations for the player's movement depending 
  on their power level, etc. 

  Public attributes:
  - power: Unused power-ups (float between 0 and 1)
  - coins: Coins found during the level (integer)
  """
  # pass

### Ghi tài liệu cho các hàm

Mõi hàm hay phương thức công cộng nên có một docstring. Thực hiện việc này giống như với các modules và lớp. Dòng đầu tiên là một dòng mô tả hàm làm gì. Các đoạn phía sau nên mô tả bất kì cư xử cụ thể nào và các tham số cho hàm này. Nên nhắc tới bất cứ tham số và giá trị trả về. Bất cứ ngoại lệ người gọi phải xử lý khi dùng hàm nên được mô tả. 

Dưới đây là một ví dụ của một docstring của một hàm

In [0]:
def find_anagrams(word, dictionary):
  """Find all anagrams for a word.
  This function only runs as fast as the test for
  membership in the "dictionary" container. 
  It will be slow if the dictionary is a list and fast if it's a set

  Args:
  word: String of the target word
  dictionary: Container with all strings that are known to be actual words
  Returns: List of anagrams that wre found. Empty if none were found.

Trong một số trường hợp đặc biệt có một số điều quan trọng cần biết khi viết các docstrings


*  Nếu hàm của bạn không có các tham số và chỉ có một giá trị trả về, chỉ cần một câu mô tả có thể là đủ
*  Nếu hàm của bạn không trả về bất cứ thứ gì, tốt hơn là đừng nhắc gì về giá trị trả về thanh vì viết là "returns None."
* Nếu bạn không mong đợi hàm của mình khởi lên một ngoại lệ trong quá trình hoạt động, đừng nhắc gì về điều đó.
* Nếu hàm của bạn chấp nhận một biến chứa số lượng các tham số hoặc các tham số từ khoá, sử dụng ```*args``` và ```kwargs``` trong danh dách các tham số để mô tả mục đích của nó. 
* Nếu hàm của bạn có các tham số với các giá trị mặc định, các giá trị mặc định này nên được đề cập.
* Nếu hàm của bạn là một generator, docstring nên mô tả generator sinh ra cái gì khi nó được lặp.
* Nếu hàm của bạn là một coroutine, khi đó docstring của bạn nên chứa cái coroutine của bạn tạo ra, cái gì được mong đợi từ các biểu diễn ```yield```, và khi nào nó sẽ dừng lặp. 

**Chú ý**: Mỗi khi bạn viết các docstrings cho các modules của bạn, quan trọng là giữ cho tài liệu này cập nhật. Module có sẵn ```doctest``` làm cho việc này trở nên dễ dàng hơn qua việc đảm bảo souce code của bạn và tài liệu của mình không quá cách xa nhau. 



### Những điều cần nhớ


*   Viết tài liệu cho các module, lớp và hàm sử dụng docstrings. Giữ cho chúng update khi code của bạn thay đổi
* Đối với các modules: giới thiệu nội dung của moduel và bất cứ lớp hay hàm quan trọng mà người dùng nên biết
* Đối với các lớp: Ghi lại các hành vi của các thuộc tính quan trọng, và cư xử của lớp con trong docstring ngay phía dưới câu lệnh ```class```.
* Đối với các hàm và các phương thức: ghi lại mỗi tham , giá trị trả về, khởi lên ngoại lệ và các cư xử khác trong docstring ngay dưới câu ```def```. 



## Sử dụng các Packages để tổ chức các Modules và cung cấp các APIs ổn định

Khi kích thước của chương trình của bạn tăng lên, bạn có thể cần tổ chức lại cấu trúc của nó. Bạn chia nhỏ các hàm lớn hơn thành các hàm nhỏ hơn. Bạn cấu trúc lại các cấu trúc dữ liệu thành các lớp trợ giúp (helper classes). Bạn tách biệt tính năng thành nhiều modules khác nhau phụ thuộc lẫn nhau.

Tại một số thời điểm, bạn thấy rằng mình có quá nhiều modules mà bạn cần một lớp khác trong chương trình của bạn để làm cho nó dễ hiểu hơn. Nhằm phục vụ cho mục đích này, Python cung cấp các gói (packages). Các packages là các modules mà chứa các modules khác. 

Trong nhiều trường hợp, các gói được định nghĩa thông qua việc đặt một file rỗng tên là ```__init__.py``` vào trong một thư mục. Mỗi khi ```__init__.py``` hiện diện, các file Python khác trong cùng thư mục đó sẽ có sẵn cho việc import sử dụng một đường dẫn tương đối tới thư mục. Ví dụ, tưởng tượng rằng bạn có cấu trúc thư mục sau trong chương trình của bạn

```main.py```

```mypackage/__init__.py```

```mypackage/models.py```

```mypackage/utils.py```

Để import module ```utils```, bạn sử dụng tên module tuyệt đối mà bao gồm tên của thư mục.



In [0]:
# main.py
from mypackage import utils

Cách làm trên sẽ được áp dụng khi bạn có các thư mục gói ở các gói khác (như là ```mypackage.foo.bar```).

**Chú ý**
Python 3.4 giới thiệu cái gói không gian tên (namespace packages) cung cấp một cách mềm dẻo để định nghĩa các gói. Các gói không gian tên có thể được tạo thành từ nhiều modules từ các thư mục khác nhau, các đóng gói zip, hoặc thậm chí các hệ thôgns từ xa. 

Tính năng được cung cấp bởi các gói có hai mục đích chính trong các chương trình Python

### Các không gian tên

Lợi ích đầu tiên của các packages đó là giúp việc chia các modules thành các không gian tên riêng biệt. Điều này cho phép bạn có nhiều modules với cùng một tên file nhưng khác nhau ở các đường dẫn tuyệt đối bởi chúng là duy nhất. Ví dụ, ta có một chương trình import các thuộc tính từ hai modules có cùng một tên, ```utils.py```. Đoạn mã hoạt động được là bởi vì các modules được gọi tới bởi các đường dẫn tuyệt đối

In [0]:
from analysis.utils import log_base2_bucket
from frontend.utils import stringify

bucket = stringify(log_base_bucket(33)

Cách tiếp cận trên không hoạt động được trong trường hợp các hàm, các lớp hoặc các modules con được định nghĩa trong các packages có cùng các tên. Ví dụ, bạn muốn sử dụng hàm ```inspect``` từ cả ```ânlysis.utils``` và ```frontend.utils``` modules. Import theo cách này không hoạt động bởi vì ```import``` thứ hai sẽ ghi đề giá trị của ```inspect``` trong phạm vi hiện hành. 

In [0]:
from analysis.utils import insect 
from frontend.utils import inspect # ghi đè

Để giải quyết vấn đề này ta sử dụng ```as``` khi import một module để đổi lại tên của module hay hàm được import trong scope hiện hành

In [0]:
from analysis.utils import inspect as analysis_inspect
from frontend.utils import inspect as frontend_inspect 

value = 33 
if analysis_inspect(value) == frontend_inspect(value):
  print("Inspection equal")

Sử dụng ```as``` để đổi lại tên bất cứ thứ gì bạn lấy được từ câu lệnh ```import```, bao gồm cả toàn bộ các modules. Điều này làm cho việc truy cập vào code trong trong namespace trở nên rõ ràng hơn khi sử dụng nó. 

**Chú ý**
Có một cách khác để tránh việc xung đột tên được import đó là cho phép truy cập các tên thông qua tên module duy nhất ở cấp cao nhất. 

Ví dụ, bạn có thể import ```import analysis.utils``` và ```import frontend.utils```. Sau đó truy cập vào các hàm ```inspect``` với đường dẫn đầy đủ ```analysis.utils.inspect``` và ```frontend.utils.inspect```. 

Cách tiếp cận này cho phép bạn tránh các câu ```as``` cùng với nhau. Ngoài ra nó còn cho người đọc biết rằng hàm đó đến từ đâu. 

## Các APIs bền vững

Ứng dụng thứ hai của các gói trong Python đó là cung cấp các APIs bền vững cho người dùng bên ngoài. 

Khi bạn đang viết một API cho số lượng lớn người dùng, như là một gói mã nguồn mở, bạn sẽ muốn cung cấp tính năng bền vững mà không thay đổi giữa các bản release. Để đảm bảo được điều này, điều quan trọng là ẩn đi cơ cấu tổ chức code bên trong đối với người dùng bên ngoài. Điều này làm cho bạn tái cấu trúc và cải thiện các modules nội tội của các gói mà không phá vỡ sự tương tác với những người dùng hiện tại. 

Python có thể giới hạn diện tích bề mặt được bày ra cho người dùng thông qua việc sử dụng thuộc tính đặc biệt ```__all__``` của một module hoặc gói. Giá trị của ```__all__``` là một danh sách tất cả các tên xuất ra từ module như là các API công cộng. Khi code gọi ```from foo import *```, chỉ các thuộc tính trong ```foo.__all__``` sẽ được import từ ```foo```. Nếu ```__all__``` không tồn tại trong ```foo```, khi đó chỉ các thuộc tính công cộng, những thuộc tính không có dấu gạch chân ở đầu, được import. Ví dụ bạn muốn cung cấp một gói cho việc tính toán các xung đột giữa các viên đạn đang di chuyển. Ở đây tôi định nghĩa module ```models``` của gói ```mypackage``` để chứa biểu diễn của các viên đạn: 

In [0]:
# models.py
__all__ = ["Projectile"]

class Projectile(object):
  def __init__(self, mass, velocity):
    self.mass = mass 
    self.velocity = velocity 

    

## Định nghĩa các function decorators với ```functools.wraps```

Python có cú pháp đặc biệt cho các decorators có thể được áp dụng cho các hàm. Decorators có khả năng chạy code trước và sau bất cứ lời gọi nào tới các hàm nó bao. Điều này cho phép ta thay đổi các tham giá đầu vào và các giá trị trả về. Tính năng này có thể hữu dụng cho việc thi hành các ngữ nghĩa, debugging, các hàm đăng ký, và nhiều hơn thế nữa. 

Ví dụ bạn muốn in ra các tham số và giá trị trả về của một lời gọi hàm. Điều này hữu dụng khi debug một ngăn xếp (stack) các lời gọi hàm từ một hàm hồi quy. Ở đây, tôi định nghĩa một decorator như vậy:


In [0]:
def trace(func):
  def wrapper(*args, **kwargs):
    result = func(*args, **kwargs)
    print("%s(%r, %r) -> %r" % (func.__name__, args, kwargs, result))
    return result
  return wrapper

Tôi có thể áp dụng decorator như vậy bằng cách dùng biểu tượng ```@```

In [0]:
@trace
def fibonacci(n):
  """Return the n-th Fibonacci number"""
  if n in (0, 1):
    return n
  return (fibonacci(n - 2) + fibonacci(n - 1))

Biểu tượng ```@``` tương đương với gọi decorator trên hàm nó bao và gán giá trị trả về vào tên gốc trong cùng một phạm vi tên. 

In [0]:
fibonacci = trace(fibonacci)

In [0]:
fibonacci(3)

fibonacci((1,), {}) -> 1
fibonacci((0,), {}) -> 0
fibonacci((1,), {}) -> 1
fibonacci((2,), {}) -> 1
fibonacci((3,), {}) -> 2


2

Cách này hoạt động tốt, nhưng nó có một hiệu ứng phụ không như mong muốn. Giá trị trả về bởi decorator - hàm được gọi ở trên - không nghĩ rằng nó được đặt tên là ```fibonacci```.


In [0]:
print(fibonacci)

<function trace.<locals>.wrapper at 0x7f1c0846f8c8>


Nguyên nhân của việc này khó đó thể. Hàm ```trace``` trả về ```wrapper``` nó định nghĩa. Hàm ```wrapper``` làm hàm được gán với tên ```fibonacci``` trong module chứa đựng bởi vì decorator. Cư xử này có vấn đề là bởi vì nó giảm đi công dụng của các công cụ thực hiện việc kiểm tra (introspection). 

Ví dụ, hàm có sẵn ```help``` là vô dụng khi được áp dụng cho hàm ```fibonacci```

In [0]:
help(fibonacci)

Help on function wrapper in module __main__:

wrapper(*args, **kwargs)



In [0]:
def fibonacci_no_decorator(n):
  """Return the n-th Fibonacci number"""
  if n in (0, 1):
    return n
  return (fibonacci(n - 2) + fibonacci(n - 1))

In [0]:
help(fibonacci_no_decorator)

Help on function fibonacci_no_decorator in module __main__:

fibonacci_no_decorator(n)
    Return the n-th Fibonacci number



Giải pháp là sử dụng hàm trợ giúp ```wraps``` từ module có sẵn ```functools```. Đây là một decorator giúp bạn viết các decorators. Úp dụng nó cho hàm ```wrapper``` sẽ sao chép tất cả các thông tin metadata về hàm bên trong cho hàm bên ngoài

In [0]:
from functools import wraps
def trace(func):
  @wraps(func)
  def wrapper(*args, **kwargs):
    result = func(*args, **kwargs)
    print("%s(%r, %r) -> %r" % (func.__name__, args, kwargs, result))
    return result
  return wrapper


In [0]:
@trace
def fibonacci(n):
  """Return the n-th Fibonacci number"""
  if n in (0, 1):
    return n
  return (fibonacci(n - 2) + fibonacci(n - 1))

Bây giờ, chạy hàm ```help``` tạo ra kết quả như mong đợi, mặc cho hàm bị decorate

In [0]:
help(fibonacci)

Help on function fibonacci in module __main__:

fibonacci(n)
    Return the n-th Fibonacci number



Gọi ```help``` chỉ là một ví dụ về các vấn đề có thể xảy ra với các decorators. Các hàm Python có nhiều thuộc tính chuẩn khác (ví dụ như, ```_name__```, ```__module__```) phải được bảo tồn để duy trì giao tiếp của các hàm trong ngôn ngữ. Sử dụng ```wraps``` đảm bảo rằng bạn sẽ luôn có được cư xử chính xác.

Những điều cần nhớ


*   Các decorators là cú pháp Python để cho phép một hàm thay đổi một hàm khác tại thời gian chạy.
* Sử dụng các decorators có thể tạo ra những cư xử lạ với các công cụ thực hiện việc theo dõi, giám sát như là các debuggers
*  Sử dụng ```wraps``` decorator từ module có sẵn ```functools``` khi bạn định nghĩa decorators riêng của mình để tránh bất cứ vấn đề gì.



## Xem xét sử dụng ```contextlib``` và ```with``` cho việc tái sử dụng ```try/finally```

```with``` được sử dụng để ám chỉ rằng code được chạy trong một bối cảnh đặc biệt. Ví dụ, các khoá loại trừ lẫn nhau (mutual exclusion locks) có thể được sử dụng với ```with``` để chỉ ra rằng code được thụt vào chỉ chạy khi lock được giữ. 

In [0]:
lock = Lock()

In [0]:
with lock:
  print('Lock is held')

Ví dụ trên tương đương với việc xây dựng ```try/finally``` bởi vì lớp ```Lock``` cho phép được sử dụng với ```with```

In [0]:
lock.acquire()
try:
  print('Lock is held')
finally:
  lock.release()

Sử dụng ```with``` ta loại bỏ được những đoạn mã xây dựng ```try/finally``` lặp lại. Để tạo ra các đối tượng và hàm của bạn có thể sử dụng với ```with``` bạn có thể dùng module có sẵn ```contextlib```. 
Module này chứa một decorator là ```contextmanager```, cho phép một hàm đơn giản được sử dụng với ```with```. Thực hiện việc này dễ hơn rất nhiều so với việc định nghĩa một lớp mới các phương thức đặc biệt như ```_enter__``` và ```_exit__``` (theo cách chuẩn.)


Ví dụ, bạn muốn một phần trong đoạn mã của bạn có thêm nhiều logging. Ở đây tôi định nghĩa một hàm thực hiện việc logging ở hai mức độ nghiêm trọng.

In [0]:
import logging
def my_function():
  logging.debug('Some debug data')
  logging.error('Error log here')
  logging.debug('More debug data')

Mức độ log mặc định cho chương trình của tôi là ```WARNING```, vì vậy chỉ có thông điệp lỗi sẽ in ra màn hình khi bạn chạy hàm.

my_funcion()

Tôi có thể tăng cấp độ log cho hàm này tạm thời bằng cách định nghĩa một quản lý ngữ cảnh (context manager). Hàm trợ giúp này tăng cường mức độ  trọng của log trước khi chạy code trong khối ```with``` và giảm đi mức độ nghiêm trọng sau đó.

In [0]:
@contextmanager
def debug_logging(level):
  logger = logging.getLogger()
  old_level = logger.getEffectiveLevel()
  logger.setLevel(level)
  try:
    yield 
  finally:
    logger.setLevel(old_level)

Câu lệnh ```yield``` là điểm nơi nội dung của khối ```with``` sẽ thực thi. Bất cứ ngoại lệ nào xảy ra trong khối ```with``` sẽ được khởi lên bởi câu ```yield``` để bắt lại trong hàm trợ giúp để giúp cho việc giải thích. 

Bây giờ, tôi có thể gọi cùng hàm logging, nhưng trong ngữ cảnh ```debug_logging```. Tại thời điểm này, tất cả các thông điệp debug được in ra màn hình trong khối ```with```. Cùng hàm này nhưng chạy bên ngoài khối ```with``` sẽ không in ra các thông điệp debug.

In [0]:
with debug_logging(logging.DEBUG):
  print("Inside:")
  my_function()
print("After:")
my_function()

## Sử dụng các mục tiêu ```with```

Đối tượng quản lý ngữ cảnh được tryền tới câu ```with``` cũng có thể trả về một đối tượng. Đối tượng này được gán cho một biến cục bộ trong phần ```as``` của câu ```with```. Điều này giúp cho code chạy trong khối ```with``` tương tác trực tiếp với ngữ cảnh của nó.

Ví dụ, bạn muốn ghi một file và đảm bảo rằng nó luôn luôn được đóng một cách đúng đắn. Bạn có thể làm điều này bằng cách truyền hàm ```open``` vào ```with```. ```open``` trả về một file handle và gán cho biến ở sau ```as``` như là mục tiêu của ```with``` và sẽ đóng handle khi ```with``` bock thoát ra.

In [0]:
with open("/tmp/my_output.txt", "w") as handle:
  handle.write("This is some data!")

In [0]:
!cat /tmp/my_output.txt

This is some data!

Cách làm này được ưu chuộng hơn so với việc mở và đóng một handle một cách thủ công mỗi lần bạn muốn thao tác với file. Nó làm cho bạn chắc chắn rằng file sẽ luôn được đóng khi thực thi được hoàn tất bên trong ```with``` statement. Nó cũng khuyến khích bạn giảm lượng code cần thực thi khi file được mở, điều này luôn tốt trong thực tế. 

Để làm cho các hàm của bạn đáp ứng các giá trị cho các mục tiêu ```as```, tất cả những gì bạn cần làm là ```yield``` một giá trị từ mã quản lý ngữ cảnh của bạn. Ví dụ, bạn định nghĩa một mã quản lý ngữ cảnh để lấy một hiện thực ```Logger```, thiết lập cấp độ của nó, và sau đó ```yield``` nó cho mục tiêu ```as``` 

In [0]:
from contextlib import contextmanager 
import logging
logging.basicConfig(level=logging.WARNING)

@contextmanager
def log_level(level, name):
  logger = logging.getLogger(name)
  old_level = logger.getEffectiveLevel()
  logger.setLevel(level)
  try:
    yield logger
  finally:
    logger.setLevel(old_level)

Gọi các phương thức logging như ```debug``` trên ```as``` sẽ đưa ra kết quả bởi vì cấp độ nghiêm trọng logging được thiết lập đủ thấp trong khối ```with```. Sử dụng module ```logging``` sẽ không in ra bất cứ thứ gì bởi vì mặc định của logger là ```WARNING```

In [0]:
with log_level(logging.DEBUG, 'mylog') as logger:
  logger.debug("This is my message")
  logging.debug("This will not print")

DEBUG:mylog:This is my message


Sau khi ```with``` thoát ra, gọi các phương thức logging thông tin tin debug trên đối tượng ```Logger``` có tên là ```my-log``` sẽ không in ra bất cứ thứ gì bởi vì mức độ nghiêm trọng mặc định đã được khôi phục. Các thông tin log lỗi sẽ luôn luôn in ra. 

In [0]:
logger = logging.getLogger('my-log')
logger.debug('Debug will not print')
logger.error('Error will print')

ERROR:my-log:Error will print


### Những thứ cần nhớ


*   Câu ```with``` cho phép bạn tái sử dụng logic từ các khối ```try/finally``` và giảm nhiễu thị giác (visual noise)
*  Module có sẵn ```contextlib``` cung cấp một decorator ```contextmanager``` cho phép bạn dễ dàng sử dụng hàm của riêng bạn với các câu ```with```.
* Giá trị được sinh ra bởi các mã quản lý ngữ cảnh được cung cấp cho phần ```as``` của ```with```. Điều này hữu dụng khi cho phép mã code của bạn truy cập trực tiếp tới gốc của ngữ cảnh đặc biệt này. 



## Làm cho ```pickle``` đáng tin hơn với ```copyreg```

Module có sẵn ```pickle``` có thể serialize các đối tượng Pyhton thành một chuỗi các bytes và deserialize các bytes thành các đối tượng. Các bytes được pickled không nên được sử dụng để giao tiếp giữa các bên không đáng tin. Mục đích của ```pickle``` cho phép bạn truyền các đối tượng Python giữa các chương trình mà bạn điều khiển qua các kênh nhị phân (binary channels)

**Chú ý**

Định dạng serialization của module pickle không an toàn như nó được thiết kế. Dữ liệu bị serialized chứa thông tin một chương trình mô tả cách tái xây dựng đối tượng ban đầu. Điều đó có nghĩa là một dữ liệu ```pickle``` độc hại có thể được sử dụng để thoả hiệp (compromise) bất cứ phần nào của chương trình Python cố gắng deserialize nó. 

Ngược lại, module ```json``` được thiết kế theo cách làm cho nó an toàn. Một dữ liệu JSON được serialized chứa một mô tả đơn giản của một phân tầng đối tượng. Deserialize dữ liệu JSON không bày ra bất cứ rủi ro nào cho một chương trình Python. Các định dạng như JSON nên được sử dụng cho việc giao tiếp giữa các chương trình và những người không tin tưởng lẫn nhau. 


Ví dụ, bạn muốn sử dụng một đối tượng Python để biểu diễn trạng thái của một người chơi trong một trò chơi. Trạng thái trò chơi bao gồm cấp độ hiện tại của người chơi và số lượng mạng sống anh ta còn lại. 

In [0]:
class GameState(object):
  def __init__(self):
    self.level = 0 
    self.lives = 4 

Chương trình thay đổi đối tượng này khi trò chơi bắt đầu.

In [0]:
state = GameState()
state.level += 1 # Người chơi tăng một cấp độ
state.lives -= 1 # Người chơi phải thử lại, mất đi một mạng

Khi người chơi thoát ra, không chơi nữa, chương trình có thể lưu trạng thái của trò chơi vào một tệp tin vì vậy nó có thể lấy lại trạng thái hiện hành trong lần sau. Module ```pickle``` làm cho việc này trở nên dễ dàng hơn. Ở đây, tôi ```dump``` đối tượng ```GameState``` ra một file

In [0]:
import pickle
state_path = "/tmp/game_state.bin"
with open(state_path, "wb") as f:
  pickle.dump(state, f)

Sau đó, tôi có thể ```load``` file này và lấy lại trạng thái của đối tượng ```GameState``` như là khi nó chưa bị serialized. 

In [0]:
with open(state_path, "rb") as f:
  state_after = pickle.load(f)

print(state_after.__dict__)

{'level': 1, 'lives': 3}


Vấn đề với cách tiếp cận này đó là điều gì sẽ xảy ra khi các tính năng của game được mở rộng. Tưởng tượng rằng bạn muốn người chơi kiếm được nhiều điểm để đạt tới một điểm cao. Để theo dõi điểm của người chơi, bạn muốn thêm vào một trường mới vào lớp ```GameState```.

In [0]:
class GameState(object):
  def __init__(self):
    self.level = 0 
    self.lives = 4 
    self.points = 0

Serialize phiên bản mới của lớp ```GameState``` sử dụng ```pickle``` sẽ hoạt động y hệt như trước đó. Ở đây, tôi mô phỏng một quá trình khứ hồi của việc ```dumps``` một đối tượng ra một string và ```loads``` ngược trở lại đối tượng đó.

In [0]:
import pickle
state = GameState()
serialized = pickle.dumps(state)
state_after = pickle.loads(serialized)
print(state_after.__dict__)

{'level': 0, 'lives': 4, 'points': 0}


Điều gì sẽ xảy ra với các đối tượng ```GameState``` cũ đã được lưu trước đó khi người dùng muốn hồi phục lại? Ở đây, tôi unpickle một file game cũ sử dụng một chương trình với định nghĩa mỡi của lớp ```GameState```:

In [0]:
with open(state_path, "rb") as f:
  state_after = pickle.load(f)
print(state_after.__dict__)

{'level': 1, 'lives': 3}


Thuộc tính ```points``` bị khuyết! Điều này gây ra việc nhầm lẫn bởi vì đối tượng trả về là một hiện thực của lớp ```GAmeState```

In [0]:
assert isinstance(state_after, GameState)

Cư xử của ```pickle``` phản ánh cách nó hoạt động. Mục đích chính của module này là làm cho việc serialize các đối tượng dễ dàng hơn. Khi bạn dùng ```pickle``` trong các mục đích phức tạp hơn, tính năng của module này bắt đầu gây ngạc nhiên trong hành vi của nó.

Để giải quyết vấn đề này ta có thể sử dụng module ```copyreg```. Module này cho phép bạn đăng ký các hàm chịu trách nhiệm cho việc serialize các đối tượng Python, cho phép bạn điều khiển hành vi của ```pickle``` và làm cho nó đáng tin hơn. 

## Các giá trị thuộc tính mặc định

Trong trường hợp đặc biệt, bạn có thể sử dụng một hàm xây dựng với các tham số mặc định để đảm bảo rằng các đối tượng ```GameState``` sẽ luôn luôn có tất cả các thuộc tính sau khi unpickle. Ở đây, tôi định nghĩa hàm xây dựng lại theo cách đó:

In [0]:
class GameState(object):
  def __init__(self, level=0, lives=4, points=0):
    self.level = level
    self.lives = lives
    self.points = points

Để sử dụng hàm xây dựng này cho việc pickle, tôi định ngĩa một hàm trợ giúp giúp chuyển đối tượng ```GameState``` thành một tuple của các tham số cho module ```copyreg````. Tuple trả về chứa hàm được sử dụng cho việc unpickle và các tham số để truyền cho hàm unpickle. 

In [0]:
def pickle_game_state(game_state):
  kwargs = game_state.__dict__
  return unpickle_game_state, (kwargs,)

## Sử dụng các chuỗi ```repr``` cho đầu ra của việc debugging

Khi debug một chương trình Python, hàm ```print``` (hoặc output thông qua module có sẵn ```loggin```) sẽ gây cho bạn ngạc nhiên. Các chi tiết nội tại Python có thể dễ dàng được truy cập thông qua các thuộc tính rõ ràng. Tất cả bạn cần làm là ```print``` trạng thái chủa các thay đổi trong chương trình của bạn khi nó chạy và nhìn xem chỗ nào sai. 

Hàm ```print``` xuất ra phiên bản string có thể đọc được (human-readable) của bất cứ thứ gì bạn cung cấp cho nó. Ví dụ, in ra một string căn bản sẽ in ra nội dung của string đó mà không có dấu quote. 

In [0]:
print("foo bar")

foo bar


Điều này tương tự với việc sử dụng ```%s```` định dạng và phép ```%```

In [0]:
print('%s' % 'foo bar')

foo bar


Vấn đề ở đây là các chuỗi có thể đọc được cho một giá trị không làm rõ được kiểu thực sự của giá trị. Ví dụ , để ý  output mặc định của ```print``` bạn không thể phân biệt giữa các kiểu của số ```5``` và string ```'5'```

In [0]:
print(5)
print("5")

5
5


Nếu bạn đang debug một chương trình với ```print```, sự khác biệt giữa các kiểu thực sự quan trọng. Cái bạn muốn khi debug đó là thấy được phiên bản ```repr``` của một đối tượng. Hàm có sẵn ```repr``` trả về một biểu diễn có thể in được (printable representation) cả một đối tượng, đây là một biểu diễn có thể hiểu được rõ ràng nhất. Đối với các kiểu có sẵn, string được trả về bởi ```repr``` là một biểu diễn hợp lệ. 

In [0]:
a = '\x07'
print(repr(a))

'\x07'


Truyền giá trị từ ```repr``` tới hàm có sẵn ```eval``` nên trả về cùng một đối tượng Python lúc bạn bắt đầu (dĩ nhiên, trong thực tế, bạn nên chỉ sử dụng ```eval``` với một sự cẩn trọng cao nhất)

In [0]:
b = eval(repr(a))
assert a == b

Khi bạn debug với ```print```, bạn nên ```repr``` giá trị trước khi in để đảm bảo rằng bất cứ sự khác biệt nào về kiểu cần rõ ràng.

In [0]:
print(repr(5))
print(repr('5'))

5
'5'


Điều này tương đương với việc sử dụng chuỗi định dạng ```'%r'``` và phép ```%```

In [0]:
print('%r' % 5)

5


In [0]:
print('%r' % '5')

'5'


Đối với các đối tượng Python động, giá trị chuỗi có thể đọc được mặc định giống như giá trị ```repr```. Điều này có nghĩa là truyền vào một đối tượng động tới ```print``` sẽ làm những thứ đúng, và bạn không cần phải gọi ```repr``` trên đối tượng. Không may mắn, giá trị mặc định của ```repr``` cho các hiện thự ```object``` không thực sự hữu dụng. Ví dụ, ở đây tôi định nghĩa một lớp đơn giản và in ra giá trị của nó.

In [0]:
class OpaqueClass(object):
  def __init__(self, x, y):
    self.x = x
    self.y = y 

In [0]:
obj = OpaqueClass(1, 2)
print(obj)

<__main__.OpaqueClass object at 0x7f8c43579470>


Output này không thể được truyền tới hàm ```eval```,và nó không nói lên điều gì về các trường của hiện thực của đối tượng. 

Có hai giải pháp cho vấn đề này. Nếu bạn có quyền điều khiến của lớp này, bạn có thể định nghĩa phương thức đặc biệt ```__repr__``` của riêng bạn để trả về một string chứa biểu diễn Python tạo ra đối tượng. Ở đây tôi định nghĩa hàm đó cho lớp trên

In [0]:
class BetterClass(object):
  def __init__(self, x, y):
    self.x = x
    self.y = y

  def __repr__(self):
    return "BetterClass(%d, %d)" % (self.x, self.y)

Bây giờ giá trị ```repr``` hữu dụng hơn rất nhiều

In [0]:
obj = BetterClass(1, 2)
print(obj)

BetterClass(1, 2)


Khi bạn không có quyền điều khiển đối với định nghĩa của lớp, bạn có thể lấy ra tự điển gắn với đối tượng, thông qua thuộc tính ```__dict__```. Ở đây tôi in ra nội dung của hiện thực ```OpaqueClass```

In [0]:
obj = OpaqueClass(4, 5)
print(obj.__dict__)

{'x': 4, 'y': 5}


### Những điều cần nhớ


*   Gọi hàm ```print``` trên các kiểu có sẵn của Python tạo ra các phiên bản string đọc được bởi con người, làm ẩn đi thông tin.
*   Gọi ```repr``` trên các kiểu Python có sẵn sẽ tạo ra phiên bản có thể in được của một giá trị. Các chuỗi ```repr``` có thể được truyền vào hàm có sẵn ```eval``` để lấy về giá trị ban đầu.
* ```%s``` trong các chuỗi định dạng sẽ tạo ra các chuỗi có thể đọc được như ```str.%s``` sẽ tạo ra các chuỗi có thể in được như ```repr```
* Bạn có thể định nghĩa phương thức ```__repr__``` để tuỳ chỉnh biểu diễn có thể in được của một lớp và cung cấp thông tin debug một cách chi tiết
* Bạn có thể lấy được thông tin nội tại của một đối tượng thông qua thuộc tính ```__dict__```



## Kiểm tra (Test) mọi thứ với ```unittest```

Python không có kiểm tra kiểu tĩnh. Không có một thứ gì trong trình thông dịch của Python sẽ đảm bảo rằng chương trình của bạn sẽ hoạt động khi bạn chạy nó. Với Python bạn không biết rằng các hàm mà chương trình của bạn gọi sẽ được định nghĩa tại runtime, ngay cả khi có sự tồn tại của mã nguồn của chúng. Cư xử động này là một phước lành và cũng là một nguyền rủa. 

Một số lượng lớn lập trình viên Python nói rằng điều đó là đáng bởi vì sự hiệu năng đạt được từ sự tinh gọn và đơn giản. Hầu hết mọi người đều nghe câu chuyện về các lỗi ngu ngốc xảy ra tại runtime. 

Một trong số các ví dụ tệ nhất tôi nghe được đó là một lỗi ```SyntaxError``` xảy ra trong sản phẩm được release (in production) như là một hiệu ứng phụ của một import động.

Tôi tự hỏi, tại sao đoạn mã không được kiểm tra trước khi chương trình không được kiểm tra trước khi nó được triển kahi ra bên ngoài? An toàn kiểu (Type safety) không phải là mọi thứ. Bạn nên luôn luôn kiểm tra mã của bạn, bất kể ngôn ngữ được viết là gì. Tuy nhiên tôi thừa nhận rằng sự khác biệt lớn nhất giữa Python và các ngôn ngữ khác đó là cách duy nhất để có được bất cứ sự tin tưởng trong chương trình Python của bạn đó là viết các mã kiểm tra (writing tests). Kiểm tra kiểu động không phải lúc nào cũng làm bạn cảm thấy an toàn.

May mắn thay, các đặc đinh động mà ngăn kiểm tra kiểu tĩnh trong Python còn làm cho ta dễ dàng viết tests cho code. Bạn có thể sử dụng các đặc tính động và các cư xử dễ dàng có thể ghi đè để triển khai các mã kiểm tra và đảm bảo rằng chương trình của bạn sẽ hoạt động như mong đợi. 

Bạn nên nghĩ về các đoạn tests như là một chính sách bảo hiểm cho code của bạn. Các đoạn mã kiểm tra tết giúp bạn tự tin hơn rằng code của bạn đúng. Nếu bạn cấu trúc lại hay mở rộng code của bạn, các tests giúp cho bạn dễ dàng nhận dạng các hành vi nào đã thay đổi. Điều nói trên nghe như phản trực giác, nhưng có các đoạn mã kiểm tra tốt làm cho bạn dễ dàng sửa đổi code của mình hơn, không phải khó hơn. 

Cách đơn giản nhất để viết các tests là sử dụng module có sẵn ```unittest```. Ví dụ bạn có hàm tiện ích sau

In [0]:
#utils.py
def to_str(data):
  if isinstance(data, str):
    return data
  elif isinstance(data, bytes):
    return data.decode('utf-8')
  else:
    raise TypeError("Must supply str or bytes, found: %r" %data)

Để định nghĩa các tests, tôi tạo một file thứ hai được đặt tên là ```test_utils.py``` hoặc ```utils_test.py``` chứa các tests cho mỗi hành vi tôi mong đợi

In [0]:
#utils_test.py
from unittest import TestCase, main 
from utils import to_str 

class UtilsTestCase(TestCase):
  def test_to_str_bytes(self):
    self.assertEqual('hello', to_str(b"hello"))

  def test_to_str_str(self):
    self.assertEqual('hello', to_str("hello"))

  def test_to_str_bad(self):
    self.assertRaises(TypeError, to_str, object())

if __name__ == '__main__':
  main()

In [2]:
!python utils_test.py

...
----------------------------------------------------------------------
Ran 3 tests in 0.001s

OK


Các mã kiểm tra được tổ chức trong các lớp ```TestCase```. Mỗi test là một phương thức bắt đầu với từ ```test```. Nếu một phương thức test chạy mà không gây ra bất cứ kiểu ngoại lệ ```Exception``` (bao gồm cả ```AssertionError``` từ các câu ```assert```), khi đó mã kiểm tra được xem như là đã vượt qua thành công.

Lớp ```TestCase``` cung cấp các hàm trợ giúp cho việc tạo ra các xác nhận hay quả quyết (assertition) trong các mã kiểm tra của bạn, ví dụ như ```assertEqual``` cho việc thẩm định sự bằng nhau, ```assertTrue``` cho việc thẩm định các biểu diễn Boolean, và ```assertRaises``` cho việc thẩm định các ngoại lệ được khởi lên khi hợp lý (xem ```help(TestCase)``` để có thêm thông tin). Bạn có thể định nghĩa các phương thức trợ giúp trong các lớp con của ```TestCase``` để làm cho đoạn mã kiểm tra của bạn dễ đọc hơn; chỉ đảm bảo rằng tên các phương thức của bạn không bắt đầu với từ ```test```.

**Chú ý**: Một cách thức hay dùng trong thực tế đó là sử dụng các hàm mock và các lắp để lấy ra các hành vi cụ thể. Cho mục đích này, Python3 cung cấp module có sẵn ```unittest.mock```.  

Thỉnh thoảng, các lớp ```TestCase``` cần được thiết lập môi trường kiểm tra trước khi thực hiện các phương thức kiểm tra. Để làm điều này, bạn cần ghi đè các phương thức ```setUp``` và ```tearDown```. Các phương thức này được gọi lần lượt trước và sau mỗi phương thức test, và chúng cho phép bạn đảm bảo rằng mỗi test chạy riêng biệt nhau (một điêu quan trọng khi thực hiện các mã test). Ví dụ, tôi định nghĩa một ```TestCase``` tạo ra một thư mục tạm thời trước mỗi mã kiểm tra và xoá đi các nội dụng của nó sau khi đã kiểm tra xong:

In [4]:
class MyTest(TestCase):
  def setUp(self):
    self.test_dir = TemporaryDirectory()
  
  def tearDown(self):
    self.test_dir.cleanup()

NameError: ignored

Tôi thường định nghĩa một ```TestCase``` cho mỗi tập hợp các tests liên quan. Thỉnh thoảng tôi có một ```TestCase``` cho mỗi hàm mà có nhiều trường hợp sử dụng khác nhau. Những lần khác, một ```TestCase``` dàn tất cả các hàm trong một module riêng lẻ. Tôi cũng tạo một ```TestCase``` cho việc kiểm tra một lớp đơn và tất cả các phương thức của nó. 

Khi các chương trình trở nên phức tạp, bạn sẽ muốn có thêm các mã tests để thẩm định việc tương tác giữa các modules của bạn, thay vì việc chỉ kiểm tra mã biệt lập. Đó là sự kahcs biệt giữa các kiểm tra đơn vị (unit tests) và kiểm tra tích hợp (integration tests). Trong Python, hai kiểu tests trên đều quan trọng cho đúng một lý do: Bạn không lấy gì là đảm bảo các moduels của bạn sẽ thực sự hoạt động cùng nhau cho đến khi bạn chứng minh nó. 

**Chú ý**
Phụ thuộc vào dự án của bạn, có thể hữu dụng để định nghĩa các mã kiểm tra hướng dữ liệu (data-driven tests) hay tổ chức các mã kiểm tra thành các phần khác nhau cho các tính năng liên quan. Phục vụ cho các mục đích này, các báo cáo liên quan tới bao phủ code, và các trường hợp nâng cao, ```nose``` (https://nose.readthedocs.io/en/latest/) và ```pytest``` (http://pytest.org/en/latest/) có thể đặc biệt hữu ích. 

### Những điểu cần nhớ


*  Cách duy nhất để có được sự tin tưởng trong chương trình Python của bạn là viết các mã kiểm tra
*  Module có sẵn ```unittest``` cung cấp các tính năng bạn sẽ cần để viết các mã kiểm tra tốt
* Bạn có thể định nghĩa các mã kiểm tra thông qua việc tạo ra các lớp con của ```TestCase``` và định nghĩa một phương thức cho mỗi hành vị bạn muốn kiểm tra. Các phương thức kiểm tra của các lớp ```TestCase``` phải bắt đầu với từ ```test```.
* Viết cả mã kiểm tra đơn vị cho các tính năng riêng biệt và các mã kiểm tra tích hợp cho các modules giao tiếp với nhau đều quan trọng. 

