<a href="https://colab.research.google.com/github/vuduclyunitn/learning_python/blob/master/S%C3%A1ch_Effective_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Dịch từ sách Effective Python 59 specific ways to write better Python. Tác giả: Brett Slatkin

## Nên sử dụng ```enumerate``` thay vì ```range```

Hàm có sẵn ```range``` hữu dụng cho các vòng lặp qua một tập hợp các số **nguyên**

In [4]:
from random import randint
random_bits = 0
for i in range(64):
  if randint(0, 1):
    random_bits |= 1 << i
    print(random_bits)

2
6
14
30
286
798
1822
3870
36638
167710
429854
954142
2002718
4099870
8294174
25071390
58625822
192843550
461279006
998149918
3145633566
7440600862
16030535454
33210404638
170649358110
445527265054
995283078942
3194306334494
11990399356702
29582585401118
64766957489950
135135701667614
416610678378270
979560631799582
2105460538642206
11112659793383198
29127058302865182
317357434454576926
1470278939061423902
3776121948275117854
8387807966702505758
17611180003557281566


Khi bạn cần lặp qua một cấu trúc dữ liệu như là danh sách của các chuỗi văn bản, bạn có thể lặp trực tiếp qua danh sách này.

In [5]:
flavor_list = ["vanilla", "chocolate", "pecan", "strawberry"]
for flavor in flavor_list:
  print("%s is delicious" % flavor)

vanilla is delicious
chocolate is delicious
pecan is delicious
strawberry is delicious


Thông thường, bạn muốn lặp qua một danh sách và bạn muốn biết được chỉ số (index) của phần tử hiện thời trong danh sách. Ví dụ, bạn muốn in ra xếp hạng của các món kem yêu thích của mình. Có một cách để làm điều này là sử dụng ```range```.

In [7]:
for i in range(len(flavor_list)):
  flavor = flavor_list[i]
  print("%d: %s" % (i+1, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


Đoạn mã trên nhìn không được gọn cho lắm, so với các vòng lặp được thực hiện trên ```flavor_list``` hay dùng ```range```. Bạn phải lấy ra kích thước của danh sách. Bạn phải dùng chỉ số để lấy ra phần tử. Điều này làm cho đoạn code khó đọc.


Python cung cấp một hàm có sẵn ```enumerate``` để giải quyết vấn đề này. ```enumerate``` bao bất cứ iterator nào với một generator. Generator này tạo ra các cặp chỉ số và giá trị từ iterator. Đoạn mã dưới đây nhìn sáng sủa hơn nhiều

In [8]:
for i, flavor in enumerate(flavor_list):
  print("%d: %s" % (i + 1, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


Bạn còn có thể làm cho đoạn code trên gọn hơn nữa khi chỉ định cho ```enumerate``` bắt đầu từ một giá trị nào đó (1 trong trường hợp dưới đây)

In [11]:
for i, flavor in enumerate(flavor_list, 1):
  print("%d: %s" % (i, flavor))

1: vanilla
2: chocolate
3: pecan
4: strawberry


### Nhứng điều cần nhớ


*   ```enumerate``` cung cấp một cú pháp tinh gọn giúp lặp qua một iterator và lấy ra chỉ số của mỗi phần tử tương ứng.
*   Nên sử dụng ```enumerate``` thay vì lặp sử dụng ```range``` và dùng chỉ số để lấy phần tử.
* Bạn có thể cung cấp một tham số thứ 2 chỉ định số bắt đầu được đếm cho chỉ số (mặc định là 0)



## Sử dụng ```zip``` để xử lý các iterators song song

Thông thường bạn làm việc với nhiều danh sách của các đối tượng liên quan. Sử dụng list comprehension cho phép ta nhận một danh sách nguồn và lấy về một danh sách đã qua xử lý. Như ví dụ dưới đây

In [0]:
names = ["Cecilia", "Lise", "Marie"]
letters = [len(n) for n in names]

Các phần tử trong danh sách mới có liên quan với các phần tử trong danh sách gốc thông qua các chỉ số của nó. Để lặp qua hai danh sách này song song, bạn có thể lặp qua chiều dài của danh sách gốc, lấy chiều dài của mỗi phần tử trong danh sách gốc thông qua danh sách mới với một chỉ số.

In [13]:
longest_name = None
max_letters = 0

for i in range(len(names)):
  count = letters[i]
  if count > max_letters:
    longest_name = names[i]
    max_letters = count

print(longest_name)

Cecilia


Vấn đề ở đây đó là vòng lặp phía trên nhìn rối. Các chỉ số của ```names``` và ```letters``` làm cho code khó đọc. Ta dùng chỉ số ```i``` tới hai lần. Sử dụng ```enumerate``` có thể cải thiện vấn đề một chút, nhưng nó vẫn không phải là một giải pháp tốt.

In [0]:
for i, name in enumerate(names):
  count = letters[i]
  if count > max_letters:
    longest_name = name 
    max_letters = count

Để làm cho đoạn mã sáng sủa hơn, Python cung cấp hàm có sẵn ```zip```. Trong Python 3, ```zip``` bao hai hay nhiều iterators với một generator. ```zip``` sinh ra các tuples chứa giá trị tiếp theo từ mỗi iterator. Đoạn mã dưới đây nhìn gọn hơn rất nhiều so với việc dùng chỉ số với nhiều danh sách

In [15]:
for name, count in zip(names, letters):
  if count > max_letters:
    longest_name = name
    max_letters = count 

print(longest_name)

Cecilia


Có hai vấn đề với hàm có sẵn ```zip```. Vấn đề đầu tiên đó là trong Python 2 ```zip``` không phải là một generator; nó sẽ chiếm hết các iterators được cung cấp và trả về một danh sách các tuples nó tạo. Điều này có thể làm cho nó sử dụng rất nhiều bộ nhớ và làm cho trương chình crash. Nếu bạn muốn ```zip``` các iterators rất lớn trong Python 2, bạn nên sử dụng ```izip``` từ module có sẵn ```itertools```  

Vấn đề thứ hai đó là trong trường hợp các iterators đầu vào có chiều dài khác nhau ```zip``` cư xử một cách lạ lùng. Ví dụ, bạn thêm một tên khác vào danh sách phía trên nhưng quên cập nhật danh sách chứa kích số lượng các kí tự. Khi bạn chạy ```zip``` trên hai danh sách đầu vào này, kết quả sẽ không như mong đợi.

In [16]:
names.append("Rosalind")
for name, count in zip(names, letters):
  print(name)

Cecilia
Lise
Marie


Phần tử mới thêm vào 'Rosalind' không được in ra. Đó là cách ```zip``` làm việc. Nó duy trì xuất ra các tuples cho đến khi iterator bên trong cạn kiệt. Cách tiếp cận này hoạt động tốt khi bạn biết rằng các iterators có cùng một chiều dài, điều thường thấy đối với các danh sách được tạo bởi list comprehensions. Trong nhiều trường hợp khác, cách cư xử thông qua việc cắt bớt các phần tử của ```zip``` gây ngạc nhiên và tệ. Nếu bạn không tự tin về chiều dài của các danh sách bạn muốn zip chúng, ví như không chắc rằng các danh sách này bằng nhau, hãy xem xét sử dụng hàm ```zip_longest``` từ thư viện ```itertools```

In [18]:
from itertools import zip_longest

names.append("Rosalind")
for name, count in zip_longest(names, letters):
  print(name, count)

Cecilia 7
Lise 4
Marie 5
Rosalind None
Rosalind None
Rosalind None


Ở ví dụ trên ta thấy rằng các phần tử mới vẫn được in ra, nhưng nếu ta không cập nhật danh sách đếm số lượng kí tự thì giá trị đó sẽ là None. 

### Các thứ cần nhớ


*   Hàm có sẵn ```zip``` có thể được sử dụng để lặp qua nhiều iterators song song.

*   Trong Python 3, ```zip``` là một generator tạo ra các tuples. Trong Python 2, ```zip``` trả về một danh sách đầy đủ các tuples.

* ```zip``` cắt bỏ kết quả một cách thầm lặng nếu bạn cung cấp các iterators với chiều dài khác nhau. 

* Hàm ```zip_longest``` từ module có sẵn ```itertools``` cho phép bạn lặp qua nhiều iterators khác nhau song song bất kể kích thước của chúng thế nào. 

