- Kỹ thuật tiện lợi nhất để tạo iterators trong Python là sử dụng generators.

- Generator được thực hiện với cú pháp giống với hàm truyền thống, nhưng thay vì trả các giá trị (return values), thì generator sẽ sử dụng câu lệnh "yield" để chỉ rõ mỗi phần tử của chuỗi.

Ví dụ: Bài toán xác định tất cả các thừa số của một số nguyên dương:

- Nếu sử dụng hàm truyền thống: (thường trả về một list chứa tất cả các thừa số)

In [1]:
def factors(n):                 # traditional function that computes factors
    results = []                # store factors in a new list
    for k in range(1, n + 1): 
        if n % k == 0:          # divides evenly, thus k is a factor
            results.append(k)   # add k to the list of factors
    
    return results              # return the entire list

- Nếu sử dụng generator thì sẽ trông như sau: 

In [2]:
def factors(n):                 # generator that computes factors
    for k in range(1, n + 1): 
        if n % k == 0:          # divides evenly, thus k is a factor
            yield k             # yield this factor as next result

Nhận xét và so sánh hai hàm trên: Nếu sử dụng generator thì sẽ cô đọng và gọn gàng hơn so với hàm truyền thống, không phải tạo list và lưu giá trị vào bộ nhớ.

Ta không thể kết hợp hai câu lệnh yield và return trong cùng một hàm được, ngoại trừ câu lệnh return với đối số 0 để dừng sự thực thi của generator.

Nếu ta viết một vòng lặp: for factor in factors(100): một instance của generator ở trên sẽ được tạo ra. Tại mỗi bước lặp của vòng lặp, Python sẽ thực thi procedure (các câu lệnh trong thân vòng lặp) cho đến khi một câu lệnh "yield" chỉ ra giá trị tiếp theo. Tại thời điểm đó, procedure sẽ tạm thời bị gián đoạn (tạm dừng), và sẽ chỉ tiếp tục khi giá trị tiếp theo được yêu cầu. Khi dòng thực thi đi đến cuối thủ tục (hoặc câu lệnh return 0) thì ngoại lệ "StopIteration" sẽ được sinh tự động. 

Ta có thể dùng nhiều câu lệnh "yield" trong generator (đây có thể coi là một lợi thế nữa so với câu lệnh return), và chuỗi được tạo ra sẽ theo đúng thứ tự tự nhiên của câu lệnh "yield" đó. 

Ví dụ: Ta có thể cải thiện sự hiệu quả của hàm generator dùng để tính ước số ở trên bằng cách chỉ kiểm tra các giá trị lớn đến căn bậc hai của số đó, và thêm một câu lệnh yield để trả về ước số đối xứng với ước số tìm được qua căn bậc hai.

In [4]:
def factors(n):               # generator that computes factors
    k = 1
    while k * k < n:          # while k < sqrt(n)
        if n % k == 0: 
            yield k 
            yield n // k 
        k += 1
    if k * k == n:            # special case if n is perfect square. 
        yield k 

Giải thích đoạn code ở trên: Ta biết rằng số ước số nhỏ hơn sqrt(n) bằng với số ước số lớn hơn sqrt(n), vì thế nếu n = km, thì cả k và n đều là ước số của n, và một số nhỏ hơn sqrt(n), một số lớn hơn sqrt(n). Vì vậy ta chỉ cần lặp đến sqrt(n), và nếu k là ước của n thì n // k cũng là ước của n. Trường hợp đặc biệt là n là số chính phương, khi đó ta sẽ chỉ có một câu lệnh yield k thôi, vì n // k cũng bằng chính k, và vì nó là trường hợp cuối cùng nên ta sẽ tách nó ra một câu lệnh riêng để thực thi.

Chú ý: các ước số của generator ở trên sẽ không được tạo ra theo thứ tự tăng dần. 

Lấy ví dụ với 100, thì factors(100) sẽ tạo ra dãy 1, 100, 2, 50, 4, 25, 5, 20, 10. 

In [5]:
factors(100)

<generator object factors at 0x0000022382C08BA0>

Ngoài lề tí: Với ý tưởng của generator factors ở trên, thì ta có thể viết một hàm kiểm tra một số n có là số chính phương không, mà không sử dụng các hàm có sẵn, chỉ sử dụng 4 phép toán cơ bản là cộng, trừ, nhân, chia.

In [6]:
def perfectSquare(n): 
    k = 2 
    while k * k < n: 
        k += 1
    
    if k * k == n: 
        return '%d là số chính phương' % (n)
    
    return '%d không là số chính phương' % (n)

In [7]:
perfectSquare(100)

'100 là số chính phương'

In [8]:
perfectSquare(20)

'20 không là số chính phương'

Tương tự, ta có thể viết một hàm để kiểm tra số n có là số nguyên tố hay không mà chỉ sử dụng bốn phép toán cơ bản.

In [9]:
def primeNumber(n): 
    k = 2
    while k * k <= n: 
        if n % k == 0: 
            return '%d không là số nguyên tố' % (n)
        k += 1
    
    return '%d là số nguyên tố' % (n)

In [10]:
primeNumber(100)

'100 không là số nguyên tố'

In [11]:
primeNumber(50)

'50 không là số nguyên tố'

In [12]:
primeNumber(23)

'23 là số nguyên tố'

In [16]:
primeNumber(831)

'831 không là số nguyên tố'

- Lợi ích khi sử dụng generator thay vì hàm truyền thống: các kết quả sẽ chỉ được tính nếu được yêu cầu, và toàn bộ series không cần phải lưu ở trong bộ nhớ cùng một lúc

Hơn nữa, generator có thể tạo ra một dãy vô hạn các giá trị. Nếu so sánh với việc dùng list thì cách làm này trông phức tạp hơn nhiều. 

Ví dụ: tạo dãy số Fibonacci vô hạn:

In [17]:
def fibonacci(): 
    a = 0 
    b = 1
    while True:            # keep going...
        yield a            # report value, a, during this pass 
        future = a + b 
        a = b              # this will be next value reported
        b = future         # and subsequently this 

## Vấn đề ứng dụng: Kết hợp Generator với Iterator

Một hàm đơn giản để có thể lấy được các giá trị trong generator:

In [1]:
def simpleGeneratorFun(): 
    yield 1 
    yield 2 
    yield 3

In [2]:
for value in simpleGeneratorFun(): 
    print(value)

1
2
3


Ta đã biết là hàm generator trả vè một generator object, khi đó ta có thể sử dụng generator object bằng hai cách: sử dụng gene object trong một vòng lặp for (như ở ví dụ trên) hoặc gọi method lên gene object.

Ví dụ về gọi method lên gene object:

In [3]:
def simpleGeneratorFun(): 
    yield 1 
    yield 2 
    yield 3

In [5]:
x = simpleGeneratorFun()  # x is generator object. 

In [9]:
next(x)

1

In [10]:
print(next(x))

2


In [11]:
print(next(x))

3


In [12]:
print(next(x))  # hết phần tử => raise StopIteration. 

StopIteration: 

=> Một hàm generator trả về một generator object mà có thể lặp được (iterable), và vì thế có thể được sử dụng như là một Iterator. .

Ví dụ 2: Dãy Fibonacci có giới hạn.

In [18]:
def Fibonacci(limit): 
    a, b = 0, 1
    
    while a < limit: 
        yield a 
        a, b = b, a + b 
        

In [19]:
x = Fibonacci(5)  # create generator object.

In [20]:
for value in x: 
    print(value)

0
1
1
2
3


In [22]:
print(next(x))   # khi đã lặp hết giá trị thì giá trị tiêp theo sẽ là StopIteration.

StopIteration: 

Applications : Suppose we to create a stream of Fibonacci numbers, adopting the generator approach makes it trivial; we just have to call next(x) to get the next Fibonacci number without bothering about where or when the stream of numbers ends.
A more practical type of stream processing is handling large data files such as log files. Generators provide a space efficient method for such data processing as only parts of the file are handled at one given point in time. We can also use Iterators for these purposes, but Generator provides a quick way (We don’t need to write __next__ and __iter__ methods here).