# Iterable, Iterator, Generator

# Iterable

Trong Python, iterable là một đối tượng có thể được lặp lại, có thể là một danh sách, một bộ, một chuỗi hoặc bất kỳ đối tượng nào có thể được lặp lại bằng cách sử dụng vòng lặp for. Các đối tượng iterable có thể được chuyển đổi thành iterator bằng cách sử dụng hàm iter().

In [1]:
my_list = [1, 2, 3]
for item in my_list:
    print(item)


1
2
3


Trong ví dụ trên, my_list là một đối tượng iterable và for lặp lại các phần tử của nó một cách tuần tự.

# Iterator

Iterator là một đối tượng cho phép lặp lại các phần tử của một đối tượng iterable. Iterator giữ các thông tin về trạng thái hiện tại của một lần lặp và xác định phần tử tiếp theo được lặp lại. Các iterator được tạo bằng cách sử dụng hàm iter() và sử dụng hàm next() để lấy các giá trị tiếp theo.

In [2]:
my_list = [1, 2, 3]
my_iterator = iter(my_list)
print(next(my_iterator)) # 1
print(next(my_iterator)) # 2
print(next(my_iterator)) # 3


1
2
3


Trong ví dụ trên, my_iterator là một iterator được tạo từ my_list. Hàm next() được sử dụng để lấy các giá trị tiếp theo của iterator.

## Các ứng dụng của iterator trong Python bao gồm:

1. Xử lý dữ liệu lớn: Iterator cho phép xử lý các tập dữ liệu lớn mà không cần lưu trữ toàn bộ dữ liệu trong bộ nhớ.

2. Xử lý dữ liệu trực tiếp từ file: Với iterator, chúng ta có thể xử lý dữ liệu trực tiếp từ một file mà không cần đọc toàn bộ nó vào bộ nhớ.

3. Lập trình song song: Iterator có thể được sử dụng để xử lý các tập dữ liệu song song trong các hệ thống phân tán.

4. Xử lý các chuỗi vô hạn: Iterator cho phép tạo các chuỗi vô hạn, giúp giải quyết các vấn đề liên quan đến các chuỗi số lớn hoặc vô hạn.

In [11]:
# Đọc dữ liệu từ file theo dòng:

with open('data.txt', 'r') as f:
    for line in iter(f.readline, ''):
        print(line)

line 1 trong file data.txt

line 2 trong file data.txt

line 3 trong file data.txt


In [20]:
# Xử lý tập dữ liệu lớn:
def read_data(filename):
    with open(filename, 'r') as f:
        for line in f:
            yield line.strip()

# large_file có thể là một file có cả triệu gigabytes
data = read_data('large_file.txt')
for line in data:
    print(line)

Xá»­ lÃ½ táº­p dá»¯ liá»‡u lá»›n > 30,000,000 line
Xá»­ lÃ½ táº­p dá»¯ liá»‡u lá»›n > 30,000,000 line
Xá»­ lÃ½ táº­p dá»¯ liá»‡u lá»›n > 30,000,000 line


In [14]:
# Tạo chuỗi vô hạn:

def fibonacci():
    a, b = 0, 1
    while True:
        yield a
        a, b = b, a + b

for i, fib in enumerate(fibonacci()):
    if i > 10:
        break
    print(fib)

0
1
1
2
3
5
8
13
21
34
55


- Triển khai Iterator in class

In [19]:
class MyIterator:
    def __init__(self, start, end):
        self.current = start
        self.end = end

    def __iter__(self):
        return self

    def __next__(self):
        if self.current < self.end:
            value = self.current
            self.current += 1
            return value
        else:
            raise StopIteration

my_iterator = MyIterator(0, 5)
for value in my_iterator:
    print(value)


0
1
2
3
4


Trong Python, __iter__() là một method đặc biệt được sử dụng để tạo ra một iterable object. Nó được định nghĩa trong một class và trả về một iterator. Phương thức này thường được sử dụng để định nghĩa một iterator cho một class.

Cụ thể, khi một đối tượng được tạo ra từ một class có phương thức __iter__(), nó trở thành một iterable object. Khi gọi hàm __iter__(), nó trả về một iterator object, và khi gọi hàm __next__() trên iterator object này, nó sẽ trả về giá trị kế tiếp trong sequence của iterable object.

# Generator

Generator là một loại hàm đặc biệt trong Python, cho phép tạo ra các giá trị một cách lười biếng (lazy). Generator sử dụng từ khóa yield để trả về giá trị và lưu trữ trạng thái hiện tại của hàm. Các generator có thể được lặp lại bằng cách sử dụng vòng lặp for.

In [3]:
def my_generator():
    yield 1
    yield 2
    yield 3

for item in my_generator():
    print(item)


1
2
3


Trong ví dụ trên, my_generator là một generator trả về các giá trị 1, 2 và 3. Các giá trị được trả về một cách lười biếng bởi từ khóa yield. Vòng lặp for được sử dụng để lặp lại các giá trị của generator.

# Các ứng dụng của generator trong Python bao gồm:

1. Tạo danh sách vô hạn các giá trị: Các generator có thể được sử dụng để tạo ra một chuỗi giá trị vô hạn mà không cần phải tạo tất cả các giá trị đó trong bộ nhớ. Ví dụ: tạo một generator cho các số nguyên dương lẻ vô hạn:

In [15]:
def odd_numbers():
    i = 1
    while True:
        yield i
        i += 2

# sử dụng generator để in ra 10 số lẻ đầu tiên
gen = odd_numbers()
for i in range(10):
    print(next(gen))

1
3
5
7
9
11
13
15
17
19


2. Xử lý dữ liệu lớn: Khi xử lý các tập dữ liệu lớn, sử dụng generator có thể giúp tránh tình trạng tràn bộ nhớ bằng cách chỉ xử lý từng phần dữ liệu một thay vì tải toàn bộ dữ liệu lên bộ nhớ.

3. Xử lý các tập dữ liệu vô hạn: Các generator cho phép xử lý các tập dữ liệu vô hạn hoặc có thể tạo ra các giá trị theo yêu cầu. Ví dụ: các tập dữ liệu đến từ nguồn trực tuyến như các dữ liệu đang được cập nhật liên tục.

4. Tạo các giá trị phức tạp: Các generator có thể được sử dụng để tạo ra các giá trị phức tạp bằng cách kết hợp nhiều đầu vào hoặc sử dụng các giá trị ngẫu nhiên để tạo ra các giá trị mới. Ví dụ: tạo một generator cho các số Fibonacci vô hạn.

In [16]:
def fibonacci():
    a, b = 0, 1
    while True:
        yield a
        a, b = b, a + b

# sử dụng generator để in ra 10 số Fibonacci đầu tiên
gen = fibonacci()
for i in range(10):
    print(next(gen))


0
1
1
2
3
5
8
13
21
34


5. Tối ưu hóa hiệu suất: Sử dụng generator có thể giúp tối ưu hóa hiệu suất của chương trình bằng cách giảm thiểu việc tạo ra các đối tượng và thực hiện các phép tính trên đối tượng đó. Thay vào đó, generator chỉ tạo ra các giá trị khi cần thiết và thực hiện các phép tính trên giá trị đó.

Summary:
- Iterable là một đối tượng có thể được lặp lại (loop) qua mỗi phần tử trong đó bằng cách sử dụng vòng lặp, ví dụ như list, tuple, dictionary, set, string,...

- Iterator là một đối tượng cho phép duyệt qua các phần tử của một iterable. Khi duyệt qua iterator, nó sẽ giữ vị trí của phần tử tiếp theo và trả về phần tử tiếp theo mỗi lần gọi hàm next(). Iterator không thể lặp lại nhiều lần qua các phần tử, chỉ có thể lặp lại một lần.

- Generator là một cách để tạo ra các giá trị trong một chuỗi một cách linh hoạt hơn. Nó giống như một hàm, nhưng sẽ không trả về giá trị ngay lập tức mà sẽ trả về một iterator có thể lặp lại nhiều lần để lấy các giá trị. Generator sử dụng từ khóa yield để trả về giá trị, và khi gặp yield trong generator, nó sẽ tạm dừng và giữ lại trạng thái để có thể tiếp tục chạy từ điểm tạm dừng đó khi gọi next() tiếp theo.

In [6]:
# VD: iterable
my_list = [1, 2, 3, 4]
for i in my_list:
    print(i)

1
2
3
4


In [7]:
# VD: iterator
my_list = [1, 2, 3, 4]
my_iterator = iter(my_list)
print(next(my_iterator))
print(next(my_iterator))


1
2


In [8]:


# Vd: generator
def my_generator():
    yield 1
    yield 2
    yield 3

my_gen = my_generator()
print(next(my_gen))
print(next(my_gen))


1
2
