# Генераторы 

В Python создавать собственные итераторы можно намного проще с помощью генераторов, которые делятся на два типа:

- функции генераторы
- выражения генератор

### Функции генераторы

Функция генератор – это функция, которая возвращает итератор.

Она выглядит как обычная функция, за исключением того, что использует выражение **yield**, а не return.

In [1]:
# генератор, возвращающий итератор от числа а до числа b

In [2]:
# более удобная запись
def gen_numbers(a,b):
    for i in range(a,b+1):
        yield i

In [3]:
print(*gen_numbers(5,10))  # ведёт себя как обычный итератор

5 6 7 8 9 10


In [4]:
# то же, но вручную

class IteratorNumbers:
    
    def __init__(self, a, b):
        self.a = a
        self.b = b
    def __iter__(self):
        return self
    def __next__(self):
        if self.a>self.b:
            raise StopIteration
        else:
            self.a += 1
            return self.a - 1

In [5]:
iterator_3 = IteratorNumbers(1,3)

In [6]:
print(*iterator_3)

1 2 3


*Функция генератор сохраняет локальные переменные от вызова к вызову. Это своего рода возобновляемая функция.*

In [7]:
generator_3 = gen_numbers(1,3)

In [12]:
next(generator_3)

StopIteration: 

### Функции генераторы с побочными действиями

In [13]:
def gen_event(n):
    n = n+n%2
    print('start')
    yield n
    while True:
        print('следующее чётное: ', end='')
        n += 2
        print(n)
        yield n

In [14]:
gen_event_1 = gen_event(1)

In [31]:
next(gen_event_1)

следующее чётное: 34


34

### Особенности генераторов

- return останавливает функцию, возбуждая StopIteration
- любая функция с yield - функция-генератор
- генератор - это итератор, поэтому ведёт себя подобающе

### Конструкция yield from

In [None]:
def get_data():
    for num in range(5):
        yield num
    for char in 'ABC':
        yield char

In [None]:
print(*get_data())

In [None]:
# можно переписать в виде

In [None]:
def get_data():
    yield from range(5)
    yield from ('ABC')

In [None]:
print(*get_data())

In [None]:
# кроме того можно создавать вложенные генераторы

In [None]:
def generator1():
    yield from ('ABC')
def generator2():
    yield from ('abc')
    
def generator12():
    yield from generator1()
    yield 100
    yield from generator2()

In [None]:
print(*generator12())

### Выражения генераторы

In [None]:
# более компактная запись простых генераторов
generator_numbers = (i for i in range(10,101,10))

In [None]:
print(*generator_numbers)

In [None]:
# скобки можно опускать в функциях

print(sum(i*i for i in range(10)))          # передача без скобок
print(sum((i*i for i in range(10))))        # передача со скобками

In [None]:
generator_letters = (s for s  in 'HELLO')

In [None]:
next(generator_letters)

*Генераторные выражения могут использоваться в качестве альтернативы использования функций map(), filter()*

### Конввейеры генераторов

Конвейеры генераторов (generator pipelines) в Python позволяют обрабатывать данные поэтапно с помощью цепочки генераторов. Это удобно, когда необходимо выполнить несколько последовательных операций над данными, и при этом обработка должна происходить "на лету", без загрузки всех данных в память. Основное преимущество конвейеров генераторов - это экономия памяти и повышение производительности при работе с большими наборами данных.

In [None]:
def double(iterable):
    yield from iterable

In [None]:
def negative(iterable):
    for el in iterable:
        yield -el

In [None]:
def plus_one(iterable):
    for el in iterable:
        yield el+1

In [None]:
data = [1,10,20,300,500,1000]

In [None]:
print(*plus_one(negative(double(data)))) # важна последовательность обработки

In [None]:
print(*negative(plus_one(double(data))))  

### Обработка больших файлов

In [None]:
# создадим большой файл

import random

def create_large_file(file_path, num_lines):
    words = ["привет","пока","мячик","школа","институт","важно","апельсин","журнал","кот"]
    with open(file_path, 'w', encoding='utf-8') as f:
        for _ in range(num_lines):
            line = " ".join(random.choices(words, k=2)) + "\n"
            f.write(line)

# Создаем файл с 10 000 строк
create_large_file('bigfile.txt', 10000)

In [None]:
# Генератор для построчного чтения файла
def read_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        for line in file:
            yield line

# Генератор для фильтрации строк
def filter_lines(lines, keyword):
    for line in lines:
        if keyword in line:
            yield line

# Генератор для преобразования строк
def transform_lines(lines):
    for line in lines:
        yield line.upper()

In [None]:
# Объединяем все генераторы в конвейер
def process_file(file_path, keyword):
    lines = read_file(file_path)
    filtered_lines = filter_lines(lines, keyword)
    transformed_lines = transform_lines(filtered_lines)
    return transformed_lines

In [None]:
# Использование конвейера для обработки файла
file_path = 'bigfile.txt'
keyword = 'важно'

pipeline = process_file(file_path, keyword)

In [None]:
for i,line in enumerate(pipeline):
    print(line)
    if i>5:
        break