# Summary 12

### Итераторы

Итератор - это объект, который предоставляет последовательный доступ к элементам коллекции или последовательности. 

Итераторы позволяют последовательно обходить элементы коллекции (например, списка, словаря, множества) без необходимости знать внутреннюю структуру этой коллекции. В Python итераторы реализуют два основных методода `__iter__()` и `__next__()`.

* `__iter__()`  возвращает сам итератор
* `__next__()` возвращает следующий элемент в последовательности
  
Метод `__next__()` вызывается при каждой итерации, чтобы получить следующий элемент


In [None]:
lst.__len__()

In [None]:
len(lst)

In [None]:
lst.__iter__()

In [None]:
iter(lst)

Python предоставляет встроенные итераторы для многих типов данных, таких как списки, строки, словари и т.д.

In [44]:
# Итерация по списку
my_list = [1, 2, 3, 4]
iterator = iter(my_list)  # Получаем итератор
print(next(iterator))  # 1
print(next(iterator))  # 2
print(next(iterator))  # 3
print(next(iterator))  # 4
# print(next(iterator))  # Вызовет StopIteration, так как элементы закончились

1
2
3
4


In [45]:
print(next(iterator))

StopIteration: 

In [46]:
# Итерации по строке
my_string = "hello"
iterator = iter(my_string)
print(next(iterator))  # 'h'
print(next(iterator))  # 'e'
print(next(iterator))  # 'l'

h
e
l


In [47]:
print(next(iterator))

l


In [48]:
print(next(iterator))

o


In [49]:
print(next(iterator))

StopIteration: 

***Итераторы полезны для работы с большими или бесконечными последовательностями данных, так как они генерируют элементы "на лету" и не хранят всю коллекцию в памяти.***

Когда использовать итераторы:

* Когда нужно работать с большими или бесконечными последовательностями.
* Когда вы хотите создать собственный способ обхода данных.
* Когда нужно экономить память, избегая хранения всей коллекции в памяти.

### Как на самом деле работает цикл for:

Цикл for в Python основан на использовании итераторов. Когда цикл for выполняется, он вызывает метод iter() для получения итератора от итерируемого объекта, а затем повторяет вызов метода `__next__()` для получения следующего элемента до тех пор, пока итератор не исчерпается.


In [50]:
my_list = [1, 2, 3]
for item in my_list:
    print(item)


1
2
3


Реализация "ручками" цикл for

In [51]:
iterator = iter(my_list)
while True:
    try:
        print(next(iterator))
    except StopIteration:
        break

1
2
3


Так что даже казалось бы знакомый нам цикл for работает через итераторы (потому и принимает на вход iterable). Но, мегакруто, что можем определить методы `__iter__` и `__next__` у чего угодно, и потом можно проходить по нему for.


In [None]:
# Вспомним OrderedDict

### Как в словаре вывести первую пару с помощью итератора?

In [52]:
my_dict = {'a': 1, 'b': 2, 'c': 3}

# Получаем итератор для словаря
dict_iterator = iter(my_dict.items())

# Получаем первую пару ключ-значение
first_pair = next(dict_iterator)

# Выводим первую пару
print(first_pair)


('a', 1)


In [53]:
my_dict.pop('a')
print(my_dict)

{'b': 2, 'c': 3}


### Генераторы

это функции, которые возвращают последовательность значений, сохраняя при этом свое состояние между вызовами

Пример: Генератор, который возвращает числа от 0 до N:

In [54]:
def simple_generator(n):
    for i in range(n):
        yield i  # Приостанавливает выполнение и возвращает значение

# Использование генератора
gen = simple_generator(5)
for value in gen:
    print(value)

0
1
2
3
4


In [55]:
# Пример: Бесконечный генератор
def infinite_generator():
    num = 0
    while True:
        yield num
        num += 1

# Использование генератора
gen = infinite_generator()
print(next(gen))  # 0
print(next(gen))  # 1
print(next(gen))  # 2
# И так далее...

0
1
2


In [56]:
print(next(gen))

3


In [67]:
print(next(gen))

14


***yield*** это ключевое слово, которое используется в генераторах для определения значений, которые будут возвращены при каждом вызове метода `__next__()`.


In [68]:
def my_generator():
    yield 1
    yield 2
    yield 3

gen = my_generator()
print(next(gen))  # Выводит 1
print(next(gen))  # Выводит 2
print(next(gen))  # Выводит 3


1
2
3


In [69]:
print(next(gen))

StopIteration: 

In [70]:
def generator_with_return():
    yield 1
    yield 2
    return "Стоп"  # Завершает генератор и возвращает значение

gen = generator_with_return()
print(next(gen))  # 1
print(next(gen))  # 2
try:
    print(next(gen))  # Вызовет StopIteration
except StopIteration as e:
    print(f"Generator returned: {e.value}")  # Возвращает: Стоп

1
2
Generator returned: Стоп


### Генераторные выражения


 Генераторные выражения по аналогии со списковыми включениями:
 
Генераторные выражения - это компактный способ создания генераторов в Python, используя синтаксис списковых включений. Они позволяют создавать генераторы без явного определения функции с ключевым словом yield.



In [71]:
my_generator = (x for x in range(10))
for item in my_generator:
    print(item)

0
1
2
3
4
5
6
7
8
9


🤓Плюс перед list comprehensions: генераторные выражения не записывают все элементы в память! Соответственно, если мы только итерируемся по какому-то list comprehension, подумайте, а не заменить ли его на генераторное выражение?

In [None]:
[x for x in range(10)] #list comprehantion (списковые включения)

In [None]:
# ПРИМЕР: Перед нами задача: на сервере есть огромный журнал событий log.txt, в котором хранятся сведения о работе какой-то системы за год.
#Из него нужно выбрать и обработать для статистики данные об ошибках — строки, содержащие слово error.

In [None]:
#Такие строки можно выбрать и сохранить в памяти с помощью списка:
with open(path + "\log.txt", "r") as log_file:
     err_list = [st for st in log_file if "error" in st]

В списке err_list содержатся все строки со словом error, они записаны в память компьютера. Теперь их можно обработать в цикле. Недостаток метода в том, что, если таких строк будет слишком много, они переполнят память и вызовут ошибку MemoryError.

Переполнения памяти можно избежать, если организовать поточную обработку данных с использованием объекта-генератора. Мы создадим его с помощью генераторного выражения (оно отличается от генератора списка только круглыми скобками).

In [None]:
with open("path\log.txt", "r") as log_file:
     err_gen = (st for st in log_file if "error" in st)
     for item in err_gen:
         #<обработка строки item>
         #print(item)

In [72]:
lst = [char for char in input() if char.islower()]

 SFGBoknfgbSDFGjndafijnaDFGadfg


In [73]:
lst

['o',
 'k',
 'n',
 'f',
 'g',
 'b',
 'j',
 'n',
 'd',
 'a',
 'f',
 'i',
 'j',
 'n',
 'a',
 'a',
 'd',
 'f',
 'g']

In [74]:
lst_gen = (char for char in input() if char.islower())

 SFGBoknfgbSDFGjndafijnaDFGadfg


In [75]:
print(lst_gen)

<generator object <genexpr> at 0x0000023344271A40>


In [95]:
print(next(lst_gen))

StopIteration: 

Этот метод не вызывает переполнения, так как в каждый момент времени в памяти находится только одна строка. При этом нужный для работы объём памяти не зависит от размера файла и количества строк, удовлетворяющих условию.

В Python итерируемый объект (iterable) — это любой объект, который можно использовать в цикле for, но он не обязательно является итератором. Итерируемый объект должен реализовать метод `__iter__()`, который возвращает итератор. Сам итерируемый объект не имеет метода `__next__()`, поэтому он не может самостоятельно перебирать элементы.

Пример итерируемого объекта, который не является итератором:

Список — это классический пример итерируемого объекта, который не является итератором. У списка есть метод `__iter__()`, который возвращает итератор, но сам список не имеет метода `__next__()`.

In [None]:
my_list = [1, 2, 3, 4]

# Проверяем, что список является итерируемым объектом
print(hasattr(my_list, '__iter__'))  # True

# Проверяем, что список не является итератором
print(hasattr(my_list, '__next__'))  # False

# Получаем итератор из списка
iterator = iter(my_list)
print(next(iterator))  # 1
print(next(iterator))  # 2

In [None]:
my_string = "hello"
print(hasattr(my_string, '__iter__'))  # True
print(hasattr(my_string, '__next__'))  # False

In [97]:
itr = iter(my_string)
print(next(itr))

h


### Отличия итератора, генератора и итерируемого объекта:
- Итератор - это объект, который реализует методы `__iter__()` и `__next__()`, позволяющие последовательно обходить элементы.
- Генератор - это функция, которая использует ключевое слово yield для возврата значений, сохраняя при этом свое состояние между вызовами.
- Итерируемый объект - это объект, который может быть использован в цикле for. Он возвращает итератор при вызове функции iter().


### Модуль itertools

Модуль itertools предоставляет набор функций для работы с итерируемыми объектами. Одна из полезных функций - islice, которая позволяет создавать итераторы, представляющие собой срезы исходного итерируемого объекта.


In [98]:
import itertools

my_list = [1, 2, 3, 4, 5]
my_iterator = itertools.islice(my_list, 1, 4)
for item in my_iterator:
    print(item)  # Выводит 2, 3, 4


2
3
4


In [99]:
import itertools
colors = ['red', 'green', 'blue']
sizes = ['s','m','l']
for color, size in itertools.product(colors,sizes):
   print(color,size)

red s
red m
red l
green s
green m
green l
blue s
blue m
blue l


In [100]:
lst = [1,2,3]
for item in itertools.permutations(lst):
    print(item)

(1, 2, 3)
(1, 3, 2)
(2, 1, 3)
(2, 3, 1)
(3, 1, 2)
(3, 2, 1)


## Генераторы

### Использование throw и close в генераторах. Исключение GeneratorExit

Генераторы могут использовать методы throw и close для взаимодействия с внешним кодом. Метод throw позволяет вызвать исключение внутри генератора, а метод close приводит к завершению генератора, вызывая исключение GeneratorExit. Это может быть полезным для корректной очистки ресурсов или для управления выполнением генератора.

Пример 1: Использование метода throw

Метод throw позволяет выбросить исключение в генератор. Генератор может перехватить это исключение и обработать его.

In [102]:
def throw_example():
    print("Генератор начал работу")
    try:
        yield 1
        yield 2
        yield 3
    except ValueError as e:
        print(f"Перехвачено исключение: {e}")
    finally:
        print("Генератор завершил работу")

# Создаем генератор
gen = throw_example()

# Получаем первое значение
print(next(gen))  # Выводит: Генератор начал работу и 1

# Выбрасываем исключение в генератор
gen.throw(ValueError("Ошибка!"))  # Выводит: Перехвачено исключение: Ошибка! и Генератор завершил работу


Генератор начал работу
1
Перехвачено исключение: Ошибка!
Генератор завершил работу


StopIteration: 

In [103]:
def throw_example():
    print("Генератор начал работу")
    try:
        yield 1
        yield 2
        yield 3
    except ValueError as e:
        print(f"Перехвачено исключение: {e}")
    finally:
        print("Генератор завершил работу")

# Создаем генератор
gen = throw_example()

# Получаем первое значение
print(next(gen))  # Выводит: Генератор начал работу и 1

# Выбрасываем исключение в генератор
#gen.throw(ValueError("Ошибка!"))  # Выводит: Перехвачено исключение: Ошибка! и Генератор завершил работу

Генератор начал работу
1


In [104]:
print(next(gen))

2


In [105]:
print(next(gen))

3


In [106]:
print(next(gen))

Генератор завершил работу


StopIteration: 

Пример 2: Использование метода close

Метод close позволяет завершить работу генератора. Генератор может выполнить очистку или другие завершающие действия в блоке finally.

In [107]:
def close_example():
    print("Генератор начал работу")
    try:
        yield 1
        yield 2
        yield 3
    finally:
        print("Генератор завершил работу")

# Создаем генератор
gen = close_example()

# Получаем первое значение
print(next(gen))  # Выводит: Генератор начал работу и 1

# Закрываем генератор
gen.close()  # Выводит: Генератор завершил работу

# Пытаемся получить следующее значение
print(next(gen))  # Выбрасывает StopIteration


Генератор начал работу
1
Генератор завершил работу


StopIteration: 

In [108]:
def close_example():
    print("Генератор начал работу")
    try:
        yield 1
        yield 2
        yield 3
    finally:
        print("Генератор завершил работу")

# Создаем генератор
gen = close_example()

# Получаем первое значение
print(next(gen))  # Выводит: Генератор начал работу и 1

# Закрываем генератор
gen.close()  # Выводит: Генератор завершил работу

# Пытаемся получить следующее значение
#print(next(gen))  # Выбрасывает StopIteration

Генератор начал работу
1
Генератор завершил работу


### Генератор с бесконечным циклом внутри:
Генераторы могут иметь бесконечные циклы внутри, что позволяет создавать последовательности, которые не имеют конечного количества элементов. Например, генератор может генерировать бесконечную последовательность чисел Фибоначчи или бесконечный поток данных.

In [109]:
def infinite_generator():
    value = 0
    while True:
        yield value
        value += 1

# Создаем генератор
gen = infinite_generator()

# Получаем первые несколько значений
for _ in range(5):
    print(next(gen))


0
1
2
3
4


### Передача значений в генератор. Инструкции next и send:
Значения можно передавать в генератор с помощью инструкций next и send.
* Метод send возвращает следующее значение из генератора и одновременно передает значение внутрь генератора.
* Метод next также возвращает следующее значение, но не принимает никаких аргументов.


In [110]:
def my_generator():
    received_value = yield 1
    yield received_value + 1

gen = my_generator()

In [111]:
print(next(gen))
print(gen.send(10))

1
11


In [112]:
def simple_generator():
    value = yield
    while True:
        value = yield value * 2

# Создаем генератор
gen = simple_generator()

# Инициализируем генератор
next(gen)  # Генератор ждет значение

# Передаем значение в генератор с помощью send
print(gen.send(10))  
print(gen.send(5))  
print(gen.send(3))  


20
10
6


In [113]:
def multi_yield_generator():
    value = yield
    while True:
        value = yield value * 2
        value = yield value * 3

# Создаем генератор
gen = multi_yield_generator()

# Инициализируем генератор
next(gen)  # Генератор ждет первое значение

# Передаем первое значение
print(gen.send(5))  

# Передаем второе значение
print(gen.send(10))  

# Передаем третье значение
print(gen.send(3))   

# Передаем четвертое значение
print(gen.send(6))   


10
30
6
18


In [None]:
def interactive_generator():
    print("Генератор начал работу")
    value = yield "Ожидание значения"
    print(f"Получено значение: {value}")
    value = yield value * 2
    print(f"Получено значение: {value}")
    value = yield value * 3
    print(f"Получено значение: {value}")
    yield "Генератор завершил работу"

# Создаем генератор
gen = interactive_generator()

# Инициализируем генератор
print(next(gen))  # Выводит: Генератор начал работу и Ожидание значения

# Передаем значение в генератор с помощью send
print(gen.send(10)) 

# Передаем следующее значение
print(gen.send(20))  

# Передаем последнее значение
print(gen.send(60))  

# Пытаемся получить следующее значение (генератор уже завершил работу)
try:
    print(next(gen))
except StopIteration:
    print("Генератор завершил работу")

### Использование субгенераторов. Инструкция yield from:
Генераторы могут использовать субгенераторы для делегирования работы. Ключевое слово yield from позволяет упростить синтаксис итерации по субгенераторам и передачу значений между ними.

Конструкция yield from:

* yield from используется для делегирования генерации значений другому генератору или итерируемому объекту.
* В данном случае yield from будет поочередно возвращать каждый символ из строки, полученной после применения join.

In [None]:
def nested_generator():
    yield from [1, 2, 3]

gen = nested_generator()

print(next(gen))  # Выводит: 1
print(next(gen))  # Выводит: 2
print(next(gen))  # Выводит: 3

In [None]:
def show_letters(some_str):
	yield from ''.join([letter for letter in some_str if letter.isalpha()])
 
 
random_str = show_letters('A!sdf 09 _ w')
print(next(random_str))
print(next(random_str))


In [114]:
def sub_generator():
    yield 'Sub generator'
    yield 'Completed sub generator'

def main_generator():
    yield 'Main generator'
    yield from sub_generator()
    yield 'Completed main generator'

gen = main_generator()
for item in gen:
    print(item) # next(gen)

Main generator
Sub generator
Completed sub generator
Completed main generator


### Решение задач

1. Напишите генератор, который принимает на вход поток элементов и выдает только уникальные элементы, сохраняя их порядок встречаемости (для уже повторяющихся элементов генератор не выдает ничего)

In [115]:
def unique_elements(stream):
    seen = set()
    for item in stream:
        if item not in seen:
            seen.add(item)
            yield item

input_stream = [1, 2, 3, 1, 2, 4, 5, 3, 6]
unique_stream = unique_elements(input_stream)

for unique_item in unique_stream:
    print(unique_item)

1
2
3
4
5
6


### ДЗ 24

1. Напишите генератор, который будет принимать на вход числа и возвращать их сумму. 
Генератор должен использовать инструкцию yield для возврата текущей суммы и должен продолжать принимать новые числа для добавления к сумме. 
Если генератор получает на вход число 0, он должен прекращать работу и вернуть окончательную сумму. 
Напишите программу, которая будет использовать этот генератор для пошагового расчета суммы чисел, вводимых пользователем

Пример вывода:

Введите числа для суммирования (0 для окончания):

Введите число: 3
Текущая сумма: 3
Введите число: 5
Текущая сумма: 8
Введите число: 2
Текущая сумма: 10
Введите число: 0
Текущая сумма: 10


In [116]:
def sum_gen():
    s = 0
    while True:
        curr = yield s
        s += curr

gen = sum_gen()
next(gen)
while True:
    n = int(input('Введите число: '))
    if n == 0:
        break
    print(f'Текущая сумма: {gen.send(n)}')

Введите число:  1


Текущая сумма: 1


Введите число:  2


Текущая сумма: 3


Введите число:  4


Текущая сумма: 7


Введите число:  0


2. Напишите генератор, который будет генерировать арифметическую прогрессию

In [None]:
start = 1 diff = 3

In [None]:
1, 4, 7

In [117]:
def seq_gen(start, diff):
    a = start
    while True:
        yield a
        a += diff

gen = seq_gen(1,3)
for i in range(10):
    print(next(gen))

1
4
7
10
13
16
19
22
25
28
