##  Ітератори, генератори, ітераторні функції

Ітератор - це об'єкт що дозволяє обходити всі елементи колекції. Прикладами таких колекцій в python є списки, кортежи(tuple), сети і словники. Для того, щоб реалізувати ітератор в python, необхідно щоб реалізація цієї структури мала імплементацію таких методів як `__iter__`, `__next__`. Розглянемо наступний приклад:

In [2]:
my_list = [4, 5, 0]

# типове використання ітератора
for el in my_list:
    print(el)

4
5
0


В python ми можемо використати функцію `next()` для отримання наступного елементу в послідовності

In [8]:
iterator = iter(my_list)

# маємо аналогічний результат
print(next(iterator))
print(next(iterator))
print(next(iterator))

4
5
0


Ітератори також можливо використовувати в циклах, де необхідно передати ітеруємий об'єкт на вхід

In [9]:
iterator = iter(my_list)

for el in iterator:
    print(el)

4
5
0


Приклад реалізації ітеруємого об'єкту

In [37]:
import datetime

class Dairy:

    def __init__(self):
        self._notes = []
        self._index = 0

    def add_note(self, text) -> None:
        # додаємо елементи в список з вказанням часу
        self._notes.append({
            "time": datetime.datetime.now().strftime("%d/%m/%Y, %H:%M"),
            "text": text
        })

    def __iter__(self):
        # будьте уважними, якщо не вказати індекс 0, то після першого використання цього класу (наприклад в циклі)
        # ітератор не буде виводи ніяких даних
        self._index = 0
        return self

    def __next__(self):
        if self._index < len (self._notes):
            item = self._notes[self._index]
            self._index += 1
            return item
        else:
            # StopIteration зазвичай підіймається (raise) подається у випадку закінчення проходження ітератору для його зупинки
            # якщо не вказати явно, то ітерація буде бе
            raise StopIteration

my_dairy = Dairy()
my_dairy.add_note("Мій перший запис у щоденичок")
my_dairy.add_note("Ділюся своїми враженнями за сьогоднішній день")


for el in my_dairy:
    print(el)



{'time': '03/10/2023, 11:59', 'text': 'Мій перший запис у щоденичок'}
{'time': '03/10/2023, 11:59', 'text': 'Ділюся своїми враженнями за сьогоднішній день'}


Подивитися більш поширені способи використання ітераторів можна [тут](https://realpython.com/python-iterators-iterables/)

### list comprehension
В python існує зручний інструмент для роботи зі списками - list comprehension, який дозволяє мінімізувати написання коду. Нижче вказані два приклади які дають одий і той же результат - створити новий список зі списку фруктів, в яких присутня літера `a`. і елементи нового списку мають бути прописними (записані з великої літери)

In [49]:
fruits = ["яблуко", "банан", "вишня", "кавун", "черешня"]
newlist = []

for x in fruits:
    # Літера 'а' з кирилиці
    if "а" in x:
        newlist.append(x.upper())

print(newlist)

# використовуючи list comprehension

fruits = ["яблуко", "банан", "вишня", "кавун", "черешня"]
# Розгянемо вираз нижче - для кожного елементу х в списку fruits - (for x in fruits) повертаємо значення (x.upper()) якщо виконується умова (if "а" in x).
# З цих елементів формується новий список []
newlist = [x.upper() for x in fruits if "а" in x]

print(newlist)


['БАНАН', 'КАВУН']
['БАНАН', 'КАВУН']


## Генератори
[Генератори](https://peps.python.org/pep-0255/) - це функція, яка може надавати (yield) значення при виклику декілька разів замість того, щоб повертати його лише один раз. Це виглядає як звичайна функція, за винятком того, що вона містить вирази `yield` для створення серії значень, які можна використовувати в циклі for або які можна отримати по одному за допомогою функції next().

В Python генератор — це функція, яка повертає ітератор, який створює послідовність значень під час її ітерації. Генератори корисні, коли ми хочемо створити велику послідовність значень, але ми не хочемо зберігати всі їх у пам’яті одночасно. Це може бути корисно для обробки великої послідовності даних.

В Python зазвичай використовується термін генератор для спільного позначення двох окремих понять: **функції генератора** та **ітератора-генератора**. Функція генератора — це функція, яку ви визначаєте за допомогою оператора yield. Ітератор-генератор це те що ця функція повертає.

Ниже вказаний приклад функції розрахунку послідовності Фібоначі за допомогою генератора


In [59]:
def fib(n):
    a, b = 0, 1
    for _ in range(n):
        yield a
        a, b = b, a + b

list(fib(10))

[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

Окрім написання функцій генератора, python дозволяє написання однорядкових виразів-генераторів.

In [39]:
#  list comprehension
print([item for item in [1, 2, 3, 4]])

# однорядковий вираз-генератор
print((item for item in [1, 2, 3, 4]))

[1, 2, 3, 4]
<generator object <genexpr> at 0x7f2101a2a330>
1
2
3
4


### Переваги генераторів

1. Простота в реалізації. Навідміну від ітераторів, для генератора не потрібно реалізовувати спеціальний клас з методами `__iter__` і `__next__`. Достатьно лише функції або однорядкового виразу

In [64]:
def PowTwoGen(max=0):
    n = 0
    while n < max:
        yield 2 ** n
        n += 1


2. Ресурсоефективність. Використання генераторів дозволяє економити пам'ять. При звичайній обробці вся структура завантажується в пам'ять. Використання генераторів дозволяє обробляти елементи по одному, цим самим економить пам'ять.
3. Представляють нескінченний потік. Генератори є чудовим середовищем для представлення нескінченного потоку даних. Нескінченні потоки не можна зберігати в пам'яті, і оскільки генератори створюють лише один елемент за раз, вони можуть представляти нескінченний потік даних.

In [65]:
def all_even():
    n = 0
    while True:
        yield n
        n += 2

4. Конвеєрні генератори або пайплайни

Кілька генераторів можна використовувати для конвеєрної серії операцій. Найкраще це можна проілюструвати на прикладі.

Припустімо, що у нас є генератор, який створює числа в ряді Фібоначчі. І у нас є інший генератор для зведення чисел у квадрат.

Якщо ми хочемо дізнатися суму квадратів чисел у ряді Фібоначчі, ми можемо зробити це в такий спосіб, об’єднавши разом вихідні дані генераторних функцій.


In [66]:
def fib(nums):
    x, y = 0, 1
    for _ in range(nums):
        x, y = y, x+y
        yield x

def square(nums):
    for num in nums:
        yield num**2

print(sum(square(fib(10))))

4895


## Вбудовані функції
Мова python пропонує безліч допоміжних засобів прямо "з коробки", які значно полегчують типові задачі

#### .reverse() і reversed()

В python існує функція обходу послідовної структури даних в зворотному порядку, навіть дві) Перша з них це `.reserve()`

In [86]:
digits = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

digits.reverse()
digits

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

Інша це `reversed()`


In [87]:
rev_digits = reversed(digits)
print(rev_digits)
print(list(rev_digits))

<list_reverseiterator object at 0x7f20ddf125f0>
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


Основна відмінність в тому, що `reverse()` модифікує існуючу зміну, а `reversed()` створює копію

`any(iterable)` - повертає True, якщо будь-який елемент iterable є true. Якщо iterable порожній, повертає False. Еквівалентно наступному

In [88]:
def any(iterable):
    for element in iterable:
        if element:
            return True
    return False

`all(iterable)` - Повертає True, якщо всі елементи iterable є true (або якщо iterable порожній). Еквівалентно наступному

In [89]:
def all(iterable):
    for element in iterable:
        if not element:
            return False
    return True

`enumerate(iterable, start=0)` - Повертає об'єкт перерахування. iterable має бути послідовністю, ітератором або іншим об’єктом, який підтримує ітерацію. Метод __next__() ітератора, який повертає enumerate(), повертає кортеж, що містить лічильник (від початку, який за замовчуванням дорівнює 0) і значення, отримані в результаті ітерації над iterable. Приклад використання:

In [90]:
seasons = ["Весна", "Літо", "Осінь", "Зима"]
list(enumerate(seasons))

[(0, 'Весна'), (1, 'Літо'), (2, 'Осінь'), (3, 'Зима')]

`max()`, `min()` - повертає найбільше або найменше значення. Аргументами функції можуть бути як декілька перерахованих через кому значень, або обьект типу iтератора. В разі несумісності порівнюємих типів поверне помилку `ValueError`

In [95]:
print(max(10, 22, 33))
print(min([10, 22, 17]))

33
10


`sum(iterable, start=0)` - функція для сумування чисел. Для додавання рядків, більш доцільним інструментом буде використання конструкції `''.join(sequence)`. Також в якості 2 аргументу можливо початкове число до якого будуть додані результати проходу по ітеруємому об'єкту

In [96]:
sum((1, 22, 33), 100)

156

 `zip(iterable, iterable)` - функція для паралельної ітерації одночасно двух ітераторів. На виході функції буде кортеж (tuple) об`єднення цих двух об'єтів ітерації.

In [2]:
print(list(zip(range(3), ['Перший','Другий','Третій',])))

## алфавіт в зворотньому порядку
abc = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']
print(list(zip(reversed(range(1, 27)), reversed(abc))))

# об'єднання списків міст України та кількості населення
print(list(zip(range(1,4), ("Київ", "Харків", "Одеса"), (2967360, 1443207 , 1017699))))

[(0, 'Перший'), (1, 'Другий'), (2, 'Третій')]
[(26, 'z'), (25, 'y'), (24, 'x'), (23, 'w'), (22, 'v'), (21, 'u'), (20, 't'), (19, 's'), (18, 'r'), (17, 'q'), (16, 'p'), (15, 'o'), (14, 'n'), (13, 'm'), (12, 'l'), (11, 'k'), (10, 'j'), (9, 'i'), (8, 'h'), (7, 'g'), (6, 'f'), (5, 'e'), (4, 'd'), (3, 'c'), (2, 'b'), (1, 'a')]
[(1, 'Київ', 2967360), (2, 'Харків', 1443207), (3, 'Одеса', 1017699)]


## Ітераратори і ітеруємі об'єкти

Про ітератори було сказано вище вже багато. Розглянемо тепер що таке ітеруємі об'єкти. Чисті ітеровані об’єкти зазвичай містять дані самі. Наприклад, вбудовані типи контейнерів Python, такі як списки, кортежі, словники та набори, є об’єктами, які можна повторювати. Вони забезпечують потік даних. Python очікує ітеровані об’єкти у кількох різних контекстах, найважливішим з яких є цикл for. Ітерації також очікуються в операціях розпакування та у вбудованих функціях, таких як `all()`, `any()`, `enumerate()`, `max()`, `min()`, `len()`, `zip()`, `sum()`, `map()` і `filter()` (про дві останні функції в наступному блокноті).

 Ітеруємі об'єкти мають метод `.__iter__()`, який створює елементи на вимогу. Ітератори реалізують метод `.__iter__()`, який зазвичай повертає `self`, і метод `.__next__()`, який повертає елемент під час кожного виклику. Відповідно до цієї внутрішньої структури можна зробити висновок, що всі ітератори є ітерованими, оскільки вони відповідають ітераційному протоколу. Однак не всі ітератори є ітераторами — **лише ті, що реалізують метод `.__next__()`.

In [3]:
# Перевірка перевірки чи є об'єкт ітеруємим
def it(ob):
  try:
      iter(ob)
      return True
  except TypeError:
      return False

for i in [34, [4, 5], (4, 5), {"a":4}, "dfsdf", 4.5]:
    print(i,"ітеруємий:",it(i))


34 ітеруємий: False
[4, 5] ітеруємий: True
(4, 5) ітеруємий: True
{'a': 4} ітеруємий: True
dfsdf ітеруємий: True
4.5 ітеруємий: False


In [7]:
next("олло")


TypeError: 'str' object is not an iterator

In [9]:
s="олло"
s=iter(s)
print(s)
print(next(s))
print(next(s))
print(next(s))
print(next(s))

<str_iterator object at 0x7fcd881c5ba0>
о
л
л
о


### Рекомендації до перегляду
[https://realpython.com/python-iterators-iterables/#working-with-iterables-in-python](https://realpython.com/python-iterators-iterables/#working-with-iterables-in-python)

[https://realpython.com/python-zip-function](https://realpython.com/python-zip-function/)

[https://docs.python.org/3/library/functions.html](https://docs.python.org/3/library/functions.html)


## Практичі завдання
1. Реалізувати структури даних стек, яка може бути ітеруємою
2. Напишіть функцію, яка приймає список чисел та повертає генератор, що містить лише парні числа.
3. Напишіть функцію, яка об'єднує два списки в один і повертає генератор для ітерації цими об'єднаними значеннями.
4. Напишіть функцію, яка приймає список та повертає генератор без дублікатів.
5. Напишіть генератор, який зчитує рядки з текстового файлу один за одним і друкує їх.
6. Напишіть генератор, який читає файл CSV і видає словники, що представляють кожен рядок.
