# ЧТО ТАКОЕ ИТЕРАТОР

**Итератор(iter)** - специальный объект Python, который выдает свои элементы по одному за раз.

**iter(obj)** - функция, возвращающая итератор по итерируемому объекту obj

Если итератор передать во встроенную функцию **next()**, то эта функция вернет его следующий элемент. При этом сам итератор также сдвинется на следующий элемент. При следующем вызове функция next() вернет следующий элемент и т.д.

Если же в итераторе элементов больше не осталось, то вызов функции next() приведет к возбуждению **исключения StopIteration**, а сам итератор становится совершенно бесполезным, так как **опустошен.**


In [None]:
numbers = [1, 2, 3]

iterator = iter(numbers)          # создаем итератор на основе списка

print(next(iterator))             # запрашиваем и печатаем первый элемент итератора
print(next(iterator))             # запрашиваем и печатаем второй элемент итератора
print(next(iterator))             # запрашиваем и печатаем третий элемент итератора

#print(next(iterator))             # возбуждается исключение StopIteration


**next(my_iter, value)** - переход на следующий элемент итератора my_iter. value - необязательный параметр, который который будет возвращен вместо возбуждения исключения StopIteration, если в итераторе больше не осталось элементов.

**Что можно делать с итератором:**

*   последовательно обходить с помощью цикла for
*   проверять вхождение элемента с помощью оператора принадлежности in
*   распаковывать содержимое итератора, автоматически опустошая его.
*   преобразовывать в коллекцию list(), tuple() и тд

**ВАЖНО:** все эти действия с итератором можно провести один раз, дальше он пустой




In [None]:
#цикл for
numbers = [-3, 6, 1, -90, 34, -25, 23, -21]

positive_numbers = map(abs, numbers)     # создаем объект итератора

for num in positive_numbers:             # обходим итератор циклом for
    print(num, end=' ')

3 6 1 90 34 25 23 21 

In [None]:
#оператор принадлежности in
numbers = [4, 8, 15, 16, 23, 42]
iterator = iter(numbers)              # создаем итератор на основе списка

# оператор in за кулисами вызывает функцию next() для получения следующего элемента, поэтому он постепенно опустошается
print(15 in iterator)
print(15 in iterator) #поскольку как только элемент 15 обнаружен, поиск прекращается, и в итераторе остается три числа: 16, 23, 42

In [None]:
#распаковка итератора
numbers = [4, 8, 15, 16, 23, 42]

iterator = iter(numbers)              # создаем итератор на основе списка

print(*iterator)
print(list(iterator))

In [None]:
#преобразование в коллекцию
numbers = [-3, 6, 1, -90, 34, -25, 23, -21]

positive_numbers = map(abs, numbers)                 # создаем объект итератора

print(list(positive_numbers)) # преобразуем итератор в список
print(list(positive_numbers)) #повторное преобразование уже опустошонного итератора

[3, 6, 1, 90, 34, 25, 23, 21]
[]


**Что нельзя делать с итератором:**
*   получить длину len()
*   получить элемент по индексу
*   использовать срезы
*   пользоваться print() без распаковки



**Плюсы использования итераторов:**
* однотипность работы с объектами разных типов
* ленивые вычисления и экономия потребляемой памяти
* комбинация множества итераторов для создания понятной и читабельной программы

In [None]:
from sys import getsizeof
#ленивые вычисления с итераторами предполагают, что не нужно ничего делать до тех пор, пока в этом нет необходимости
#что позволяет экономить память и время на вычисление.

#объект range имеет все свойства iter. range не хранит в себе весь набор чисел, поэтому все объекты range имеют один и тот же размер — 48 байт.
#такой подход позволяет создавать "большие" итераторы (даже бесконечные), не занимая много места.

numbers1 = range(5)                  # 5 чисел в последовательности
numbers2 = range(100000)             # 100000 чисел в последовательности

print(getsizeof(numbers1))
print(getsizeof(numbers2))

#мы можем преобразовать любой итерируемый объект в список, однако при этом  все элементы итерируемого объекта будут записаны в память.
#для очень больших итераторов может возникнуть исключение MemoryError

print(getsizeof(list(numbers1)))
print(getsizeof(list(numbers2)))

In [None]:
#комбинация множества итераторов
sentence = 'In the face of ambiguity refuse the temptation to guess'

filter_iterator = filter(lambda word: len(word) > 4, sentence.split())   # фильтруем
map_iterator = map(lambda word: word.upper(), filter_iterator)           # преобразовываем
enumerate_iterator = enumerate(map_iterator, 1)                          # нумеруем

for index, value in enumerate_iterator:                                  # выводим
    print(f'{index}. {value}')

# все три объекта filter_iterator, map_iterator, enumerate_iterator являются итераторами. Они не хранят все данные в памяти, а создают и выдают их по мере того, как их запрашивают.
#т.е при обращении к очередному элементу enumerate_iterator произойдет последовательное обращение сначала к элементу map_iterator, а затем к элементу filter_iterator.

**Особенность функции iter()**

1 вариант ее использования: iter(iterable) -> iterator, это преобразование итерируемого объекта в итератор.

2 вариант ее использования: iter(callable, sentinel) -> iterator,  в этом случае, созданный итератор будет вызывать указанную функцию callable и проверять возвращаемое ею значение на равенство со значением sentinel. Если полученное значение равно sentinel, то возбуждается исключение StopIteration, иначе итератор выдает значение, полученное из функции callable.


In [None]:
#Пример: Итератор random_iterator будет генерировать случайное число от 1 до 10 до тех пор, пока не будет возвращено число 2.
from random import choice

def test_iter():
    values = list(range(1, 11))
    return choice(values)

random_iterator = iter(test_iter, 2)

for num in random_iterator:
    print(num)

In [None]:
#Частый пример использования данной особенности: чтение строк файла до тех пор, пока не будет достигнута строка sentinel(пока строка не окажется пустой).
with open('data.txt') as file:
    for line in iter(file.readline, ''):    # читаем, пока не попадется пустая строка
        # Делаем что-то с line

# СОЗДАНИЕ СОБСТВЕННОГО ИТЕРАТОРА ЧЕРЕЗ КЛАСС

Иногда появляется необходимость  написать свой **собственный итератор** и ленивый итерируемый объект.

Чтобы написать собственный итератор или ленивый итерируемый объект, необходимо определить **классс с магическими методами.**

Класс должен иметь 3 метода:
1. __init__(): конструктор класса, в нем устанавливаются начальные атрибуты создаваемого объекта
2. __iter__(): метод, который возвращает ссылку на сам итератор для поддержания протокола итератора
3. __next__(): метод, который обеспечивает выдачу очередного элемента.
Параметр self является ссылкой на конкретный экземпляр класса.

In [None]:
#Пример 1: собственный итератор, генерирующий целые числа от start до end
class Counter:
    def __init__(self, start, end):
      self.start = start
      self.end = end

    def __iter__(self):
      return self

    def __next__(self):
      if self.start < self.end:
        self.start += 1
        return self.start - 1
      else:
        raise StopIteration

counter1 = Counter(3, 10)         # создаем итератор Counter, генерирующий числа от 3 до 7
#проходимся по итератору в цикле for, неявно вызывая метод next()
for i in counter1:
    print(i)

counter2 = Counter(100, 103)      # создаем итератор Counter, передавая значения start=100, end=103
print(next(counter2), next(counter2), next(counter2) )   # явно вызываем функцию next()
#print(next(counter2))  #этот вызов next приведет к исключению

In [None]:
#Пример 2: бесконечный итератор Cycle,
#который циклично генерирует последовательность элементов переданного итерируемого объекта obj
class Cycle:
    def __init__(self, obj):
        self.obj = obj
        self.index = 0
    def __iter__(self):
        return self
    def __next__(self):
        self.index += 1
        return self.obj[(self.index - 1) % len(self.obj)]

cycle = Cycle('be')

print(next(cycle))
print(next(cycle))
print(next(cycle))
print(next(cycle))

cycle = Cycle([1])
print(next(cycle) + next(cycle) + next(cycle))


b
e
b
e
3


# СОЗДАНИЕ СОБСТВЕННОГО ИТЕРАТОРА ЧЕРЕЗ ГЕНЕРАТОР

**Функция генератор** – это функция, которая возвращает итератор. Она выглядит как обычная функция, за исключением того, что использует выражение yield, а не return.

**Генератор** – это итератор, который порождает значения, переданные yield. Когда выполнение доходит до конца функции, объект генератор возбуждает исключение StopIteration в полном соответствии с протоколом итератора.

Функция генератор возвращает объект специального типа <class 'generator'>, который реализует протокол итератора, то есть является самым настоящим итератором.


Обычная функция, использующая **return**, при каждом новом вызове функции создает новое пространство имен и новые локальные переменные. Функция генератор, напротив сохраняет локальные переменные от вызова к вызову. Это своего рода возобновляемая функция.

Для ключевого слова **yield** состояние выполнения генератора приостанавливается и локальные переменные сохраняются. При следующем вызове метода генератора \_\_next__() функция возобновляет свое выполнение из той точки, из которой завершила в прошлый раз.(см пример 3)

In [None]:
#Пример 1: функция генератор generate_ints(n),которая порождает последовательность целых чисел [0, n)
def generate_ints(n):
    for num in range(n):
        yield num

my_iter = generate_ints(7)
print(*my_iter)

0 1 2 3 4 5 6


In [None]:
#Пример 2: не обязательно в функции генераторе должен быть цикл
def generate_1234():
    yield 1
    yield 2
    yield 3
    yield 4

g = generate_1234()
print(next(g), next(g), next(g), next(g))
#print(next(g)) #этот вызов next приведет к исключению


1 2 3 4


In [None]:
#Пример 3: циклов может быть несколько
def beegeek():
    for char in 'bee':
        yield char
    for char in 'geek':
        yield char

generator = beegeek()

print(*generator)


In [None]:
#Пример 4: генератор бесконечной последовательности натуральных чисел,
# в которой каждое число встречается столько раз, каково оно: 1,2,2,3,3,3,4,4,4,4,.. и тд
def simple_sequence():
    k = 0
    while True:
        k += 1
        for i in range(k):
            yield k

generator = simple_sequence()
numbers = [next(generator) for _ in range(10)]

print(*numbers)

1 2 2 3 3 3 4 4 4 4


Функция генератор как и обычная функция может не только порождать значения, но и совершать различные побочные действия (print(), write() и тд)

Функция генератора может содержать инструкцию return, которая приводит к возбуждению исключения StopIteration.

In [None]:
def generate_ints():
    yield 1
    yield 2
    return 3
    yield 4

for num in generate_ints():
    print(num) #Обратите внимание на то, что само значение 3 не выводится.

# КОНСТРУКЦИЯ yield from

Конструкция **yield from** это просто сокращенная форма цикла: for item in iterable: yield item


In [None]:
#Т.е. пример 1 и пример 2 это одно и то же

#Пример 1
def get_data():
    for num in range(5):
        yield num
    for char in 'ABC':
        yield char

#Пример 2
def get_data():
    yield from range(5)
    yield from 'ABC'

На самом деле конструкция yield from позволяет вкладывать один генератор в другой, таким образом создавать субгенераторы (вложенные генераторы).

In [1]:
def generator2():
    yield 'Red'
    yield 'Blue'

def generator1():
    yield 'Green'
    yield from generator2()            # запрашиваем значение из субгенератора
    yield 'Yellow'

for color in generator1():
    print(color, end=' ')

Green Red Blue Yellow 

# ГЕНЕРАТОРНЫЕ ВЫРАЖЕНИЯ

Python поддерживает четыре вида генераторов:
* генераторы списков (list comprehension) \
new_list = [выражение for элемент in последовательность if условие]

* генераторы множеств (set comprehension) \
new_set = {выражение for элемент in последовательность if условие}

* генераторы словарей (dict comprehension) \
new_dict = {ключ:значение for (ключ,значение) in dict.items() if условие}

* генераторные выражения (generator expressions) \
new_gen = (выражение for элемент in последовательность if условие)

**Генераторное выражение** это тоже самое, что и генераторная функция, только записанная в одно выражение. Т.е. оно также возвращает генератор, поддерживающий протокол итератора.

Генераторы не загружают весь объем данных в память, так как элементы создаются и обрабатываются по одному.

Если обрабатывается большая структура данных (список, словарь и т.д.) без использования генератора, то она сразу вся загружается в оперативную память, что может занять значительную часть памяти или возбудить исключение MemoryError.

In [None]:
from sys import getsizeof
squares = (i ** 2 for i in range(1, 10000))         # создаем генератор с помощью генераторного выражения
capitals = (s.upper() for s in 'abc')           # создаем генератор с помощью генераторного выражения

print(type(squares)) #тип объекта - генератор
print(getsizeof(squares)) #объем занимаемой памяти
print(getsizeof(capitals))

for char in capitals:
    print(char, end = '' )
print()

print(next(squares), next(squares), next(squares), next(squares), next(squares))

**ВЛОЖЕННЫЕ ГЕНЕРАТОРЫ**

Синтаксиз вложенных генераторов: \
[variable_1 for variable_2 in iterable for variable_1 in variable_2]

In [4]:
#Пример: есть матрица, нужно написать генератор, возвращающий поочередно поочередно все ее элементы

matrix = [[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9],]

#решение через функцию и два вложенных цикла
def matrix_generator(matrix):
  for row in matrix:
    for elem in row:
      yield elem
generator1 = matrix_generator(matrix)

#то же самое решение через генераторное выражение
generator2 = (elem for row in matrix for elem in row)

print(*generator1)
print(*generator2)



1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9


# RANGE