# Лекция 1 

## Итераторы

### Начальный пример

In [1]:
it = reversed("abc")
it

<reversed at 0x10dbcd3c0>

Итератор `it` будет по запросу выдавать буквы из "abcd", начиная с конца.
Когда буквы закончатся, запрос будет выдавать ошибку.

In [2]:
next(it)

'c'

In [3]:
next(it)

'b'

In [4]:
next(it)

'a'

In [5]:
next(it)

StopIteration: 

### Типизация в Питоне

https://en.wikipedia.org/wiki/Duck_test:
- _"If it looks like a duck, swims like a duck, and quacks like a duck, then it probably is a duck."_

https://en.wikipedia.org/wiki/Duck_typing:
- Если объект умеет делать всё, что требуется от итератора, значит это итератор.

### Дополнительные примеры

Открываем наш главный сайт на этот год:
- https://www.python.org

Там выбираем Documentation и Library Reference:
- https://docs.python.org/3/library/index.html

Смотрим описание 'built-in functions':
- https://docs.python.org/3/library/functions.html

Это функции из стандартной библиотеки, которые всегда доступны (нам не нужно их импортировать).

Значительная часть этих функций создаёт или использует итераторы.

In [6]:
it = iter("abc")
it

<str_ascii_iterator at 0x10dce9d20>

In [7]:
next(it)

'a'

In [8]:
next(it)

'b'

In [9]:
next(it)

'c'

In [10]:
next(it)

StopIteration: 

Открытый файл — это итератор по строкам.

In [11]:
file = open("file.txt")
file

<_io.TextIOWrapper name='file.txt' mode='r' encoding='utf-8'>

In [12]:
next(file)

'Первая строка\n'

In [13]:
next(file)

'Вторая строка\n'

In [14]:
next(file)

'Последняя строка\n'

In [15]:
next(file)

StopIteration: 

In [16]:
# для порядка закроем файл
file.close()

### Цикл `for`

Выражение `for __ in __` перебирает выдачу итератора.

In [17]:
it = iter("abc")

for item in it:
    print(item)

a
b
c


### Iterables

Я не знаю, как сказать `Iterable` по-русски. Но итерáбль — это звучит гордо.

Итерáбль — это любой объект, из которого можно сделать итератор.
- строка,
- список,
- множество,
- словарь,
- ...

Если на нём работает функция `iter`, значит это итерáбль (= объект, поддающийся итерации).

In [18]:
my_list = ['a', 'b', 'c']
it = iter(my_list)
next(it)

'a'

Выражение `for __ in __` перебирает выдачу итератора.

Если использовать там не итератор, а что-то другое, то Питон "за кулисами" превращает его в итератор.

In [19]:
for item in "abc":  # = iter("abc")
    print(item)

a
b
c


In [20]:
for item in 3:  # = iter(3)
    print(item)

TypeError: 'int' object is not iterable

### Фильтрация

Итераторы нужны для работы с очень большими данными.
- перебор всех целых чисел от 0 до бесконечности,
- чтение строк очень большого файла (Encyclopedia Britannica),
- ...

Метафора: конвейерная лента на заводе. Лента приносит вам детали. Каждую деталь вы проверяете, бракованные выкидываете, хорошие отправляете по ленте дальше.

In [21]:
# возьмём целые числа от 0 до 99
it = range(0, 100)
# выберем из них те числа, которые делятся на 10 без остатка
it = (num for num in it if num % 10 == 0)

for num in it:
    print(num, end=" ") 

0 10 20 30 40 50 60 70 80 90 

В примере выше мы использовали выражение `num % 10 == 0`. Можно дать этому выражению имя. Для этого определим функцию (функция, которая возвращает `True` или `False`, называется предикатом).

In [22]:
def my_predicate(num):
    return num % 10 == 0

In [23]:
# возьмём целые числа от 0 до 99
it = range(0, 100)
# выберем из них те числа, для которых выполняется наше условие
it = (num for num in it if my_predicate(num))

for num in it:
    print(num, end=" ") 

0 10 20 30 40 50 60 70 80 90 

Другой способ сделать то же самое: функция `filter` из стандартной библиотеки.

In [24]:
# возьмём целые числа от 0 до 99
it = range(0, 100)
# выберем из них те числа, для которых выполняется наше условие
it = filter(my_predicate, it)

for num in it:
    print(num, end=" ") 

0 10 20 30 40 50 60 70 80 90 

### Трансформация

Метафора: конвейерная лента на заводе. Лента приносит вам детали. Каждую деталь вы обрабатываете и передаёте дальше.

In [25]:
# возьмём целые числа от 0 до 9
it = range(0, 9)
# возведём эти числа в квадрат
it = (num * num for num in it)

for num in it:
    print(num, end=" ")

0 1 4 9 16 25 36 49 64 

В примере выше мы использовали выражение `num * num`. Можно дать этому выражению имя. Для этого определим функцию.

In [26]:
def square(num):
    return num * num

In [27]:
# возьмём целые числа от 0 до 9
it = range(0, 9)
# применяем к этим числам нашу трансформацию
it = (square(num) for num in it)

for num in it:
    print(num, end=" ")

0 1 4 9 16 25 36 49 64 

Другой способ сделать то же самое: функция `map` из стандартной библиотеки.

In [28]:
# возьмём целые числа от 0 до 9
it = range(0, 9)
# применяем к этим числам нашу трансформацию
it = map(square, it)

for num in it:
    print(num, end=" ")

0 1 4 9 16 25 36 49 64 

Трансформация не обязана использовать элементы исходного итератора!

In [29]:
# возьмём целые числа от 0 до 9
it = range(0, 9)
# для каждого числа... выкидываем число, передаём дальше 42
it = (42 for num in it)

for num in it:
    print(num, end=" ")

42 42 42 42 42 42 42 42 42 

### Замечание о стиле

Вот простая запись:

In [30]:
# возьмём целые числа от 0 до 99
it = range(100)
# превратим эти числа в строки
it = (str(num) for num in it)
# выберем из них те строки, которые заканчиваются на "2"
it = (s for s in it if s.endswith("2"))
# добавим в конце строки "!"
it = (s + "!" for s in it)

next(it)

'2!'

Осторожно, автор отличается умом и сообразительностью!

In [31]:
it = (
    s + "!"
    for s in (
        str(num)
        for num in range(100)
    )
    if s.endswith("2")
)

next(it)

'2!'

### Функции `enumerate` и `zip`

#### Функция `enumerate`

Превращает исходный итератор в итератор пар. Первый элемент пары — порядковый номер, второй элемент пары — выдача исходного итератора.

In [32]:
it = reversed("abcd")
it = enumerate(it)

for item in it:
    print(item)

(0, 'd')
(1, 'c')
(2, 'b')
(3, 'a')


Как начать не с нуля.

In [33]:
it = reversed("abcd")
it = enumerate(it, start=7)

for item in it:
    print(item)

(7, 'd')
(8, 'c')
(9, 'b')
(10, 'a')


Кстати, как получить обратно исходный итератор?

In [34]:
it = reversed("abcd")
it = enumerate(it)
it = (b for (a, b) in it)

for item in it:
    print(item, end=" ")

d c b a 

А как получить только индексы?

In [35]:
it = reversed("abcd")
it = enumerate(it)
it = (a for (a, b) in it)

for item in it:
    print(item, end=" ")

0 1 2 3 

Если использовать в `enumerate` не итератор, а что-то другое, то Питон "за кулисами" превращает его в итератор.

In [36]:
it = enumerate("abcd")  # = enumerate(iter("abcd"))
for item in it:
    print(item)

(0, 'a')
(1, 'b')
(2, 'c')
(3, 'd')


#### Функция `zip`

В английском языке _zip_ — это застёжка-молния. Она соединяет зубчики слева и справа.

In [37]:
it_1 = iter("abcd")     # здесь 4 буквы
it_2 = reversed("ABC")  # здесь 3 буквы

it_3 = zip(it_1, it_2)  # здесь 3 пары букв

for elem in it_3:
    print(elem)

('a', 'C')
('b', 'B')
('c', 'A')


Если использовать в `zip` не итератор, а что-то другое, то Питон "за кулисами" превращает его в итератор.

In [38]:
it = zip("abcd", "ABC", "12345")  # = zip(iter("abcd"), iter("ABC"), iter("12345"))

for elem in it:
    print(elem)

('a', 'A', '1')
('b', 'B', '2')
('c', 'C', '3')


Кстати, как превратить тройки `(a, b, c)` в пары `(a, c)`?

In [39]:
it = zip("abcd", "ABC", "12345")
it = ((a, c) for (a, b, c) in it)

for elem in it:
    print(elem)

('a', '1')
('b', '2')
('c', '3')


## 