# Продолжим о циклах :)

### Итерируемый объект 

**Итерация** - это общий термин, который описывает процедуру взятия элементов чего-то по очереди.

В более общем смысле, это последовательность инструкций, которая повторяется определенное количество раз или до выполнения указанного условия.

**Итерируемый объект** (iterable) - это объект, который способен возвращать элементы по одному(не обязательно по порядку). Кроме того, это объект, из которого можно получить итератор.

Примеры итерируемых объектов:

* все последовательности: список, строка, кортеж
* словари и множества
* файлы

**Итератор** (iterator) - это объект, который возвращает свои элементы по одному за раз.

С точки зрения Python - это любой объект, у которого есть метод __next__. Этот метод возвращает следующий элемент, если он есть, или возвращает исключение **StopIteration**, когда элементы закончились.

Кроме того, итератор запоминает, на каком объекте он остановился в последнюю итерацию.

Сейчас сложновато: Наш цикл for проходит именно по итератору! Когда мы говорим:

for object in iterable:

    do something  
    
Мы, на самом деле, вызываем метод итерируемого объекта , который возвращает итератор.
Таким образом, создаем объект-итератор , по которому и бежит цикл for.
Для того чтобы все это увидеть, есть функция iter() В качестве аргумента ей передается итерируемый объект (словарь, список, лист и т.д.) , а она возвращает соответствующий итератор.


In [3]:
s = [1,2,3,4,5]
print(type(s))
print(type(iter(s)))

<class 'list'>
<class 'list_iterator'>


In [5]:
for i in s:
    print(i)

1
2
3
4
5


In [4]:
for i in iter(s):
    print(i)

1
2
3
4
5


Посмотрим на встроенную функцию next(). Она должна отдавать следующий элемент итератора. 

In [6]:
s = [1, 2, 3, 4, 5]
s_iter = iter(s)
print(next(s_iter))
print(next(s_iter))
print(next(s_iter))

1
2
3


In [7]:
type(s)

list

In [8]:
next(s)

TypeError: 'list' object is not an iterator

In [13]:
s

[1, 2, 3, 4, 5]

In [10]:
s_iter2 = iter(s)

In [11]:
type(s_iter2)

list_iterator

In [18]:
next(s_iter2)

StopIteration: 

In [29]:
s_iter2

<list_iterator at 0x7ffa5d03fcd0>

In [26]:
iter(s_iter2)

<list_iterator at 0x7ffa5d03fcd0>

Отлично! мы по одному научились перебирать элементы из итерируемого объекта. Стоит отдельно остановиться на том, что цикл **for**, в Python, устроен несколько иначе, чем в большинстве других языков. Он больше похож на **for...each**, или же **for...of**.

In [84]:
l = [1,2,3,4,5]
list(map(str,l))

['1', '2', '3', '4', '5']

### Немного умных слов об итераторах

**Протокол итератора**

Теперь формализуем протокол итератора целиком:

* Чтобы получить итератор мы должны передать функции iter итерируемый объект.
* Далее мы передаём итератор функции next.
* Когда элементы в итераторе закончились, порождается исключение StopIteration. (Пока представим себе исключения, как объект специального типа, который генерируется в момент ошибки или какого-то терминального события. Например, они появляются, когда мы пытаемся делить на ноль или когда что-то напутали с типами

**Особенности**:

* Любой объект, передаваемый функции iter без исключения TypeError — итерируемый объект.
* Любой объект, передаваемый функции next без исключения TypeError — итератор.
* Любой объект, передаваемый функции iter и возвращающий сам себя — итератор.

**Плюсы итераторов:**

Итераторы работают "лениво" (en. lazy). А это значит, что они не выполняют какой-либо работы, до тех пор, пока мы их об этом не попросим. А это классный функционал, потому что очень многие виды данных в память компьютера не помещаются, а "ленивый" итератор позволяет эти данные читать по кускам! Так, например, можно посчитать количество строк в текстовом файле на несколько гигабайт.

Таким образом, мы можем оптимизировать потребление ресурсов ОЗУ и CPU, а так же создавать бесконечные последовательности.

In [19]:
iter([1, 2])

<list_iterator at 0x7ffa5ca76d90>

In [20]:
iter((1, 2, 3))

<tuple_iterator at 0x7ffa5cc8ae50>

In [22]:
iter('123')

<str_iterator at 0x7ffa5cc8aa00>

In [23]:
iter(1)

TypeError: 'int' object is not iterable

In [24]:
next([1, 2, 3])

TypeError: 'list' object is not an iterator

In [25]:
next(iter([1, 2, 3]))

1

In [29]:
s_iter2

<list_iterator at 0x7ffa5d03fcd0>

In [26]:
iter(s_iter2)

<list_iterator at 0x7ffa5d03fcd0>

<img src ="https://files.realpython.com/media/t.ba63222d63f5.png" alt ="Test picture" width="500"/>

Перед тем, как начать решать какие-то задачи, остается упомянуть крайне полезную функцию **range()**. \
Простыми словами, **range()** позволяет вам генерировать ряд чисел в рамках заданного диапазона. В зависимости от того, как много аргументов вы передаете функции, вы можете решить, где этот ряд чисел начнется и закончится, а также насколько велика разница будет между двумя числами.

Есть три способа вызова **range()**:

* **range(стоп)** берет один аргумент
* **range(старт, стоп)** берет два аргумента
* **range(старт, стоп, шаг)** берет три аргумента

На деле **range()** возвращает "ленивый" итерируемый объект (Да, сейчас что-то сложно). Понимать надо следующее:\
* По range() можно итерироваться (значит это итерируемый объект)
* range() не держит все свои объекты в памяти, а достает их "по требованию" (прям как итератор!)
* Но есть и ряд отличий, который делает range() похожим на последовательности (списки, кортежи и строки)

In [32]:
s = 0
for i in range(10):
    s += 1
    print(s)

1
2
3
4
5
6
7
8
9
10


In [31]:
for i in list(range(10)):
    pass

In [90]:
# Это как раз первый случай (мы вывели все целые числа ДО трех)
for i in range(3):
    print(i)

0
1
2


In [91]:
# Это второй случай (мы вывели все целые числа от 0 до 10 не включая правый конец)
for i in range(0, 10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [92]:
# Ну а это третий случай (мы вывели все целые числа от 0 до 10 не включая правый конец с шагом 2)
# То есть нулевое, второе, четвертое и т.д.
for i in range(0, 10, 2):
    print(i)

0
2
4
6
8


Шаг здесь может быть положительным или отрицательным числом, но не может быть нулем! Отрицательное число будет означать уменьшение аргумента, то есть:

In [93]:
for i in range(10, 0, -1):
    print(i)

10
9
8
7
6
5
4
3
2
1


А теперь отличие от итераторов! У range можно обратиться к элементу или даже срезу (как в списках)

In [95]:
print(range(3)[1])

1


In [96]:
print(range(10)[2:5])

range(2, 5)


Немного истории: в Python 2 были функции **range** и **xrange**. Первая создавала список (прям настоящий список), а вторая - \
именно то, что теперь в Python 3 называется **range**

### Генераторы списков и списковые включения. aka List Comprehensions
Этот элемент языка считается его "визитной карточкой". Это своего рода метод быстро создать новый список, не применяя цикл for. Пусть мы, к примеру, хотим создать список с числами от 0 до 20

In [126]:
a = []
for i in range(20):
    a.append(i)
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

Это же выражение можно записать с помощью спискового включения

In [33]:
a = [i for i in range(20)]
print(type(a))
print(a)

<class 'list'>
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


In [35]:
[i ** 2 for i in range(5)]

[0, 1, 4, 9, 16]

Что мы видим? Во-первых, на выходе такой конструкцими мы получили лист (конечно, это же СПИСКОВОЕ включение). А во-вторых, все написано в одну строчку и , кажется следует вот такой конструкции:

**new_list** = [**expression** for **member** in **iterable**]

1. **expression** какое либо вычисление, вызов метода или любое другое допустимое выражение, которое возвращает значение. В приведенном выше примере выражение i * i является квадратом значения члена.
2. **member** является объектом или значением в списке или итерируемым объекте (iterable). В приведенном выше примере значением элемента является i.
3. **iterable** список, множество, последовательность, генератор или любой другой объект, который может возвращать свои элементы по одному. В приведенном выше примере iterable является range(20).

Одним из основных преимуществ использования является то, что это единственный инструмент, который вы можете использовать в самых разных ситуациях. В дополнение к созданию стандартного списка, списки могут также использоваться для отображения и фильтрации. Вам не нужно использовать разные подходы для каждого сценария. Например, можно в раздел **expression** поставить функцию str(), которая превратит каждый элемент исходного списка в строку.

In [36]:
lst = [1, 2, 3, 4, 5, 45, 67, 8, 765, 854, 76]
x = [str(i) for i in lst]
x

['1', '2', '3', '4', '5', '45', '67', '8', '765', '854', '76']

In [39]:
inp = [int(num) for num in input().split()]

1 2 3 4 5


In [40]:
inp

[1, 2, 3, 4, 5]

In [42]:
inp[3] ** 2

16

In [45]:
## для контеста дз 1, задача про альпы 
a = int(input())
res = []
while a != 0:
    res.append(a)
    a = int(input())

1
12
3
4
2
0


In [46]:
res

[1, 12, 3, 4, 2]

Но и это еще не все. В списковое включение можно добавить какое нибудь условие (как мы это делали с **if**). Выглядеть это будет так:

    new_list = [expression for member in iterable (if conditional)]

Разберем на примере:

In [48]:
lst = [1, 2, 3, 4, 5, 45, 67, 8, 765, 854, 76]
x = [i for i in lst if i % 2 == 0] #Здесь я взял и включил в новый список только четные элементы
x

[2, 4, 8, 854, 76]

In [50]:
lst

[1, 2, 3, 4, 5, 45, 67, 8, 765, 854, 76]

In [52]:
xx = []
for num in lst:
    if num % 2 == 0:
        xx.append(num)

In [53]:
xx

[2, 4, 8, 854, 76]

Более того - не зря в условии написано iterable, а не list. Значит можно попробовать проделать что-то подобное с любыми другими итерируемыми объектами. с кортежами все точно должно получиться:

In [54]:
"""a
a
a
s"""

'a\na\na\ns'

In [74]:
# Предложение
sentence = '''The rocket, who was named Ted, came back  
            from Mars because he missed his friends.'''

# Гласные английского языка
vowels = 'aeiou'

# достанем в список все символы строки, которые не являются гласными и пробелом.
consonants = [i for i in sentence if i not in vowels]
consonants

['T',
 'h',
 ' ',
 'r',
 'c',
 'k',
 't',
 ',',
 ' ',
 'w',
 'h',
 ' ',
 'w',
 's',
 ' ',
 'n',
 'm',
 'd',
 ' ',
 'T',
 'd',
 ',',
 ' ',
 'c',
 'm',
 ' ',
 'b',
 'c',
 'k',
 ' ',
 ' ',
 '\n',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 ' ',
 'f',
 'r',
 'm',
 ' ',
 'M',
 'r',
 's',
 ' ',
 'b',
 'c',
 's',
 ' ',
 'h',
 ' ',
 'm',
 's',
 's',
 'd',
 ' ',
 'h',
 's',
 ' ',
 'f',
 'r',
 'n',
 'd',
 's',
 '.']

In [75]:
''.join(consonants)

'Th rckt, wh ws nmd Td, cm bck  \n            frm Mrs bcs h mssd hs frnds.'

Мы уже поняли, что можно поместить условие в конец оператора для простой фильтрации, но что, если хочется изменить значение элемента вместо его фильтрации? В этом случае полезно поместить условное выражение в начале выражения. Выглядит это вот так:

    new_list = [expression (if conditional) for member in iterable]

С помощью этого шаблона можно, например, использовать условную логику для выбора из нескольких возможных вариантов вывода. Допустим, у вас есть список цен, можно заменить отрицательные цены (это могут быть какие-то ошибки логирования) на 0 и оставить положительные значения без изменений:

In [57]:
original_prices = [1.25, -9.45, 10.22, 3.78, -5.92, 1.16]
prices = [i if i > 0 else 0 for i in original_prices]
prices

[1.25, 0, 10.22, 3.78, 0, 1.16]

In [58]:
original_prices = [1.25, -9.45, 10.22, 3.78, -5.92, 1.16]
prices = [i if i > 0 else i ** 2 for i in original_prices]
prices

[1.25, 89.30249999999998, 10.22, 3.78, 35.0464, 1.16]

Здесь, наше выражение **i** содержит условный оператор, **if i> 0** else **0**. Это говорит Python выводить значение **i**, если число положительное, но менять **i** на **0**, если число отрицательное.

### Генераторы списков

По сути, это то же самое, что списковое включение, но только возвращает оно не сам список, а генератор. 

In [164]:
type((i * i for i in range(10)))

generator

Проверим:

In [59]:
x = (i * i for i in range(10))

In [60]:
next(x)

0

In [64]:
next(x)

16

Так-так, функция next работает.

In [66]:
range(10)

range(0, 10)

In [67]:
range(10)[2:5]

range(2, 5)

In [69]:
x[4]

TypeError: 'generator' object is not subscriptable

In [70]:
x[2:5]

TypeError: 'generator' object is not subscriptable

К элементам обращаться нельзя

In [71]:
x = (i * i for i in range(10))
while True:
    print(next(x))

0
1
4
9
16
25
36
49
64
81


StopIteration: 

**StopIteration!** Опять что-то знакомое) Получается, что генератор, это , на самом деле, какой-то вид итератора. Так оно и есть. Генератор это итератор, который можно получить с помощью генераторного выражения, например, (i * i for i in range(10)) или с помощью функции-генератора (но об этом в следующей серии.


Так а зачем все это нужно-то? А вот возьмите, например, и посчитайте сумму квадратов первого миллиона чисел

In [72]:
%time
sum([i * i for i in range(1000000)])

CPU times: user 2 µs, sys: 0 ns, total: 2 µs
Wall time: 5.01 µs


333332833333500000

In [73]:
%time
sum(i * i for i in range(1000000))

CPU times: user 2 µs, sys: 0 ns, total: 2 µs
Wall time: 3.81 µs


333332833333500000

При использовании генератора время существенно меньше