### 6. Циклы и итерации
### 6.1. Написание питоновских циклов
Цикл в "старом стиле" (С или Java):

In [2]:
my_items = ['a', 'b', 'c']
i = 0 
while i < len(my_items):
    print(my_items[i])
    i += 1

a
b
c


Но при помощи встроенной фабричной функции range() можно генерировать индексы автоматически:

In [3]:
range(len(my_items))

range(0, 3)

Тип range представляет неизменяемую последовательность чисел. Его преимущество перед обычным списком list в том, что он всегда занимает одинаково небольшое количество оперативной памяти. Объекты-диапазоны в действительности не хранят отдельные значения, представляющие числовую последовательность, вместо этого они функционируют как итераторы и вычисляют значения последовательности на ходу. Поэтому можно написать так:

In [4]:
for i in range(len(my_items)):
    print(my_items[i])

a
b
c


Но циклы for в Python в действительности являются циклами «for each», которые могут выполнять непосредственный перебор элементов контейнера или последовательности без необходимости искать их по индексу. И этот факт можно задействовать для дальнейшего упрощения этого цикла:

In [5]:
for item in my_items:
    print(item)

a
b
c


А что, если, например, вам нужен индекс элемента? Для таких случаев есть возможность писать циклы, которые поддерживают нарастающий индекс, избегая применения шаблона с range(len(...)). Встроенная функция enumerate() поможет вам сделать подобного рода циклы безупречными и питоновскими:

In [6]:
for i, item in enumerate(my_items):
    print(f'{i}: {item}')

0: a
1: b
2: c


Дело в том, что итераторы в Python могут возвращать более одного значения. Они могут возвращать кортежи с произвольным числом значений, которые затем могут быть распакованы прямо внутри инструкции for.

Это очень мощное средство. Например, тот же самый прием можно использовать, чтобы в цикле одновременно перебрать ключи и значения словаря:

In [7]:
emails = {'Боб': 'bob@example.com', 'Алиса': 'alice@example.com',}
for name, email in emails.items():
    print(f'{name} -> {email}')

Боб -> bob@example.com
Алиса -> alice@example.com


А если вам совершенно точно нужно написать C-подобный цикл? Например, если вам требуется управлять размером шага индекса? Предположим, что вы начали со следующего цикла Java:  
for (int i = a; i < n; i += s) {  
     // ...  
}

Как этот шаблон перевести на Python? И снова на выручку приходит функция range() — она принимает необязательные параметры, которые управляют начальным значением (a), конечным значением (n) и размером шага (s) цикла. Перевод с Java на Python будет выглядеть так:

for i in range(a, n, s):  
    ...

#### Ключевые выводы
•	Написание C-подобных циклов на Python считается непитоновским стилем. Если это возможно, следует избегать ручного управления индексами цикла и условиями остановки.

•	Циклы for в Python в действительности являются циклами «for each», которые могут напрямую перебирать элементы контейнера или последовательности.

### 6.2. Осмысление включений
Ключ к пониманию конструкций включения в список состоит в том, что они попросту являются циклами с обходом коллекции, выраженными при помощи более сжатого и компактного синтаксиса.

In [8]:
squares = [x * x for x in range(10)]
squares

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

Включения в список могут фильтровать значения, основываясь на некоем произвольном условии, которое определяет, становится результирующее значение частью выходного списка или нет:

In [10]:
even_squares = [x * x for x in range(10) if x % 2 == 0]
even_squares

[0, 4, 16, 36, 64]

Это соответствует обычному циклу:

In [12]:
even_squares = [] 
for x in range(10):
    if x % 2 == 0:
        even_squares.append(x * x)
        
even_squares

[0, 4, 16, 36, 64]

Python поддерживает не только включение в список. В нем также имеется аналогичный синтаксический сахар для множеств и словарей.
Вот как выглядит включение в множество:

In [14]:
{ x * x for x in range(-9, 10) }

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

А вот включение в словарь:

In [15]:
{ x: x * x for x in range(5) }

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

#### Ключевые выводы
•	Включения в список, в множество и в словарь являются ключевым функциональным средством языка Python. Их понимание и применение сделают ваш программный код намного более питоновским.

•	Конструкции включения попросту являются причудливым синтаксическим сахаром для шаблона с простым циклом for. Как только вы разберетесь в этом шаблоне, то разовьете интуитивное понимание включений.

•	Помимо включений в список есть и другие виды включений.

### 6.3. Нарезки списков и суши-оператор
В Python объекты-списки имеют замечательное функциональное средство, которое называется нарезкой (slicing). Его можно рассматривать как расширение синтаксиса индексации с использованием квадратных скобок. Нарезка широко используется для доступа к диапазонам (интервалам) элементов внутри упорядоченной коллекции. Например, с его помощью большой объект-список можно нарезать на несколько меньших по размеру подсписков.

В операции нарезки используется знакомый синтаксис индексации «[]» со следующим шаблоном "\[начало:конец:шаг\]»:

In [1]:
lst = [1, 2, 3, 4, 5]
lst[1:3:1]

[2, 3]

Чтобы избежать ошибок смещения на единицу, важно помнить, что верхняя граница всегда не учитывается. Именно поэтому в качестве подсписка из среза \[1:3:1\] мы получили \[2, 3\].

Если убрать размер шага, то он примет значение по умолчанию, равное единице:

In [2]:
lst[1:3]

[2, 3]

С параметром шага, который также называется сдвигом (stride), можно делать другие интересные вещи. Например, можно создать подсписок, который включает каждый второй элемент оригинала:

In [3]:
lst[::2]

[1, 3, 5]

Вот вам еще хитрость: если запросить срез \[::-1\], то вы получите копию оригинального списка, только в обратном порядке:

In [6]:
lst[::-1]

[5, 4, 3, 2, 1]

Довольно ловко, но в большинстве случаев для того, чтобы инвертировать список, можно придерживаться метода list.reverse() и встроенной функции reversed.

In [11]:
lst.reverse()
lst

[5, 4, 3, 2, 1]

In [12]:
lst.reverse()
lst

[1, 2, 3, 4, 5]

При этом reversed() создаёт итератор

In [13]:
reversed(lst)

<list_reverseiterator at 0x2639684b780>

In [14]:
list(reversed(lst))

[5, 4, 3, 2, 1]

Вот другой трюк с нарезкой списка: оператор «:» можно использовать для удаления всех элементов из списка, не разрушая сам объект-список.

Это очень полезно, когда необходимо очистить список в программе, в которой имеются другие указывающие на него ссылки. В этом случае нередко вы не можете просто опустошить список, заменив его на новый объект-список, поскольку эта операция не будет обновлять другие ссылки на этот список. И тут на выручку приходит суши-оператор:

In [15]:
print(lst)
del lst[:]
lst

[1, 2, 3, 4, 5]


[]

Как видите, этот фрагмент удаляет все элементы из lst, но оставляет сам объект-список неповрежденным. В Python 3 для выполнения такой же работы также можно применить метод lst.clear(), который в зависимости от обстоятельств, возможно, будет более удобочитаемым шаблоном.

In [16]:
lst = [1, 2, 3, 4, 5]
lst.clear()
lst

[]

Помимо очистки списков, нарезку также можно использовать для замены всех элементов списка, не создавая новый объект-список. Это чудесная сокращенная запись для очистки списка и затем повторного его заполнения вручную:

In [17]:
lst = [1, 2, 3, 4, 5]
original_lst = lst
lst[:] = [7, 8, 9]
lst

[7, 8, 9]

In [18]:
original_lst

[7, 8, 9]

Приведенный выше пример кода заменил все элементы в lst, но не уничтожил и воссоздал список как таковой. По этой причине старые ссылки на оригинальный объект-список по-прежнему действительны.

И еще один вариант использования суши-оператора — создание (мелких) копий существующих списков:

In [19]:
copied_lst = lst[:]
copied_lst

[7, 8, 9]

In [20]:
copied_lst is lst

False

Создание мелкой копии означает, что копируется только структура элементов, но не сами элементы. Обе копии списка совместно используют одинаковые экземпляры отдельных элементов.

Если необходимо продублировать абсолютно все, включая и элементы, то необходимо создать глубокую копию списка. Для этой цели пригодится встроенный модуль Python copy.

#### Ключевые выводы
•	Суши-оператор «:» полезен не только для отбора подсписков элементов внутри списка. Он также может использоваться для очистки, реверсирования и копирования списков.

•	Но следует быть осторожным — для многих разработчиков Python эта функциональность граничит с черной магией. Ее применение может сделать исходный код менее легким в сопровождении для всех остальных коллег в вашей команде.

### 6.4. Красивые итераторы
Красота Python говорит сама за себя — вы можете прочитать приведенный ниже питоновский цикл, как если бы это было английское предложение:

In [38]:
numbers = [1, 2, 3]
for n in numbers:
    print(n)

1
2
3


#### Бесконечное повторение
Начнем с того, что напишем класс, который демонстрирует скелетный протокол итератора.

In [None]:
repeater = Repeater('Привет')
for item in repeater:
    print(item)

Как следует из его имени, экземпляры класса Repeater при его итеративном обходе будут неизменно возвращать единственное значение. Поэтому приведенный выше пример кода будет бесконечно печатать в консоли строковый литерал 'Привет'.

Начиная реализацию, мы, прежде всего, определим и конкретизируем класс Repeater:

In [39]:
class Repeater:
    def __init__(self, value):
        self.value = value

    def __iter__(self):
        return RepeaterIterator(self)

При первоначальном осмотре класс Repeater похож на заурядный класс Python. Но обратите внимание, что он также включает метод \_\_iter\_\_.

Что за объект RepeaterIterator мы создаем и возвращаем из дандер-метода \_\_iter\_\_? Это вспомогательный класс, который нам нужно определить, чтобы заработал наш пример итераций в цикле for…in:

In [40]:
class RepeaterIterator:
    def __init__(self, source):
        self.source = source

    def __next__(self):
        return self.source.value

In [41]:
repeater = Repeater('Привет')
# for item in repeater:
#     print(item)
# Будет печатать бесконечно.

#### Как циклы for-in работают в Python?

In [42]:
repeater = Repeater('Привет')
iterator = repeater.__iter__()
# while True:
#     item = iterator.__next__()
#     print(item)

•	Этот фрагмент кода сначала подготовил объект repeater к итерации, вызвав его метод __iter__. Он вернул фактический объект-итератор.

•	После этого цикл неоднократно вызывал метод __next__ объекта-итератора, чтобы извлекать из него значения.  

На самом деле в сеансе интерпретатора Python можно вручную «эмулировать» то, как цикл использует протокол итератора:

In [43]:
repeater = Repeater('Привет')
iterator = iter(repeater)
next(iterator)

'Привет'

In [44]:
next(iterator)

'Привет'

In [45]:
next(iterator)

'Привет'

Этот фрагмент кода дает тот же самый результат — бесконечный поток приветствий. Всякий раз, когда вы вызываете next(), итератор снова выдает то же самое приветствие.

Между прочим, здесь я воспользовался возможностью замены вызовов \_\_iter\_\_ и \_\_next\_\_ на вызовы встроенных в Python функций iter() и next().

На внутреннем уровне эти встроенные функции вызывают те же самые дандер-методы, но они делают программный код немного симпатичнее и более удобочитаемым, предоставляя протоколу итератора чистый «фасад».

#### Более простой класс-итератор
Bдея такая: RepeaterIterator без конца возвращает одинаковое значение, и он не должен отслеживать никакое внутреннее состояние. Что, если вместо этого добавить метод \_\_next\_\_ непосредственно в класс Repeater?

In [46]:
class Repeater:
    def __init__(self, value):
        self.value = value

    def __iter__(self):
        return self

    def __next__(self):
        return self.value

Мы только что перешли от двух отдельных классов и десяти строк кода всего к одному классу и семи строкам кода. Наша упрощенная реализация по-прежнему без проблем поддерживает протокол итератора:

In [47]:
repeater = Repeater('Привет')
# for item in repeater:
#     print(item)

#### Кто же захочет без конца выполнять итерации
Пора узнать, как написать итератор, который в итоге прекращает генерировать новые значения вместо выполнения бесконечных итераций, потому что это именно то, что обычно делают объекты Python, когда мы используем их в цикле for…in.  

Давайте посмотрим, что для решения этой проблемы делают другие итераторы Python. Я создам простой контейнер, список с несколькими элементами, а затем буду выполнять его итеративный обход до тех пор, пока он не исчерпает элементы, чтобы увидеть, что произойдет:

In [48]:
my_list = [1, 2, 3]
iterator = iter(my_list)
next(iterator)

1

In [49]:
next(iterator)

2

In [50]:
next(iterator)

3

In [51]:
next(iterator)

StopIteration: 

Чтобы подать сигнал о том, что мы исчерпали все имеющиеся в итераторе значения, он вызывает исключение StopIteration.  

Итераторы Python обычно не могут быть «обнулены» — как только они исчерпаны, им полагается вызывать исключение StopIteration при каждом вызове их функции next(). Чтобы возобновить итерации, вам нужно запросить свежий объект-итератор при помощи функции iter().

Теперь мы знаем все, что нужно для написания нашего класса BoundedRepeater, который прекращает итерации после заданного количества повторений:

In [52]:
class BoundedRepeater:
    def __init__(self, value, max_repeats):
        self.value = value
        self.max_repeats = max_repeats
        self.count = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.count >= self.max_repeats:
            raise StopIteration
        self.count += 1
        return self.value

И он дает нам требуемый результат. Итерации прекращаются после ряда повторений, определенных в параметре max_repeats:

In [53]:
repeater = BoundedRepeater('Привет', 3)
for item in repeater:
    print(item)

Привет
Привет
Привет


Если переписать этот последний пример цикла for…in, устранив часть синтаксического сахара, то в итоге мы получим следующий ниже расширенный фрагмент кода:

In [54]:
repeater = BoundedRepeater('Привет', 3)
iterator = iter(repeater)
while True:
    try:
        item = next(iterator)
    except StopIteration:
        break
    print(item)

Привет
Привет
Привет


#### Ключевые выводы
•	Итераторы предоставляют объектам Python интерфейс последовательности, который эффективен с точки зрения потребляемой оперативной памяти и который считается чисто питоновским. Любуйтесь красотой цикла for ... in!

•	Чтобы поддерживать итерации, в объекте должен быть реализован протокол итератора за счет обеспечения дандер-методов \_\_iter\_\_ и \_\_next\_\_.

•	Итераторы на основе класса являются лишь одним из способов написания итерируемых объектов в Python. Следует также рассмотреть генераторы и выражения-генераторы.

### 6.5. Генераторы — это упрощенные итераторы
В разделе, посвященном итераторам, мы потратили довольно много времени на написание итератора на основе класса. Это было неплохой идеей с точки зрения обучения, но итератор на основе класса также продемонстрировал, что написание класса итератора требует большого объема шаблонного кода.  

Но можно писать итераторы быстрее и с меньшим объемом кода, используя генераторы и ключевое слово yield.

#### Бесконечные генераторы  
Вот так класс Repeater выглядел в своей второй (упрощенной) версии:

In [1]:
class Repeater:
    def __init__(self, value):
        self.value = value
    def __iter__(self):
        return self
    def __next__(self):
        return self.value

И вот где на сцену выходят генераторы Python. Если переписать этот класс итератора в качестве генератора, то он будет выглядеть так:

In [2]:
def repeater(value):
    while True:
        yield value

Как видите, генераторы похожи на обычные функции, но вместо инструкции возврата return в них для передачи данных назад источнику вызова используется инструкция yield.  

Будет ли эта новая реализация генератора по-прежнему работать так же, как и наш итератор на основе класса? Да!  

for x in repeater('Привет'):  
....print(x)  
    
Получаем тот же бесконечный вывод. Итак, каким же образом эти генераторы работают? Они похожи на нормальные функции, но их поведение очень различается. Начнем с того, что вызов функции-генератора вообще не выполняет функцию. Он просто создает и возвращает объект-генератор:

In [3]:
repeater('Эй')

<generator object repeater at 0x000002F1589040C0>

Программный код в функции-генератора исполняется только тогда, когда функция next() вызывается с объектом-генератором в качестве аргумента:

In [4]:
generator_obj = repeater('Эй')
next(generator_obj)

'Эй'

В отличие от инструкции return, которая избавляется от локального состояния функции, инструкция yield приостанавливает функцию и сохраняет ее локальное состояние. На практике это означает, что локальные переменные и состояние исполнения функции-генератора лишь откладываются в сторону и не выбрасываются полностью. Исполнение может быть возобновлено в любое время вызовом функции next() с генератором в качестве аргумента:

In [5]:
iterator = repeater('Привет')
next(iterator)

'Привет'

In [6]:
next(iterator)

'Привет'

In [7]:
next(iterator)

'Привет'

Это делает генераторы полностью совместимыми с протоколом итератора. По этой причине можно представлять их прежде всего как синтаксический сахар для реализации итераторов.

Вы убедитесь, что в отношении большинства типов итераторов написание функции-генератора будет проще, а восприятие легче, чем определение многословного итератора на основе класса.

#### Генераторы, которые прекращают генерацию
Генераторы прекращают порождать значения, как только поток управления возвращается из функции-генератора каким-либо иным способом, кроме инструкции yield. Это означает, что вам больше вообще не нужно заботиться о вызове исключения StopIteration!

In [8]:
def repeat_three_times(value):
    yield value
    yield value
    yield value

Обратите внимание: эта функция-генератор не содержит никакого цикла. В действительности она проста как божий день и состоит всего из трех инструкций yield. Если yield временно приостанавливает выполнение функции и передает значение назад источнику вызова, то что произойдет, когда мы достигнем конца этого генератора? Давайте узнаем:

In [9]:
for x in repeat_three_times('Всем привет'):
    print(x)

Всем привет
Всем привет
Всем привет


Как вы, возможно, и ожидали, этот генератор прекратил порождать новые значения после трех итераций. Можно предположить, что он это сделал путем вызова исключения StopIteration, когда исполнение достигло конца функции. Но чтобы быть до конца уверенными, давайте подтвердим это еще одним экспериментом:

In [10]:
iterator = repeat_three_times('Всем привет')
next(iterator)

'Всем привет'

In [11]:
next(iterator)

'Всем привет'

In [12]:
next(iterator)

'Всем привет'

In [13]:
next(iterator)

StopIteration: 

Этот итератор вел себя именно так, как мы и ожидали. Как только мы достигаем конца функции-генератора, он начинает вызывать StopIteration, сигнализируя о том, что у него больше нет значений, которые он мог бы предоставить.

Давайте вернемся к еще одному примеру из раздела об итераторах. Класс BoundedIterator реализовал итератор, который будет повторять значение, заданное определенное количество раз:

In [14]:
class BoundedRepeater:
    def __init__(self, value, max_repeats):
        self.value = value
        self.max_repeats = max_repeats
        self.count = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.count >= self.max_repeats:
            raise StopIteration
        self.count += 1
        return self.value

Почему бы не попробовать реализовать класс BoundedRepeater заново как функцию-генератор? Сделаем первую попытку:

In [16]:
def bounded_repeater(value, max_repeats):
    count = 0
    while True:
        if count >= max_repeats:
            return
        count += 1
        yield value

Здесь преднамеренно сделан цикл while в этой функции несколько громоздким. Хотелось продемонстрировать, как вызов инструкции return из генератора приводит к остановке итераций с исключением StopIteration. Мы вскоре подчистим и еще немного упростим эту функцию-генератор, но сначала давайте испытаем то, что у нас есть сейчас:

In [17]:
for x in bounded_repeater('Привет', 4):
    print(x)

Привет
Привет
Привет
Привет


Мы можем упростить этот генератор еще больше. Мы воспользуемся тем, что в конец каждой функции Python добавляет неявную инструкцию return None. И вот как будет выглядеть наша окончательная реализация:

In [18]:
def bounded_repeater(value, max_repeats):
    for i in range(max_repeats):
        yield value

In [19]:
for x in bounded_repeater('Ура!', 4):
    print(x)

Ура!
Ура!
Ура!
Ура!


#### Ключевые выводы
•	Функции-генераторы являются синтаксическим сахаром для написания объектов, которые поддерживают протокол итератора. Генераторы абстрагируются от большей части шаблонного кода, необходимого во время написания итераторов на основе класса.

•	Инструкция yield позволяет временно приостанавливать исполнение функции-генератора и передавать из него значения назад.

•	Генераторы начинают вызывать исключения StopIteration после того, как поток управления покидает функцию-генератор каким-либо иным способом, кроме инструкции yield.

### 6.6. Выражения-генераторы
Ранее мы увидели, как генераторы предлагают синтаксический сахар для написания итераторов на основе класса. Выражения-генераторы (generator expressions), которые мы рассмотрим в этом разделе, добавят сверху еще один слой синтаксического сахара.  

Выражения-генераторы представляют собой еще более эффективную краткую форму для создания итераторов. Благодаря простому и сжатому синтаксису, который похож на конструкцию включения в список, вы сможете определять итераторы в одной строке кода.

In [20]:
iterator = ('Привет' for i in range(3))

Во время выполнения итераций данное выражение-генератор порождает ту же самую последовательность значений, что и функция-генератор bounded_repeater, которую мы написали в предыдущем разделе:

In [22]:
def bounded_repeater(value, max_repeats):
    for i in range(max_repeats):
        yield value
        
iterator = bounded_repeater('Привет', 3)

Давайте убедимся, что наш итератор, определенный при помощи выражения-генератора, действительно работает как ожидалось:

In [23]:
iterator = ('Привет' for i in range(3))
for x in iterator:
    print(x)

Привет
Привет
Привет


Правда, есть одно маленькое предостережение: после того как выражение-генератор было использовано, оно не может быть перезапущено или использовано снова. Поэтому в некоторых случаях предпочтительнее использовать функции-генераторы или итераторы на основе класса.

In [25]:
for x in iterator:
    print(x)

#### Выражения-генераторы против включений в список
Как вы уже поняли, выражения-генераторы несколько напоминают включения в список (List comprehension):

In [26]:
listcomp = ['Привет' for i in range(3)]
genexpr = ('Привет' for i in range(3))

Однако в отличие от включений в список выражения-генераторы не конструируют объекты-списки. Вместо этого они генерируют значения «точно в срок» подобно тому, как это сделал бы итератор на основе класса или функция-генератор.

Присваивая выражение-генератор переменной, вы просто получите итерируемый «объект-генератор»:

In [27]:
listcomp

['Привет', 'Привет', 'Привет']

In [28]:
genexpr

<generator object <genexpr> at 0x000002F158904228>

Для того чтобы получить доступ к значениям, порожденным выражением-генератором, вам нужно вызвать с ним метод next() точно так же, как вы бы сделали с любым другим итератором:

In [29]:
next(genexpr)

'Привет'

In [30]:
next(genexpr)

'Привет'

In [31]:
next(genexpr)

'Привет'

In [32]:
next(genexpr)

StopIteration: 

Как вариант, вы также можете вызвать функцию list() c выражением-генератором, в результате чего вы сконструируете объект-список, содержащий все произведенные значения:

In [33]:
genexpr = ('Привет' for i in range(3))
list(genexpr)

['Привет', 'Привет', 'Привет']

#### Фильтрация значений
В этот шаблон можно добавить еще одно полезное дополнение, и это фильтрация элемента по условиям.

In [34]:
even_squares = (x * x for x in range(10) if x % 2 == 0)

Данный генератор порождает квадрат всех четных целых чисел от нуля до девяти. Фильтрующее условие с использованием оператора остатка % (оператора модуля) отклонит любое значение, которое не делится на два:

In [35]:
for x in even_squares:
    print(x)

0
4
16
36
64


#### Встраиваемые выражения-генераторы
Поскольку выражения-генераторы являются, скажем так, выражениями, вы можете их использовать в одной строке вместе с другими инструкциями. Например, вы можете определить итератор и употребить его прямо на месте при помощи цикла for:

In [36]:
for x in ('Buongiorno' for i in range(3)):
    print(x)

Buongiorno
Buongiorno
Buongiorno


Есть и другой синтаксический трюк, который можно использовать для того, чтобы сделать выражения-генераторы красивее. Круглые скобки, окружающие выражение-генератор, могут быть опущены, если выражение-генератор используется в качестве единственного аргумента функции:

In [37]:
sum((x * 2 for x in range(10)))

90

In [38]:
sum(x * 2 for x in range(10))

90

#### Ключевые выводы
•	Выражения-генераторы похожи на включения в список. Однако они не конструируют объекты-списки. Вместо этого выражения-генераторы генерируют значения «точно в срок» подобно тому, как это делают итераторы на основе класса или функции-генераторы.

•	Как только выражение-генератор было использовано, оно не может быть перезапущено или использовано заново.

•	Выражения-генераторы лучше всего подходят для реализации простых «ситуативных» итераторов. В случае составных итераторов лучше написать функцию-генератор или итератор на основе класса.

### 6.7. Цепочки итераторов
Вот еще одно замечательное функциональное свойство итераторов в Python: состыковывая многочисленные итераторы в цепочку, можно писать чрезвычайно эффективные «конвейеры» обработки данных. 

Генераторы и выражения-генераторы представляют собой синтаксический сахар для написания итераторов на Python. Они абстрагируются от большей части шаблонного кода, необходимого во время написания итераторов на основе класса.

В то время как обычная функция производит одно-единственное возвращаемое значение, генераторы производят последовательность результатов. Можно сказать, что они генерируют поток значений на протяжении своего жизненного цикла.

Например, я могу определить следующий ниже генератор, который производит серию целочисленных значений от одного до восьми, поддерживая нарастающий счетчик и выдавая новое значение всякий раз, когда с ним вызывается функция next():

In [39]:
def integers():
    for i in range(1, 9):
        yield i

In [41]:
chain = integers()
chain

<generator object integers at 0x000002F158997228>

In [42]:
list(chain)

[1, 2, 3, 4, 5, 6, 7, 8]

Но генераторы могут быть «присоединены» друг к другу, благодаря чему можно строить эффективные алгоритмы обработки данных, которые работают как конвейер.

Вы можете взять «поток» значений, выходящих из генератора integers(), и направить их в еще один генератор. Например, такой, который принимает каждое число, возводит его в квадрат, а затем передает его дальше:

In [43]:
def squared(seq):
    for i in seq:
        yield i * i

Ниже показано, что будет теперь делать наш «конвейер данных», или «цепочка генераторов»:

In [44]:
chain = squared(integers())
list(chain)

[1, 4, 9, 16, 25, 36, 49, 64]

Почему бы в наш конвейер не добавить еще один шаг, который инвертирует каждое значение, а потом передает его на следующий шаг обработки в цепи:

In [45]:
def negated(seq):
    for i in seq:
        yield -i

Если мы перестроим нашу цепочку генераторов и добавим negated в конец, то вот что мы получим на выходе:

In [46]:
chain = negated(squared(integers()))
list(chain)

[-1, -4, -9, -16, -25, -36, -49, -64]

Каждая отдельная функция-генератор в этом конвейере обработки довольно сжатая. С помощью небольшой уловки мы можем сжать определение этого конвейера еще больше, не сильно жертвуя удобочитаемостью:

In [47]:
integers = range(8)
squared = (i * i for i in integers)
negated = (-i for i in squared)
negated

<generator object <genexpr> at 0x000002F158997570>

In [48]:
list(negated)

[0, -1, -4, -9, -16, -25, -36, -49]

Единственным недостатком применения выражений-генераторов является то, что их не получится сконфигурировать с использованием аргументов функции и вы не сможете повторно использовать то же самое выражение-генератор многократно в том же самом конвейере обработки.

Но, безусловно, во время сборки конвейеров вы можете свободно комбинировать выражения-генераторы и обычные генераторы на свой вкус. В случае с составными конвейерами это поможет улучшить удобочитаемость.

#### Ключевые выводы
•	Генераторы могут состыковываться в цепочки, формируя очень эффективные и удобные в сопровождении конвейеры обработки данных.

•	Состыкованные в цепочки генераторы обрабатывают каждый элемент, проходящий сквозь цепь по отдельности.

•	Выражения-генераторы могут использоваться для написания сжатого определения конвейера, но это может повлиять на удобочитаемость.

### 7. Трюки со словарем
### 7.1. Значения словаря, принимаемые по умолчанию
У словарей Python есть метод get() для поиска ключа, которому передают запасное значение. Это может пригодиться в самых разных ситуациях. Предположим, что у нас есть представленная ниже структура данных, которая ставит идентификаторы в соответствие именам пользователей:

In [49]:
name_for_userid = {
    382: 'Элис',
    950: 'Боб',
    590: 'Дилберт',
}

Теперь мы хотели бы использовать эту структуру данных, чтобы написать функцию greeting(), которая будет возвращать пользователю приветствие на основе его идентификатора. Наша первая реализация может выглядеть примерно так:

In [50]:
def greeting(userid):
    return 'Привет, %s!' % name_for_userid[userid]

В ней представлен прямолинейный поиск в словаре. Это первая реализация технически работает — но только если идентификатор пользователя является допустимым ключом в словаре name_for_userid. Если в функцию greeting передать недопустимый идентификатор пользователя, то она вызовет исключение:

In [51]:
greeting(382)

'Привет, Элис!'

In [52]:
greeting(33333333)

KeyError: 33333333

Исключение KeyError — это совсем не тот результат, который мы хотели бы видеть. Было бы намного лучше, если бы в качестве запасного варианта функция возвращала универсальное приветствие, если идентификатор пользователя не может быть найден.

Давайте реализуем эту идею. Наш первый подход мог бы заключаться в простой проверке принадлежности в формате ключ в словаре (key in dict) и возврате приветствия по умолчанию, если идентификатор пользователя неизвестен:

In [53]:
def greeting(userid):
    if userid in name_for_userid:
        return 'Привет, %s!' % name_for_userid[userid]
    else:
        return 'Привет всем!'

Давайте посмотрим, как эта реализация функции greeting() проявит себя с нашими предыдущими тестовыми случаями:

In [54]:
greeting(382)

'Привет, Элис!'

In [55]:
greeting(11382)

'Привет всем!'

К этому подходу есть несколько претензий:

•	он неэффективен, потому что он опрашивает словарь дважды;  

•	он многословен, поскольку, например, часть строки с приветствием повторяется;

•	он не является питоновским — официальная документация Python, в частности, для таких ситуаций рекомендует использовать стиль программирования «легче попросить прощения, чем разрешения» (EAFP):  

Этот общепринятый стиль программирования на Python исходно предполагает существование допустимых ключей или атрибутов и отлавливает исключения, если предположение оказывается ложным.

Более эффективная реализация, которая следует принципам EAFP, могла бы вместо выполнения явной проверки на принадлежность ключа словарю задействовать блок try…except, чтобы поймать исключение KeyError:

In [56]:
 def greeting(userid):
    try:
        return 'Привет, %s!' % name_for_userid[userid]
    except KeyError:
        return 'Привет всем'

Эта реализация по-прежнему верна в том, что касается наших первоначальных требований, и теперь мы устранили необходимость опрашивать словарь дважды.

Но мы до сих пор можем улучшить ее и предложить более чистое решение. В словаре Python есть метод get(), поддерживающий параметр «по умолчанию», который можно использовать в качестве запасного значения:

In [57]:
def greeting(userid):
    return 'Привет, %s!' % name_for_userid.get(
        userid, 'всем')

In [58]:
greeting(950)

'Привет, Боб!'

In [59]:
greeting(333333)

'Привет, всем!'

#### Ключевые выводы
•	Во время проверки принадлежности ключа словарю избегайте явных проверок в формате ключ в словаре.

•	Предпочтительной является обработка исключений в стиле EAFP или использование встроенного метода get().

•	В некоторых случаях класс collections.defaultdict из стандартной библиотеки также может оказаться полезным.

### 7.2. Сортировка словарей для дела и веселья
Очень часто полезно получить сортированное представление (sorted representation) словаря, поместив элементы словаря в произвольном порядке на основе их ключа, значения или иного производного свойства. Предположим, что у вас есть словарь xs со следующими парами ключ-значение:

In [60]:
xs = {'a': 4, 'c': 2, 'b': 3, 'd': 1}

Чтобы получить сортированный список пар ключ-значение в этом словаре, вы можете применить метод items() словаря и затем отсортировать результирующую последовательность на втором обходе:

In [62]:
sorted(xs.items())

[('a', 4), ('b', 3), ('c', 2), ('d', 1)]

Кортежи ключ-значение упорядочены с использованием стандартного лексикографического упорядочивания Python для сравнения последовательностей.  

К счастью, есть способ взять полный контроль над тем, как упорядочиваются элементы. Вы можете управлять порядком их следования путем передачи функции ключа во встроенную функцию sorted(), которая изменит то, как будут сравниваться элементы словаря.

Функция ключа — это просто обычная функция Python, которая будет вызываться с каждым элементом перед тем, как делать сравнения. Функция ключа на входе получает элемент словаря, а на выходе возвращает требуемый «ключ» для сравнения порядка следования элементов.

К сожалению, слово «ключ» здесь используется в двух контекстах одновременно: функция ключа не касается ключей словаря, она просто отмечает каждый входной элемент произвольным ключом сравнения. 

Допустим, вы хотите получить отсортированное представление словаря на основе его значений. Чтобы получить этот результат, вы можете использовать следующую ниже функцию ключа, которая возвращает значение каждой пары ключ-значение путем поиска второго элемента в кортеже:

In [63]:
sorted(xs.items(), key=lambda x: x[1])

[('d', 1), ('c', 2), ('b', 3), ('a', 4)]

Чтобы осмыслить принцип работы функции ключа, стоит потратить немного времени. Этот мощный принцип можно применять во всех видах контекстов Python.

На самом деле этот принцип настолько распространен, что стандартная библиотека Python включает модуль operator. Этот модуль реализует часть наиболее часто используемых функций ключа в качестве структурных блоков, автоматически конфигурируемых по принципу plug-and-play, таких как operator.itemgetter и operator.attrgetter.

Ниже приведен пример того, как можно заменить поиск по индексу на основе лямбды в первом примере на operator.itemgetter:

In [64]:
import operator
sorted(xs.items(), key=operator.itemgetter(1))

[('d', 1), ('c', 2), ('b', 3), ('a', 4)]

Использование модуля operator в некоторых случаях помогает яснее передавать замысел вашего программного кода. С другой стороны, простое лямбда-выражение может быть столь же удобочитаемым и более очевидным. В этом конкретном случае я предпочитаю лямбда-выражение.

Еще одна выгода от использования лямбд в качестве собственной функции ключа состоит в том, что вам удается управлять порядком сортировки гораздо детальнее. Например, вы можете отсортировать словарь на основе абсолютной числовой величины каждого хранящегося в нем значения:

In [65]:
sorted(xs.items(), key=lambda x: abs(x[1]))

[('d', 1), ('c', 2), ('b', 3), ('a', 4)]

Если вам нужно инвертировать порядок сортировки так, чтобы более крупные значения шли вначале, то во время вызова sorted() вы можете применить именованный аргумент reverse=True:

In [66]:
sorted(xs.items(), key=lambda x: x[1], reverse=True)

[('a', 4), ('b', 3), ('c', 2), ('d', 1)]

In [67]:
sorted(xs.items(), key=lambda x: x[0], reverse=True)

[('d', 1), ('c', 2), ('b', 3), ('a', 4)]

#### Ключевые выводы
•	Создавая сортированные «представления» словарей и другие коллекции, вы можете влиять на порядок сортировки при помощи функции ключа.

•	Функции ключа являются в Python важным принципом. Наиболее часто используемые из них были даже добавлены в модуль operator стандартной библиотеки.

•	В Python функции являются объектами первого класса. Вы обнаружите, что это мощное средство языка применяется повсюду.

### 7.3. Имитация инструкций выбора на основе словарей

In [69]:
def dispatch_dict(operator, x, y):
    return {
        'add': lambda: x + y,
        'sub': lambda: x - y,
        'mul': lambda: x * y,
        'div': lambda: x / y,
    }.get(operator, lambda: None)()

In [70]:
dispatch_dict('mul', 7, 8)

56

In [71]:
dispatch_dict('неизвестно', 2, 8)

Есть пара способов, которыми этот код можно усовершенствовать еще больше, если бы он был реален и предназначался для эксплуатации.

Во-первых, всякий раз, когда мы вызываем dispatch_dict(), он создает временный словарь и кучу лямбд для поиска кода операции. С точки зрения производительности это не идеально. В случае, если программный код нуждаетется в быстродействии, имеет больше смысла единожды создать словарь в качестве константы и затем ссылаться на него во время вызова функции. 

Во-вторых, если бы мы и правда захотели выполнить несколько простых арифметических операций типа x + y, то вместо используемых в этом примере лямбда-функций было бы гораздо лучше использовать встроенный модуль Python operator. Модуль operator предоставляет реализации всех операторов Python, в частности operator.mul, operator.div и т.д. Хотя эта деталь малозначительна.

#### Ключевые выводы
•	В Python нет инструкции выбора switch-case. Но в некоторых случаях вы можете избежать длинных цепочек инструкций if при помощи таблицы диспетчеризации на основе словаря.

•	Функции первого класса Python в очередной раз доказывают, что они являются мощным инструментом. Но чем больше сила, тем больше ответственность.

### 7.4. Самое сумасшедшее выражение-словарь на западе

In [75]:
{True: 'да', 1: 'нет', 1.0: 'возможно'}

{True: 'возможно'}

Когда Python обрабатывает наше выражение-словарь, он сначала строит новый пустой объект-словарь, а затем присваивает ему ключи и значения в том порядке, в каком они переданы в выражение-словарь.

Тогда, когда мы его разложим на части, наше выражение-словарь будет эквивалентно приведенной ниже последовательности инструкций, которые исполняются по порядку:

In [76]:
xs = dict()
xs[True] = 'да'
print(xs)
xs[1] = 'нет'
print(xs)
xs[1.0] = 'возможно'
print(xs)

{True: 'да'}
{True: 'нет'}
{True: 'возможно'}


In [77]:
xs = dict()
xs[1] = 'нет'
print(xs)
xs[True] = 'да'
print(xs)
xs[1.0] = 'возможно'
print(xs)

{1: 'нет'}
{1: 'да'}
{1: 'возможно'}


Как ни странно, Python считает все ключи, используемые в этом примере словаря, эквивалентными:

In [78]:
True == 1 == 1.0

True

Оказывается, Python рассматривает тип bool как подкласс типа int. Именно так обстоит дело в Python 2 и Python 3:

Булев тип — это подтип целочисленного типа, и булевы значения ведут себя, соответственно, как значения 0 и 1 почти во всех контекстах, при этом исключением является то, что при преобразовании в строковый тип, соответственно, возвращаются строковые значения 'False' или 'True'.

И разумеется, это означает, что в Python булевы значения технически можно использовать в качестве индексов списка или кортежа:

In [79]:
['нет', 'да'][True]

'да'

### Ключевые выводы
•	Словари рассматривают ключи как идентичные, если результат их сравнения методом __\_\_eq\_\___ говорит о том, что они эквивалентны, и если их хеш-значения одинаковы.

•	Неожиданные конфликты ключей словаря могут и будут приводить к неожиданным результатам.

### 7.5. Так много способов объединить словари

In [83]:
xs = {'a': 1, 'b': 2}
ys = {'b': 3, 'c': 4}

In [84]:
zs = {}
zs.update(xs)
zs.update(ys)
zs

{'a': 1, 'b': 3, 'c': 4}

Порядок, в котором мы вызываем update(), определяет то, как будут разрешаться конфликты. Выигрывает последнее обновление, и повторяющийся ключ 'b' ассоциируется со значением 3, которое поступило из ys, то есть второго исходного словаря.

Еще один прием, который работает в Python 2 и в Python 3, использует встроенную функцию dict() совместно с оператором ** для «распаковки» объектов:

In [85]:
zs = dict(xs, **ys)
zs

{'a': 1, 'b': 3, 'c': 4}

Начинания с Python 3.5, оператор ** стал гибче. Поэтому в Python 3.5+ есть еще один — и, пожалуй, более приятный — способ объединения произвольного количества словарей:

In [86]:
zs = {**xs, **ys}
zs

{'a': 1, 'b': 3, 'c': 4}

#### Ключевые выводы
•	В Python 3.5 и выше для слияния многочисленных объектов-словарей в один можно использовать оператор ** с использованием одного-единственного выражения, переписывая существующие ключи слева направо.

•	Чтобы оставить программный код совместимым с более ранними версиями Python, можно использовать встроенный в словарь метод update().

### 7.6. Структурная печать словаря
Вы когда-либо пытались выявить баг в одной из своих программ, усеивая ее кучей отладочных инструкций print, чтобы проследить поток исполнения? Или, возможно, вам приходилось генерировать диагностическое сообщение, чтобы выводить некоторые параметры конфигурации…

Я был разочарован, и часто, тем, насколько трудно в Python читать некоторые структуры данных, когда они печатаются как текстовые строки. Например, ниже приведен простой словарь. Он напечатан в сеансе интерпретатора, при этом порядок следования ключей произвольный и в результирующей строке отсутствует выделение отступами:

In [87]:
mapping = {'a': 23, 'b': 42, 'c': 0xc0ffee}
print (mapping)
str(mapping)

{'a': 23, 'b': 42, 'c': 12648430}


"{'a': 23, 'b': 42, 'c': 12648430}"

К счастью, есть несколько простых в использовании альтернатив неразборчивому преобразованию в стиле to-string, дающих более удобочитаемый результат. Один из вариантов состоит в использовании встроенного модуля Python json. Чтобы выполнить структурную печать словаря с более приятным форматированием, можно применить функцию json.dumps():

In [90]:
import json
print(json.dumps(mapping, indent=4, sort_keys=True))

{
    "a": 23,
    "b": 42,
    "c": 12648430
}


Печать словарей при помощи модуля json работает только со словарями, которые содержат примитивные типы, — вы столкнетесь с проблемой при попытке распечатать словарь, который содержит непримитивный тип данных, таких как функция. Еще один недостаток использования функции json.dumps() состоит в том, что она не способна сериализовать составные типы данных, такие как множества.

In [91]:
mapping['d'] = {1, 2, 3}
json.dumps(mapping)

TypeError: Object of type set is not JSON serializable

Классическим решением задачи структурной печати объектов Python является встроенный модуль pprint.

In [93]:
import pprint
pprint.pprint(mapping)

{'a': 23, 'b': 42, 'c': 12648430, 'd': {1, 2, 3}}


Вы видите, что функция pprint способна печатать такие типы данных, как множества, и она также печатает ключи словаря в воспроизводимом порядке. По сравнению со стандартным строковым представлением словарей, здесь мы получаем то, что воспринимается значительно легче.

Вместе с тем, по сравнению с json.dumps(), она не представляет вложенные структуры визуально столь же хорошо. В зависимости от обстоятельств это может быть преимуществом или недостатком. Я иногда использую json.dumps(), чтобы выводить словари из-за улучшенной удобочитаемости и форматирования, но только если я уверен, что в них нет непримитивных типов данных.

#### Ключевые выводы
•	В Python принятое по умолчанию преобразование объектов-словарей в строковое представление может оказаться трудночитаемым.

•	Модули pprint и json представляют собой варианты «более высокого качества», встроенные в стандартную библиотеку Python.

•	Будьте осторожны с использованием функции json.dumps() и непримитивных ключей и значений, поскольку это вызовет исключение TypeError.

### 8. Питоновские методы  повышения производительности
#### 8.1. Исследование модулей и объектов Python

In [94]:
import datetime
dir(datetime)

['MAXYEAR',
 'MINYEAR',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'date',
 'datetime',
 'datetime_CAPI',
 'sys',
 'time',
 'timedelta',
 'timezone',
 'tzinfo']

In [95]:
dir(datetime.date)

['__add__',
 '__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__radd__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rsub__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 'ctime',
 'day',
 'fromisoformat',
 'fromordinal',
 'fromtimestamp',
 'isocalendar',
 'isoformat',
 'isoweekday',
 'max',
 'min',
 'month',
 'replace',
 'resolution',
 'strftime',
 'timetuple',
 'today',
 'toordinal',
 'weekday',
 'year']

Ниже приведен небольшой трюк, который можно применять для сведения списка атрибутов к тем, которыми вы интересуетесь:

In [96]:
[_ for _ in dir(datetime) if 'date' in _.lower()]

['date', 'datetime', 'datetime_CAPI']

In [97]:
help(datetime)

Help on module datetime:

NAME
    datetime - Fast implementation of the datetime type.

CLASSES
    builtins.object
        date
            datetime
        time
        timedelta
        tzinfo
            timezone
    
    class date(builtins.object)
     |  date(year, month, day) --> date object
     |  
     |  Methods defined here:
     |  
     |  __add__(self, value, /)
     |      Return self+value.
     |  
     |  __eq__(self, value, /)
     |      Return self==value.
     |  
     |  __format__(...)
     |      Formats self with strftime.
     |  
     |  __ge__(self, value, /)
     |      Return self>=value.
     |  
     |  __getattribute__(self, name, /)
     |      Return getattr(self, name).
     |  
     |  __gt__(self, value, /)
     |      Return self>value.
     |  
     |  __hash__(self, /)
     |      Return hash(self).
     |  
     |  __le__(self, value, /)
     |      Return self<=value.
     |  
     |  __lt__(self, value, /)
     |      Return self<value.
 

In [98]:
help(dir)

Help on built-in function dir in module builtins:

dir(...)
    dir([object]) -> list of strings
    
    If called without an argument, return the names in the current scope.
    Else, return an alphabetized list of names comprising (some of) the attributes
    of the given object, and of attributes reachable from it.
    If the object supplies a method named __dir__, it will be used; otherwise
    the default dir() logic is used and returns:
      for a module object: the module's attributes.
      for a class object:  its attributes, and recursively the attributes
        of its bases.
      for any other object: its attributes, its class's attributes, and
        recursively the attributes of its class's base classes.



#### Ключевые выводы
•	Используйте встроенную функцию dir(), чтобы интерактивно исследовать модули и классы Python, находясь внутри сеанса интерпретатора.

•	Встроенная функция help() позволяет просматривать документацию прямо из вашего интерпретатора (для выхода нажмите клавишу q).