# Включения

Включения - это специальные синтаксические конструкции для быстрого и короткого создания коллекций. Синтаксически конструкцию включения можно разбить на три отдельных составляющих:
- цикл ```for``` (Обязательная часть)
- условие фильтрации
- условие изменения

Цикл является обязательной частью включения, а оба условия не обязательны. Они могут присутствовать или отсутствовать в зависимости от задачи. Условие фильтрации отвечает за то какие элементы попадут в итоговый список, а какие будут отброшены, т.е. фильтрует значения по определенному условию. Условие изменения преобразует элементы по какому-либо правилу и заданному условию. 

<img src="image/comprehensions.png" align="center">

Все конструкции включений имеют свой эквивалент в виде "стандартной" конструкции цикла.

## Включения в список (```list comprehensions```)

Включения в список или ```list comprehensions``` используются для создания списков. Эти конструкции записываются внутри квадратных скобок. Самая простая конструкция включения в список или спискового включения содержит только цикл. Она выглядит следующим образом.

In [1]:
a = [i for i in range(5)]
print(f'{a = }')

a = [0, 1, 2, 3, 4]


Создавать список чисел таким образом не совсем правильно. Гораздо более короче будет сразу преобразовать объект ```range``` в список.

In [2]:
a = list(range(5))
print(f'{a = }')

a = [0, 1, 2, 3, 4]


Однако с помощью такой конструкции можно легко создать список, заполненный, например, нулями. Обратите внимание, что здесь используется нижнее подчеркивание вместо переменной ```i```, т.к. она нам не нужна.

In [3]:
a = [0 for _ in range(5)]
print(f'{a = }')

a = [0, 0, 0, 0, 0]


Это простейшее включение будет эквивалентно обычной конструкции цикла, где в теле цикла будет добавляться новый элемент списка.

In [4]:
a = []
for i in range(5):
    a.append(i)
print(f'{a = }')

a = [0, 1, 2, 3, 4]


Добавляя условную конструкцию справой стороны от цикла появляется возможность фильтрации элементов, которые попадут в итоговую коллекцию. Выражения в операторе условия могут быть разной сложности, в том числе их можно объединять с помощью логических операторов. 

Ниже приведен пример поиска всех строк в которых не менее трех уникальных гласных букв.

In [5]:
words = ['spam', 'foo', 'python', 'bar', 'monty', 'сake is a lie']

# множество гласных букв
vowel_letters = set('eyuioa')

# в условии вычисляется пересечение множества гласных букв и множества букв в строке
a = [i for i in words if len(set(i) & vowel_letters) >= 3]
print(f'{a = }')

a = ['сake is a lie']


В полном виде включение с условием фильтрации будет выглядеть следующим образом.

In [6]:
a = []
for i in words:
    if len(set(i) & vowel_letters) >= 3:
        a.append(i)

print(f'{a = }')

a = ['сake is a lie']


Условие слева от цикла отвечает за совершения заданных действий над элементами последовательности. Оно позволяет вычислять элементы последовательности непосредственно в момент создания коллекции.

В качестве примера рассмотрим построение [кривой дракона](https://en.wikipedia.org/wiki/Dragon_curve) - одной из фрактальных кривых. Для ее построения будем использовать [L-системы](https://en.wikipedia.org/wiki/L-system) - довольно простой инструмент для построения самоподобных структур. [Вот](https://codegolf.stackexchange.com/questions/100562/draw-a-dragon-curve) примеры рисования кривой дракона на разных языках программирования.

In [7]:
# начальная строка
s = 'fx'
# неизменяемые символы
const = 'f+-'
# правила замены
d = {
    'x': 'x+yf+',
    'y': '-fx-y',
}

print(f'{0}: {s}')
# первые 4 итерации
for i in range(1, 5):
    # посимвольный перебор строки
    # если символ можно заменить, он заменяется
    s = ''.join([d[c] if c in d else c for c in s])
    print(f'{i}: {s}')

0: fx
1: fx+yf+
2: fx+yf++-fx-yf+
3: fx+yf++-fx-yf++-fx+yf+--fx-yf+
4: fx+yf++-fx-yf++-fx+yf+--fx-yf++-fx+yf++-fx-yf+--fx+yf+--fx-yf+


Добавив визуализацию к этому списковому включению, можно получить такие картинки.

<img src="image/dragon_curve.png">

Это включение можно заменить полным вариантом.

In [8]:
new_s = ''
for c in s:
    if c in d:
        new_s += d[c]
    else:
        new_s += c

print(f'{new_s = }')

new_s = 'fx+yf++-fx-yf++-fx+yf+--fx-yf++-fx+yf++-fx-yf+--fx+yf+--fx-yf++-fx+yf++-fx-yf++-fx+yf+--fx-yf+--fx+yf++-fx-yf+--fx+yf+--fx-yf+'


В право части может находиться одно выражение без условного оператора. 
В этом случае это выражение будет применяться ко всем элементам, 
прошедшим фильтрацию, если она есть.

В этом примере строка должна быть размножена до определенной длины.

In [9]:
s = 'lemon'

a = ''.join([s[i % len(s)] for i in range(18)])
print(a)

lemonlemonlemonlem


Условие фильтрации и условие изменения можно использовать совместно.

In [10]:
n = 950
harshad = 'Harshad number'
nivenmorphic = 'Nivenmorphic number'
a = [(i, nivenmorphic) if str(i)[-len(str(b)):] == str(b) else (i, harshad) for i in range(900, n) if not i % (b:=sum(int(j) for j in list(str(i))))]
print(f'{a = }')

a = [(900, 'Harshad number'), (902, 'Harshad number'), (910, 'Nivenmorphic number'), (912, 'Nivenmorphic number'), (915, 'Nivenmorphic number'), (918, 'Nivenmorphic number'), (935, 'Harshad number'), (936, 'Harshad number')]


Это эквивалентно

In [11]:
a = []
for i in range(900, n):
    sum_d = sum(int(j) for j in list(str(i)))
    if not i % sum_d:  # условие фильтрации
        str_dum = str(sum_d)
        if str(i)[-len(str_dum):] == str_dum:  # условие изменения
            a.append((i, nivenmorphic))
        else:
            a.append((i, harshad))
print(f'{a = }')

a = [(900, 'Harshad number'), (902, 'Harshad number'), (910, 'Nivenmorphic number'), (912, 'Nivenmorphic number'), (915, 'Nivenmorphic number'), (918, 'Nivenmorphic number'), (935, 'Harshad number'), (936, 'Harshad number')]


Списковые включения могут быть вложенные. Простым примером будет создание единичной матрицы - матрицы, где на главной диагонали находятся единицы, а в других позициях нули.

Не стоит злоупотреблять такими конструкциями. Если итоговая строка получается слишком большой, ее стоит переписать в стандартной форме.

In [12]:
n = 5  # размер матрицы
e = [[0 if i != j else 1 for j in range(n)] for i in range(n)]
print(f'{e = }')

e = [[1, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 1]]


Обратите внимание, что здесь внешним циклом считается последнее выражение ```for i in range(n)```, а внутренним ```for j in range(n)```, т.е. порядок выполнения идет справа-налево.

Такая конструкция будет эквивалентна одному вложенному циклу.

In [13]:
e = []
for i in range(n):
    # создание списка для хранения элементов строки матрицы
    lstr = []
    for j in range(n):
        if i != j:
            lstr.append(0)
        else:
            lstr.append(1)
    # добавление строки к итоговой матрице
    e.append(lstr)
print(f'{e = }')

e = [[1, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 1]]


Или в комбинированном виде (так удобно "укорачивать" вложенные циклы):

In [14]:
e = []
for i in range(n):
    e.append([0 if i != j else 1 for j in range(n)])
print(f'{e = }')

e = [[1, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 1]]


Еще один пример вложенных включений - это транспонирование матрицы.

In [15]:
matrix = [
    [1, 2, 3, 4], 
    [5, 6, 7, 8], 
    [9, 0, 1, 2],
]

a = [[xs[j] for xs in matrix] for j in range(len(matrix[0]))]
print(f'{a = }')

a = [[1, 5, 9], [2, 6, 0], [3, 7, 1], [4, 8, 2]]


Помимо вложенности возможно итерирование по нескольким переменным.

В качестве примера рассмотрим декартово произведение двух коллекций (список чисел и строка). Декартово произведение должно содержать кортежи из двух элементов. Элемент из первой коллекции стоит на первом месте, а элемент из второй на втором. Длина итогового списка должна быть равна произведению длин первой и второй коллекций.

In [16]:
a = [1, 2, 3]
b = 'abcd'

c = [(i, j) for i in a for j in b]
print(f'{c = }')
print(f'{len(c) = }')
print(f'{len(a) * len(b) = }')

c = [(1, 'a'), (1, 'b'), (1, 'c'), (1, 'd'), (2, 'a'), (2, 'b'), (2, 'c'), (2, 'd'), (3, 'a'), (3, 'b'), (3, 'c'), (3, 'd')]
len(c) = 12
len(a) * len(b) = 12


In [17]:
c = []
for i in a:
    for j in b:
        c.append((i, j))
print(f'{c = }')

c = [(1, 'a'), (1, 'b'), (1, 'c'), (1, 'd'), (2, 'a'), (2, 'b'), (2, 'c'), (2, 'd'), (3, 'a'), (3, 'b'), (3, 'c'), (3, 'd')]


Обратите внимание, что внешним считается цикл, который идет первым, т.е. ```for i in a``` во включении будет внешним, а ```for j in b``` - вложенным. Порядок в таких вложенных циклах идет слева-направо. Эти отличаются обычные *включения со вложенными циклами* от *вложенных включений*.

В примерах выше циклы проходились по двум независимым коллекциям. Во вложенных циклах можно итерироваться по коллекциям, полученным из внешнего цикла. Таким примером будет "расплющивание" вложенной коллекции.

In [18]:
matrix = [
    [1, 2, 3, 4], 
    [5, 6, 7, 8],
    [9, 0, 1, 2],
]
a = [i for row in matrix for i in row]
print(f'{a = }')

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2]


In [19]:
a = []
for row in matrix:
    for i in row:
        a.append(i)
print(f'{a = }')

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2]


Еще одним интересным примером "расплющить" список с глубиной = 2 служит использование встроенной функции ```sum```. Подробнее о работе этого примера читайте в [обсуждении на stackoverflow](https://stackoverflow.com/questions/33541947/what-does-the-built-in-function-sum-do-with-sumlist/33542054#33542054).

In [20]:
print(f'{sum(matrix, []) = }')

sum(matrix, []) = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2]


## Включения в словарь (```dict comprehensions```)

Конструкция включений в словарь полностью эквивалентна включениям в список. Разница состоит только в том, что здесь можно оперировать ключами и значениями.

Ниже приведен пример создания словаря, где ключами выступают нечетные номера символов, а значениями сами символы.

In [21]:
d = {i: chr(i) for i in range(97, 123, 2)}
print(f'{d = }')

d = {97: 'a', 99: 'c', 101: 'e', 103: 'g', 105: 'i', 107: 'k', 109: 'm', 111: 'o', 113: 'q', 115: 's', 117: 'u', 119: 'w', 121: 'y'}


## Включения в множество (```set comprehensions```)

Включения во множество отличаются от прочих только литералами. Они должны быть заключены в фигурные скобки.

In [22]:
a = {i for i in range(5)}
print(f'{a = }')

a = {0, 1, 2, 3, 4}


Вложенные включения могут быть разного вида и расположены в разных местах, в том числе в условных выражениях.

В качестве такого примера можно использовать вычисления списка простых чисел с помощью [решета Эратосфена](https://en.wikipedia.org/wiki/Sieve_of_Eratosthenes). 

В первом цикле идет перебор всех чисел, которые фильтруются по определенному условию. Это условие проверяет находится ли число во множестве составных чисел. Это множество в свою очередь строится как другое включение.

In [23]:
n = 30
a = [i for i in range(2, n+1) if i not in {j for k in range(2, n//2) for j in range(2*k, n+1, k)}]
print(a)

[2, 3, 5, 7, 11, 13, 17, 19, 23, 29]


## Включения в кортеж

Включений в кортеж в чистом виде в Python нет. нельзя просто так взять и написать включение в круглых скобках. Это приведет к созданию объекта-генератора, а не кортежа. Такие объекты будут рассмотрены отдельно.

In [24]:
a = (i for i in range(5))
print(f'{a = }')
print(f'{type(a) = }')

a = <generator object <genexpr> at 0x00000162F9F58890>
type(a) = <class 'generator'>


Для создания кортежа с помощью включения необходимо использовать функцию ```tuple```. Но и в этом случае это не будет чистым включением, т.к. сначала будет создан генератор который затем будет преобразован в кортеж. Самостоятельно убедитесь в этом с помощью модуля ```dis```.

In [25]:
tuple(i for i in range(5))

(0, 1, 2, 3, 4)

# Полезные ссылки

- [Документация по list comprehensions](https://docs.python.org/3/tutorial/datastructures.html#list-comprehensions)
- [When to Use a List Comprehension in Python](https://realpython.com/list-comprehension-python/)
- [Статья, где проводятся аналогии между Exal и SQL](https://lerner.co.il/2015/07/16/want-to-understand-pythons-comprehensions-think-like-an-accountant/)
- [Статья, где наглядно демонстрируется синтаксис включений](https://treyhunner.com/2015/12/python-list-comprehensions-now-in-color/)
- [Статья о включениях (на русском)](https://habr.com/ru/post/320288/)
- [Что функция делает функция ```sum(list, [])```?](https://stackoverflow.com/questions/33541947/what-does-the-built-in-function-sum-do-with-sumlist/33542054#33542054)