# Списковые сборки (list comprehantions)
- это удобный и компактный способ создания и обработки списко в Python. В отличии от использования встроенных функций высшего порядка, таких как map и filter, списковые сборки позволяют создавать и трансформировать списки за одну строку кода, что делает их более читабельными и эффективными.


Преимущества использования списковых сборок

1) Читаемость: код становится более компактным и легко воспринимаемым, поскольку операции фильтрации и обработки данных объединены в одной строке.

2) Производительность: списковые сборки зачастую быстрее, чем использование map() и filter(), так как они реализуются на уровне Python и выполняются непосредственно в цикле.

3) Удобство: использование списковых сборок избавляет от необходимости создавать отдельные функции для операций над данными, как это требуется при использовании map() и filter().

Пример:

На предыдущем уроке мы рассматривали две встроенные функции высшего порядка: map() и filter(). Эти функции часто используются для обработки коллекций данных.

Функция map() применяется для преобразования каждого элемента в коллекции с помощью заданной функции.
Функция filter() используется для фильтрации элементов, оставляя только те, которые соответствуют заданному условию.

In [2]:
def by_3(x):
    return x * 3

def is_odd(x):
    return x % 2 == 1

nums = [2,3,4,5,2,4,6,4,4,3,6,7,4,3]
result = map(by_3, filter(is_odd, nums))
print(list(result))

[9, 15, 9, 21, 9]


# Замена map

В данном примере мы комбинируем две встроенные функции Python — map() и filter() — для выполнения двух последовательных операций над списком.


1) Функция filter(): она используется для фильтрации элементов списка, оставляя только те, которые соответствуют условию. В нашем случае мы используем функцию "is_odd", которая возвращает True для нечётных чисел. Таким образом, с помощью "filter(is_odd, nums)" мы получаем новый список, содержащий только нечётные числа из оригинального списка "nums", которая при этом умноженные на три.

2) Функция map(): она применяется для преобразования каждого элемента списка с помощью указанной функции. В нашем случае мы передаём результат работы filter() (список нечётных чисел) в функцию map(by_3, ...), которая умножает каждый элемент списка на 3.

Заменим map на списковую сботку для чисел nums

In [3]:
print(f'{nums=}')
result = [num * 3 for num in nums]
print(f'{result=}')

nums=[2, 3, 4, 5, 2, 4, 6, 4, 4, 3, 6, 7, 4, 3]
result=[6, 9, 12, 15, 6, 12, 18, 12, 12, 9, 18, 21, 12, 9]


## Замена filter

Помимо выполнения операций над элементами, в списковой сборке можно также фильтровать данные, комбинируя возможности функций map и filter. Условие для фильтрации в "list comprehension" добавляется после цикла for. Сначала указывается операция над элементом, затем пишется цикл for, и в конце добавляется условие, например, "if x > 5", if type(x) == чему-то", или "if x % 5 == 0". Это позволяет фильтровать элементы на основе заданных критериев.

Такая конструкция делает код компактным и выразительным, хотя иногда "list comprehension" может становиться довольно длинным. Однако, несмотря на это, использование списковых сборок значительно сокращает количество строк кода.

В списковой сборке может быть только одно условие if, то есть конструкций типа elif или else использовать нельзя. Это ограничение следует учитывать при написании кода. Однако, это не будет проблемой, так как зачастую можно обойтись одним условием, что упрощает конструкцию.

In [4]:
print(f'{nums=}')
result = [num * 3 for num in nums if num % 2 == 1]
print(f'{result=}')

nums=[2, 3, 4, 5, 2, 4, 6, 4, 4, 3, 6, 7, 4, 3]
result=[9, 15, 9, 21, 9]


In [5]:
# Без списковых сборок

result = []
for num in nums:
    if num % 2 == 1:
        result.append(num * 3)


Ранее было сказано, что условие в «list comprehension» (генераторе списков) можно добавлять только после цикла for. Однако теперь, благодаря улучшению синтаксиса, можно добавлять условие непосредственно после объявления операции и элемента в генераторе списка. Это позволяет нам делать более гибкие преобразования и добавлять дополнительные условия и операции.

Почему это важно?

1) Добавление else в условие: теперь, после цикла for, мы можем добавить не только условие с фильтрацией элементов, но и выполнить различные операции с элементами, удовлетворяющими или не удовлетворяющими условию. Это даёт больше возможностей для манипуляции элементами в одном выражении.

2) Изменение порядка элементов: это изменение позволяет не только фильтровать элементы, но и модифицировать их на основе условий, проверяемых в момент добавления каждого элемента в новый список.


## Условие в блоке действия

Мы будем добавлять «x * 2» только в случае, если «x > 2». То есть, если значение больше 2, то результатом будет умножение на 2. В противном случае, срабатывает блок «else», и мы добавляем «x * 10». В итоге, у нас есть два возможных пути:

1) Если «x > 2», добавляем «x * 2».
2) Если «x ≤ 2», добавляем «x * 10».

Таким образом, если конструкция «if...else» размещена сразу после элемента перед циклом «for», она изменяет операцию, выполняемую с каждым элементом, а не просто фильтрует их. Если же использовать только блок «if», то это будет эквивалентно фильтрации данных, где мы добавляем только «x * 2», если «x > 2». То есть, в случае использования только «if», элементы, не удовлетворяющие условию, не будут добавляться.

Добавление блока «else» позволяет выполнить дополнительное действие, если условие «if» не выполняется. В таком случае мы обязательно добавим каждый элемент, но результат будет зависеть от выполнения условия: если «x > 2», добавим «x * 2», если нет — «x * 10».

Конструкция с «if...else» перед циклом «for» в генераторе списка — это редкость, чаще всего она используется для алгоритмических задач. Такая запись позволяет сэкономить время, так как её можно быстро написать, вместо того чтобы использовать функции типа «map» и «filter». Однако это не означает, что «map» и «filter» нельзя использовать, они вполне подходят для других ситуаций. Мы говорим именно о генерации списков.

In [6]:
print(f'{nums=}')
result = [x*2 if x > 2 else x*10 for x in nums]
print(result)

nums=[2, 3, 4, 5, 2, 4, 6, 4, 4, 3, 6, 7, 4, 3]
[20, 6, 8, 10, 20, 8, 12, 8, 8, 6, 12, 14, 8, 6]


## Вложенные списковые сборки

In [15]:
from random import randint


nums1 = [randint(1, 10) for _ in range(10)]
nums2 = [randint(1, 10) for _ in range(5)]

print(f'{nums1=}')
print(f'{nums2=}')

result = [x * y for x in nums1 for y in nums2]
print(result, len(result))

# Аналог этой записи это

result = []
for x in nums1:
    for y in nums2:
        result.append(x*y)
print(result, len(result))



nums1=[9, 1, 10, 2, 2, 1, 8, 8, 5, 9]
nums2=[9, 5, 1, 8, 1]
[81, 45, 9, 72, 9, 9, 5, 1, 8, 1, 90, 50, 10, 80, 10, 18, 10, 2, 16, 2, 18, 10, 2, 16, 2, 9, 5, 1, 8, 1, 72, 40, 8, 64, 8, 72, 40, 8, 64, 8, 45, 25, 5, 40, 5, 81, 45, 9, 72, 9] 50
[81, 45, 9, 72, 9, 9, 5, 1, 8, 1, 90, 50, 10, 80, 10, 18, 10, 2, 16, 2, 18, 10, 2, 16, 2, 9, 5, 1, 8, 1, 72, 40, 8, 64, 8, 72, 40, 8, 64, 8, 45, 25, 5, 40, 5, 81, 45, 9, 72, 9] 50


## А как сделать так чтобы элементы брались попарно а не вложенным условием?

Для того чтобы сделать попарную обработку элементов массива, мы используем функцию zip(). Она принимает несколько итерируемых объектов и возвращает их элементы по количеству переданных итерируемых объектов.


In [21]:
print(f'{nums1=}')
print(f'{nums2=}')

result = [x * y for x,y in zip(nums1, nums2)]
print(result)
print(zip(nums1, nums2))
print(list(zip(nums1, nums2)))
print(list(zip(nums1, nums2, nums)))

nums1=[9, 1, 10, 2, 2, 1, 8, 8, 5, 9]
nums2=[9, 5, 1, 8, 1]
[81, 5, 10, 16, 2]
<zip object at 0x000001FCA8B93EC0>
[(9, 9), (1, 5), (10, 1), (2, 8), (2, 1)]
[(9, 9, 2), (1, 5, 3), (10, 1, 4), (2, 8, 5), (2, 1, 2)]


Фильтрация во вложенности

In [23]:
print(f'{nums1=}')
print(f'{nums2=}')

result = [x * y for x in nums1 for y in nums2 if x%2==0 if y%2==1] # нагруженная запись
print(result, len(result))


# Аналог этой записи это

result = []
for x in nums1:
    for y in nums2:
        if x%2==0:
            if y%2==1:
                result.append(x*y)
print(result, len(result))

nums1=[9, 1, 10, 2, 2, 1, 8, 8, 5, 9]
nums2=[9, 5, 1, 8, 1]
[90, 50, 10, 10, 18, 10, 2, 2, 18, 10, 2, 2, 72, 40, 8, 8, 72, 40, 8, 8] 20


Оптимальным вариантом записи является фильтрация после конкретного перебора

In [24]:
result = [x * y for x in nums1 if x%2==0 for y in nums2 if y%2==1]
print(result, len(result))

[90, 50, 10, 10, 18, 10, 2, 2, 18, 10, 2, 2, 72, 40, 8, 8, 72, 40, 8, 8] 20


In [25]:
print(f'{nums1=}')
print(f'{nums2=}')

result = [x * y for x in nums1 for y in nums2 if x%y==0]
print(result, len(result))

nums1=[9, 1, 10, 2, 2, 1, 8, 8, 5, 9]
nums2=[9, 5, 1, 8, 1]
[81, 9, 9, 1, 1, 50, 10, 10, 2, 2, 2, 2, 1, 1, 8, 64, 8, 8, 64, 8, 25, 5, 5, 81, 9, 9] 26


# Dict comprehansions (Словарные вставки)

Словарная сборка (или генерация словаря) — это метод создания словаря с использованием выражений, циклов и условий, аналогичных списковым сборкам. В словарной сборке используется синтаксис с фигурными скобками, и она позволяет создавать пары "ключ:значение". Этот инструмент полезен, когда необходимо динамически строить словарь на основе данных.

Словарные сборки обеспечивают компактность, гибкость и производительность. Они позволяют легко фильтровать данные, применять преобразования и создавать сложные структуры. Также с помощью словарных сборок можно легко работать с несколькими коллекциями, объединяя их в один словарь, где одна коллекция используется для ключей, а другая — для значений.


In [26]:
nums_d_1 = [x for x in range(10)]
nums_d_2 = [randint(1,100) for _ in range(10)]

result = {x for x in nums_d_1}
print(result, len(result), type(result))


{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} 10 <class 'set'>


In [33]:
print(f'{nums_d_1=}')
print(f'{nums_d_2=}')
result = {key: value  for key in nums_d_1 for value in nums_d_2}
print(result, len(result), type(result)) # Если нужно сопоставить ключи и значение из 2 списков, подход с вложенными итераторами не подходит
result = {key: value  for key, value in zip(nums_d_1,nums_d_2)}
print(result, len(result), type(result))
result = {f'key-{key}': value**2  for key, value in zip(nums_d_1,nums_d_2) if value > 50}
print(result, len(result), type(result))
result = {f'Значение {value}': value**2  for value in nums_d_2 if value > 30}
print(result, len(result), type(result))

nums_d_1=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
nums_d_2=[10, 60, 40, 38, 12, 15, 61, 50, 100, 71]
{0: 71, 1: 71, 2: 71, 3: 71, 4: 71, 5: 71, 6: 71, 7: 71, 8: 71, 9: 71} 10 <class 'dict'>
{0: 10, 1: 60, 2: 40, 3: 38, 4: 12, 5: 15, 6: 61, 7: 50, 8: 100, 9: 71} 10 <class 'dict'>
{'key-1': 3600, 'key-6': 3721, 'key-8': 10000, 'key-9': 5041} 4 <class 'dict'>
{'Значение 60': 3600, 'Значение 40': 1600, 'Значение 38': 1444, 'Значение 61': 3721, 'Значение 50': 2500, 'Значение 100': 10000, 'Значение 71': 5041} 7 <class 'dict'>
