# List comprehensions и функция zip

В этом уроке:
- ещё немного поработаем со словарями
- разберём различные методы инициализации словарей
- научимся  работать с генераторами для множеств, словарей и списков.

Рассмотрим простую задачу со словарями. Вам на вход приходит два списка: список товаров и список соответствующих данным товарам цен. 


In [None]:
items = ['Кофта', 'Брюки', 'Кроссовки', 'Шляпа', 'Игрушка']
prices = [1000, 2000, 1999, 3000, 500]

Нужно написать программу, которая будет выдавать стоимость товара. Наименование товара пишется пользователем через стандартный ввод.

На первый взгляд задача проста, но как нам собрать пары ключ-значение из двух списков одновременно? Можно сделать что-то подобное с помощью цикла `for`. Запустить цикл по всем индексам одного из списков и в словарь класть ключ из списка `items` по индексу `i` и значение из списка `prices` по индексу `i`.




In [None]:
item_prices = {}

for i in range(len(items)):
    item_prices[items[i]] = prices[i]

In [None]:
item_prices

{'Кофта': 1000,
 'Брюки': 2000,
 'Кроссовки': 1999,
 'Шляпа': 3000,
 'Игрушка': 500}

Вариант вполне рабочий, но можно и полегче, итерируясь сразу по двум спискам одновременно. Для этого есть специальная функция  `zip`, которая позволяет одновременно работать с несколькими списками (можно двумя, тремя и так далее).



In [None]:
item_prices = {}

for item, price in zip(items, prices):
    item_prices[item] = price

In [None]:
item_prices

{'Кофта': 1000,
 'Брюки': 2000,
 'Кроссовки': 1999,
 'Шляпа': 3000,
 'Игрушка': 500}

Есть вариант еще легче: просто положить в `dict` функцию `zip` над двумя списками: 

In [None]:
item_prices = dict(zip(items, prices))
item_prices

{'Кофта': 1000,
 'Брюки': 2000,
 'Кроссовки': 1999,
 'Шляпа': 3000,
 'Игрушка': 500}

Почему это работает? Потому что `zip` на выходе выдаёт список кортежей, что по факту является списком пар ключ-значение. Попробуем увидеть результат функции `zip` в отдельной ячейке. 

In [None]:
zip(items, prices)

<zip at 0x7fe8d46ad9c0>

Получили объект типа `zip`. Обернём его в `list` и посмотрим результат на списке:





In [None]:
list(zip(items, prices))

[('Кофта', 1000),
 ('Брюки', 2000),
 ('Кроссовки', 1999),
 ('Шляпа', 3000),
 ('Игрушка', 500)]

Теперь осталось считать строку с товаром с экрана и проверить, есть ли данный ключ в словаре. Если есть — выводить стоимость, если нет — будем выводить, что товара нет: 



In [None]:
item_prices = dict( zip(items, prices))

input_item = input()

if input_item in item_prices.keys():
    result = item_prices[input_item]
else:
    result = 'Товара нет'

print(result)

Шляпа
3000


4 строчки условия можно заменить одной строчкой кода, применив метод `.get()`: он вытаскивает значения по ключу, а если такого ключа нет — выводится сообщение, указанное вторым аргументом.




In [None]:
item_prices = dict( zip(items, prices))

input_item = input()
result = item_prices.get(input_item, 'Товара нет')

print(result)

123
Товара нет


Отлично, наше решение уместилось в 4 строчки кода! Но случилось невероятное: пользователи всегда получали сообщение, что товара нет. Оказалось, что данные в `input_item` всегда приходят в нижнем регистре. И когда программа пытается найти в словаре слово в нижнем регистре, она его не находит, потому что все наши ключи записаны с большой буквы. Нужно привести все айтемы к нижнему регистру.

Как это можно сделать? Можно переписать весь список `items` в нижний регистр:



In [None]:
result_item = []
for item in items:
    result_item.append(item.lower())
    
print(result_item)

['кофта', 'брюки', 'кроссовки', 'шляпа', 'игрушка']


Но можно сделать по-другому: с помощью генератора или list comprehension:



In [None]:
items = [item.lower() for item in items]
items

['кофта', 'брюки', 'кроссовки', 'шляпа', 'игрушка']

Мы записали всё тот же цикл `for`, который был до этого, но в одну строчку. Это и называется *генератор списка*. 

Синтаксис генератора: 
- В результате генерации у нас снова должен получиться список, поэтому ставим квадратные скобки [ ]
- Пишем конструкцию цикла `for`: `for item in items`
- Что нужно сделать с каждым айтемом? Привести в нижний регистр. Перед циклом пишем то, какое действие нужно произвести с каждым элементом списка

![list compr](https://drive.google.com/uc?id=1caaacvfnU7h6irmQnR1LYiGds8zi9ut2)

Писать с помощью генераторов не только удобнее и более легко читаемо, но и быстрее по времени выполнения кода. Сравним время выполнения в двух ячейках на исходном маленьком списке из 5 элементов. 

In [None]:
items = ['Кофта', 'Брюки', 'Кроссовки', 'Шляпа', 'Игрушка']

In [None]:
%%timeit

result_item = []
for item in items:
    result_item.append(item.lower())

831 ns ± 14.2 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [None]:
%%timeit

result_item = []
result_item = [item.lower() for item in items]

803 ns ± 5.81 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


Генератор оказался быстрее.

А теперь попробуем размножить данные в 5 тысяч раз: 

In [None]:
%%timeit

result_item = []
for item in items*5000:
    result_item.append(item.lower())

3.83 ms ± 21.5 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [None]:
%%timeit

result_item = []
result_item = [item.lower() for item in items*5000]

3.33 ms ± 96.6 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Тут уже видим явное преимущество генератора.

Сгенерируем список из квадратов чисел от 1 до 10: 





In [None]:
numbers = [x**2 for x in range(1,11)]
numbers

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

Можно писать генераторы и посложнее. Например, нам нужно выводить только чётные числа. Значит, нужно дописать условие генератору. Если условие без `else`, то оно пишется после `for`:



In [None]:
numbers = [x**2 for x in range(1,11) if x%2==0]
numbers

[4, 16, 36, 64, 100]

Итак, если в генератор нужно добавить условие `if` без `else`, порядок действий будет следующим: сначала то, что нужно сделать, потом перебор с помощью `for`, потом условие.

![list compr if](https://drive.google.com/uc?id=11JqoIz6ahDA7ndfzXJWvj_aCfBh_MR8Y)

Третий тип генератора — с `if-else`. Переберём все числа от 1 до 20. Если встречается чётное число — будем выводить его, а если нечётное — будем выводить его квадрат. Теперь условие пишется до `for`. Будем выводить x, если остаток от деления на 2 равен 0, в противном случае — будем выводить квадрат:



In [None]:
numbers = [x if x%2==0 else x**2 for x in range(1,21)]
numbers

[1, 2, 9, 4, 25, 6, 49, 8, 81, 10, 121, 12, 169, 14, 225, 16, 289, 18, 361, 20]

Если в генераторе нужно добавить условие `if-else`, порядок следующий:
- то, что нужно возвращать при выполнении условия в `if`
- условие `if`
- `else` 
- что нужно выводить, если условие в `if` не выполнилось
- перебор элементов в `for`.

![list compr if else](https://drive.google.com/uc?id=11i2rrn07unRycd_gbBwBprhz41C8mkDM)

Аналогичные операции можно проводить и с множествами. Сгенерируем множество из строк от одного до 10:
- Объявим переменную string_set
- Раз это множество, ставим фигурные скобки, а не квадратные. 
- Какое будет условие перебора в `for`? Все элементы от 1 до 11. 
- Что нужно делать? Нужно преобразовывать в строку каждый элемент.




In [None]:
string_set = {str(x) for x in range(1,11)}
string_set

{'1', '10', '2', '3', '4', '5', '6', '7', '8', '9'}

Генератор также работает и для словарей. Попробуем сгенерировать словарь, где будет пять пар, с ключами от одного до пяти. Для каждого ключа значением будет ключ, умноженный на пять.
- Поскольку это словарь, ставим фигурные скобки. 
- Перебор будет от одного до 6. 
- Что нужно делать? Нужно создавать пару ключ-значение: на первом месте значение из перебора — x, через двоеточие — x * 5.




In [None]:
test_dict = {x: x*5 for x in range(1,6)}
test_dict

{1: 5, 2: 10, 3: 15, 4: 20, 5: 25}

In [None]:
type(test_dict)

dict

В генераторе можно манипулировать сразу несколькими списками с помощью `zip()`. В самом начале занятия мы объявляли словарь из двух списков. 



In [None]:
dict(zip(items, prices))

{'Кофта': 1000,
 'Брюки': 2000,
 'Кроссовки': 1999,
 'Шляпа': 3000,
 'Игрушка': 500}

Это можно было сделать и с помощью генератора: перебираем все элементы из `zip()` и формируем из них пары ключ-значение:
 

In [None]:
test_dict = {item: price for item, price in zip(items, prices)}
test_dict

{'Кофта': 1000,
 'Брюки': 2000,
 'Кроссовки': 1999,
 'Шляпа': 3000,
 'Игрушка': 500}

Генераторы — это своего рода синтаксический сахар Python, но очень удобный, хорошо экономит место и сокращает расходы по памяти и времени выполнения программы.

## Итоги урока

В этом уроке мы:
- узнали ещё больше о словарях,
- научились итерироваться по двум спискам одновременно с помощью `zip()`
- узнали про list, dict, set comprehensions. 

Вспомним классификацию структур данных, о которой мы говорили в самом начале.

![collections](https://drive.google.com/uc?id=1iwdOREH4ZAXc5vvnVv3lwm_-f_XiBTRD)

Коллекции в Python бывают упорядоченные — те, у которых элементы расположены по порядку, у них есть индексы. Такие коллекции называются ***последовательностями (sequence)***. 

Самая гибкая структура данных из последовательностей — ***списки (list)***. Их удобно использовать, когда вам нужно записывать элементы по ходу программы, а после — иметь возможность их удалять и менять. 

Если вы хотите защитить данные от изменения, но также хотите иметь возможность обращаться к ним по индексу, вам подойдут ***кортежи (tuple)***. Записав элементы в кортеж при инициализации, вы не сможете их удалить или изменить в будущем. 

Есть также неупорядоченные коллекции, к элементам которых нельзя обратиться по индексу, но по ним можно итерироваться с помощью циклов. 

***Множества (set)*** — неупорядоченные коллекции. Все элементы в множестве уникальны, и элементы в него можно добавлять по ходу программы. Множества удобно использовать для хранения чего-то уникального: например, списков категорий, городов. 

К неупорядоченным коллекциям также относятся ***словари (dict)***. В словарях хранятся пары ключ-значение. Они позволяют хранить значения как по численным индексам, так и по строковым или, например, индексам-кортежам. В словарях удобно хранить соответствия. Например, количество заказов по региону, где ключом будет регион, а значением — количество заказов.

