Центр непрерывного образования

# Программа «Python для автоматизации и анализа данных»

Неделя 3 - 1

*Ян Пиле, НИУ ВШЭ*  

# Цикл for. Применение циклов к строкам, спискам, кортежам и словарям.

### Генераторы списков и списковые включения. aka List Comprehensions
Этот элемент языка считается его "визитной карточкой". Это своего рода метод быстро создать новый список, не применяя цикл for. Пусть мы, к примеру, хотим создать список с числами от 0 до 20

In [126]:
a = []
for i in range(20):
    a.append(i)
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

Это же выражение можно записать с помощью спискового включения

In [131]:
a = [i for i in range(20)]
print(type(a))
print(a)

<class 'list'>
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


Что мы видим? Во-первых, на выходе такой конструкцими мы получили лист (конечно, это же СПИСКОВОЕ включение). А во-вторых, все написано в одну строчку и , кажется следует вот такой конструкции:

**new_list** = [**expression** for **member** in **iterable**]

1. **expression** какое либо вычисление, вызов метода или любое другое допустимое выражение, которое возвращает значение. В приведенном выше примере выражение i * i является квадратом значения члена.
2. **member** является объектом или значением в списке или итерируемым объекте (iterable). В приведенном выше примере значением элемента является i.
3. **iterable** список, множество, последовательность, генератор или любой другой объект, который может возвращать свои элементы по одному. В приведенном выше примере iterable является range(20).

Одним из основных преимуществ использования является то, что это единственный инструмент, который вы можете использовать в самых разных ситуациях. В дополнение к созданию стандартного списка, списки могут также использоваться для отображения и фильтрации. Вам не нужно использовать разные подходы для каждого сценария. Например, можно в раздел **expression** поставить функцию str(), которая превратит каждый элемент исходного списка в строку.

In [134]:
lst = [1,2,3,4,5,45,67,8,765,854,76]
x = [str(i) for i in lst]
x

['1', '2', '3', '4', '5', '45', '67', '8', '765', '854', '76']

Но и это еще не все. В списковое включение можно добавить какое нибудь условие (как мы это делали с **if**). Выглядеть это будет так:

    new_list = [expression for member in iterable (if conditional)]

Разберем на примере:

In [135]:
lst = [1,2,3,4,5,45,67,8,765,854,76]
x = [i for i in lst if i%2 == 0] #Здесь я взял и включил в новый список только четные элементы
x

[2, 4, 8, 854, 76]

Более того - не зря в условии написано iterable, а не list. Значит можно попробовать проделать что-то подобное с любыми другими итерируемыми объектами. с кортежами все точно должно получиться:

In [141]:
# Предложение
sentence = '''The rocket, who was named Ted, came back  
            from Mars because he missed his friends.'''

# Гласные английского языка и пробел
vowels = 'aeiou '

# достанем в список все символы строки, которые не являются гласными и пробелом.
consonants = [i for i in sentence if i not in vowels]
consonants

['T',
 'h',
 'r',
 'c',
 'k',
 't',
 ',',
 'w',
 'h',
 'w',
 's',
 'n',
 'm',
 'd',
 'T',
 'd',
 ',',
 'c',
 'm',
 'b',
 'c',
 'k',
 '\n',
 'f',
 'r',
 'm',
 'M',
 'r',
 's',
 'b',
 'c',
 's',
 'h',
 'm',
 's',
 's',
 'd',
 'h',
 's',
 'f',
 'r',
 'n',
 'd',
 's',
 '.']

Мы уже поняли, что можно поместить условие в конец оператора для простой фильтрации, но что, если хочется изменить значение элемента вместо его фильтрации? В этом случае полезно поместить условное выражение в начале выражения. Выглядит это вот так:

    new_list = [expression (if conditional) for member in iterable]

С помощью этого шаблона можно, например, использовать условную логику для выбора из нескольких возможных вариантов вывода. Допустим, у вас есть список цен, можно заменить отрицательные цены (это могут быть какие-то ошибки логирования) на 0 и оставить положительные значения без изменений:

In [143]:
original_prices = [1.25, -9.45, 10.22, 3.78, -5.92, 1.16]
prices = [i if i > 0 else 0 for i in original_prices]
prices

[1.25, 0, 10.22, 3.78, 0, 1.16]

Здесь, наше выражение **i** содержит условный оператор, **if i> 0** else **0**. Это говорит Python выводить значение **i**, если число положительное, но менять **i** на **0**, если число отрицательное.

### Включения для множеств и словарей

Хотя **list comprehension** в Python является распространенным инструментом, вы также можете создавать множественные и словарные представления (**set and dictionary comprehensions**). **set comprehension** почти точно такое же, как представление списка. Разница лишь в том, что заданные значения обеспечивают, чтобы выходные данные не содержали дубликатов. Вы можете создать **set comprehension**, используя фигурные скобки вместо скобок:

In [144]:
quote = "life, uh, finds a way"
unique_vowels = {i for i in quote if i in 'aeiou'}
unique_vowels

{'a', 'e', 'i', 'u'}

Здесь мы вывели все уникальные гласные, которые встретились в строке

**Dictionary comprehensions** , по сути, работает так же, но с дополнительным требованием определения ключа. Ключ отделяется двоеточием.


In [152]:
squares = {i: i * i for i in range(10)}
squares

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

### Генераторы списков

По сути, это то же самое, что списковое включение, но только возвращает оно не сам список, а генератор. 

In [164]:
type((i * i for i in range(10)))

generator

Проверим:

In [165]:
x = (i * i for i in range(10))

In [166]:
next(x)

0

In [167]:
next(x)

1

Так-так, функция next работает.

In [168]:
x[4]

TypeError: 'generator' object is not subscriptable

К элементам обращаться нельзя

In [170]:
x = (i * i for i in range(10))
while True:
    print(next(x))

0
1
4
9
16
25
36
49
64
81


StopIteration: 

**StopIteration!** Опять что-то знакомое) Получается, что генератор, это , на самом деле, какой-то вид итератора. Так оно и есть. Генератор это итератор, который можно получить с помощью генераторного выражения, например, (i * i for i in range(10)) или с помощью функции-генератора (но об этом в следующей серии.


Так а зачем все это нужно-то? А вот возьмите, например, и посчитайте сумму квадратов первого миллиона чисел

In [1]:
%time
sum([i * i for i in range(1000000)])

CPU times: user 3 µs, sys: 0 ns, total: 3 µs
Wall time: 6.91 µs


333332833333500000

In [2]:
%time
sum(i * i for i in range(1000000))

CPU times: user 2 µs, sys: 0 ns, total: 2 µs
Wall time: 3.81 µs


333332833333500000

При использовании генератора время существенно меньше

Ура, теоретическая часть закончилась. Теперь можно порешать задачи!

## Задача 1

Согласно политике безопасности банка, пароль не может содержать года рождения клиента — иначе вероятность подобрать пароль увеличивается. Напишите программу, которая будет проводить такую проверку. 

ФОРМАТ ВВОДА 

На первой строке — полный год рождения клиента (то есть 4 символа, например, «1968»). 
На второй строке — три варианта пароля, придуманных клиентом, записанных через пробел. 

ФОРМАТ ВЫВОДА 

True, если в пароле есть подстрока с годом рождения, и False, если нет. 
Ответ по каждому варианту пароля нужно выводить с новой строки.

## Задача 2

Саша всю ночь готовится к игре в города, выписывая все встречающиеся в интернете названия городов. Напишите программу, которая принимает на вход строку с названиями городов, затем одну заглавную букву, и выводит все города из строки, которые на нее начинаются. 

ФОРМАТ ВВОДА

Строка, которая содержит названия городов, разделенные запятой и пробелом. 
Заглавная буква.  

ФОРМАТ ВЫВОДА 

Города из введенной строки, начинающиеся на заданную заглавную букву, каждое название города на новой строке

## Задача 3

В олимпиаде участвовали N человек. Их результаты записаны в формате 'N баллов', причем в начале и в конце строки может быть любое количество пробелов. Посчитайте средний балл участников. 

ФОРМАТ ВВОДА

Программа получает на вход число участников олимпиады N. 
Далее идет N строк, в каждой строке записан результат участника в вышеописанном формате. 

ФОРМАТ ВЫВОДА

Вещественное число — средний балл всех участников.

## Задача 4

В течение спортивного сезона проводится 5 соревнований. Если спортсмен участвовал в соревновании, он получает 1 очко рейтинга, если при этом вошел в первую тройку — 3 очка, если выиграл — 5 очков. Напишите программу, которая по турнирной таблице и фамилии спортсмена считает рейтинг этого спортсмена. 

ФОРМАТ ВВОДА 

Турнирная таблица — пять строк, в каждой из которых через запятую имена спортсменов в том порядке, какие места они заняли на соответствующем соревновании. 
После этого вводится еще одна строка — имя спортсмена 

ФОРМАТ ВЫВОДА 

Целое число — рейтинг введенного спортсмена

## Задача 5

В университете проходит благотворительная лотерея. Студенты приобретают лотерейные билеты, которые вытягивают случайным образом, а через некоторое время объявляются номера выигрышных билетов. Помогите определить, кто победил в лотерее. 

ФОРМАТ ВВОДА

Записи о приобретенных лотерейных билетах: имя покупателя и, через точку с запятой и пробел, номер билета (целое число). Каждая запись вводится с новой строки. Имя покупателя может содержать любые символы, кроме точки с запятой.
Один студент может купить несколько билетов, но в каждой строке указывается номер только одного билета.
Когда записи заканчиваются, на отдельной строке вводится слово "END". 
Далее в одну строку через пробел вводятся номера выигрышных билетов из приобретенных.
Гарантируется, что был куплен хотя бы один билет. 
ФОРМАТ ВЫВОДА 

Имена победителей лотереи в одну строку через запятую и пробел. 
Если один человек купил несколько выигрышных билетов, выведите его имя один раз. 
Имена должны выводиться в алфавитном порядке.

## Задача 6

Алиса собирает статистику расходов за месяц и хочет проверить, сколько денег она потратила в определенный период. Помогите ей написать программу, которая ей поможет.

ФОРМАТ ВВОДА

Записи вида "<ДЕНЬ МЕСЯЦА> <СУММА>", состоящие из двух целых чисел, разделенных пробелом. Днем месяца может быть любое число от 1 до 31, суммой может быть любое целое число. Каждая запись на новой строке. Дни месяца не повторяются, но могут идти не по порядку.
Гарантируется, что будет введена информация как минимум об одном дне.
Записи вводятся до тех пор, пока не будет введено число 0.
После этого вводится целое число от 1 до 31 — верхняя граница интервала (включительно), для которого Алиса хочет найти общую сумму расходов.

ФОРМАТ ВЫВОДА

Одно целое число — общая сумма расходов Алисы в определенный интервал времени: от первого числа месяца до введенного числа включительно.
Если за этот период не было трат — выводится 0.