# Прикладное программное обеспечение
#### Python для извлечения и обработки данных


## Списки и кортежи, цикл `for`

*Автор: Александра Краснокутская, Валентина Лебедева, НИУ ВШЭ*

### Списки — `list`

Давайте представим, что при написании программы нам нужно работать, например, с большой базой данных студентов ОП "Социология". 

Если студентов несколько сотен, нет смысла создавать для каждого отдельную переменную — нам нужно научиться сохранять их всех в одной переменной. Начиная с этого семинара, мы будем изучать типы данных, которые позволяют это делать.

Начнем мы со **списков**. Если вы изучали другие языки программирования, то наверняка знакомы с аналогичным типом данных - массивами.

Давайте для начала попробуем создать список из 3 студентов.

In [None]:
students = ['Ivan Ivanov', 'Tatiana Sidorova', 'Maria Smirnova']
print(students)
print(type(students))

Пустой список можно создать двумя способами — оператором `[]` и функцией `list()`.

In [None]:
print([])
print(list())

Список может содержать любые данные — например, числа.  
Давайте создадим список оценок студента.

In [None]:
notes = [6, 5, 7, 5, 8]
print(notes)

Список может быть даже смешанным. Например, давайте сохраним в одном списке имя студента, его год рождения, средний балл, и логическую переменную, которая будет равна `True`, если студент учится на бюджете.

In [None]:
student1 = ['Ivan Ivanov', 2001, 7.5, True]
print(student1)

Список может даже содержать другие списки.  
Давайте создадим еще одного студента по аналогии со `student1` и положим этих двух студентов в еще один список.

In [None]:
student2 = ['Maria Smirnova', 2000, 7.9, False]
students = [student1, student2]
print(students)

Как и символы строк, элементы списков нумеруются, начиная с 0.  
И аналогичным образом мы можем получить доступ к элементу списка по его индексу.

In [None]:
students = ['Ivan Ivanov', 'Tatiana Sidorova', 'Maria Smirnova']
print(students[0])
print(students[1])
print(students[-1])

И как и в случае строки, мы можем узнать длину списка с помощью функции `len()`.

In [None]:
print(len(students))

Но, в отличие от строк, список можно изменить.

In [None]:
students[1] = 'Petr Petrov'
print(students)

### Метод `.split()`

Метод строки `.split()` получает на вход строку-разделитель и возвращает список строк, разбитый по этому разделителю.

По умолчанию метод разбивает строку по пробелу

In [None]:
print('Hello darkness my old friend'.split())

# Несколько разделителей подряд? не беда, они будут прочитаны как один
print('Hello    darkness  my old     friend'.split()) 

In [None]:
print('Ночь. Улица. Фонарь. Аптека'.split('. '))

Также можно совмещать `.split()` с `input()`.

In [None]:
L = input().split(', ')
print(L)

### Кортежи — `tuple`
Кортежи очень похожи на списки.

In [None]:
student = ('Ivan Ivanov', 2001, 7.5, True)
print(student)
print(type(student))

Пустой кортеж можно создать с помощью оператора `()` либо функции `tuple()`.

In [None]:
print(())
print(tuple())

Основное отличие кортежей от списков состоит в том, что кортежи нельзя изменять (да-да, прямо как строки).

In [None]:
student[1] = 2002

Списки и кортежи могут быть вложены друг в друга.
Например, пусть в информации о студенте у нас будет храниться не его средний балл, а список всех его оценок.

In [None]:
student = ('Ivan Ivanov', 2001, [8, 7, 7, 9, 6], True)
print(student)

Мы можем обратиться к элементу вложенного списка или кортежа с помощью двойной индексации.

In [None]:
print(student[2][1]) # Получили вторую оценку

Иногда бывает полезно обезопасить себя от изменений массивов данных и использовать кортежи, но чаще всего мы все-таки будем работать со списками.

### Цикл `for`

Мы уже умеем писать циклы с помощью оператора `while`, но теперь мы готовы познакомиться с еще одним способом.

Давайте вспомним про наш список студентов и выведем их имена по очереди. Для начала уже знакомым способом.

In [None]:
students = ['Ivan Ivanov', 'Tatiana Sidorova', 'Maria Smirnova']

i = 0
while i < len(students):
    print(students[i])
    i += 1

А теперь напишем то же самое с помощью цикла `for`.

Теперь мы будем перебирать список `students`, доставая из него по одному элементу.

In [None]:
students = ['Ivan Ivanov', 'Tatiana Sidorova', 'Maria Smirnova']

for student in students:
    print(student)

В примере выше на каждом шаге цикл `for` достает очередной элемент из списка `students` и сохраняет его в переменную `student`.

Обратите внимание, что переменную `student` нам не надо создавать заранее, она создается прямо во время работы цикла.

Получившийся код гораздо короче и проще варианта с использованием `while`.

Цикл `for` может перебирать и элементы `range()`, это дает нам еще один способ решения задачи.

In [None]:
students = ['Ivan Ivanov', 'Tatiana Sidorova', 'Maria Smirnova']

for i in range(len(students)): # Здесь не надо преобразовывать range в список или кортеж
    print(students[i])

Цикл `for` может перебирать и кортежи, и даже строки.

In [None]:
myStr = 'Hello'

for char in myStr:
    print(char)

# Задачи для тренировки
Часть из этих задач мы решим в классе. Но если мы даже не успеем - попытайтесь сделать их дома сами.

### Задание 1. Корпоративная почта 

Компания "Пампарам" регистрирует сотрудникам корпоративные почты и хочет оставить им логины, которыми они уже привыкли пользоваться. Единственное условие — почты не должна начинаться с цифр или c точки, тире, нижнего подчеркивания, поэтому если такие символы встречаются, то они должны быть отброшены. Помогите компании сформировать новый список почт на домене pamparam.ru

**ФОРМАТ ВВОДА**

+ Список почтовых адресов сотрудников компании через точку с запятой и пробел.

**ФОРМАТ ВЫВОДА**

+ Список новых почтовых адресов сотрудников компании — домены (то, что идет после @), должны быть заменены на домен pamparam.ru, а с левой стороны должны быть отброшены символы, на которые не должен начинаться почтовый адрес. Список выведите через точку с запятой и пробел.
.

**ПРИМЕР**

Входные данные:  
0-1in.ianv00@gmail.com; 42.petr.petrov@mail.ru; _1990_olg0a@hse.ru   
Вывод программы:  
in.ianv00@pamparam.ru; petr.petrov@pamparam.ru; olg0a@pamparam.ru

In [None]:
L = input().split('; ')
L_new = []

for i in L:
    L_new.append(i.lstrip('_-.0123456789').split('@')[0] + '@pamparam.ru')
    
print("; ".join(L_new))

### Задание 2. Повышенная стипендия

Студент может подать документы на повышенную стипендию, если его средний балл по итогам сессии не ниже 8.

**ФОРМАТ ВВОДА**

+ Вводятся оценки студента за сессию (целые числа от 1 до 10) в одну строку через пробел

**ФОРМАТ ВЫВОДА**

+ Выведите YES, если студент может подать документы на повышенную стипендию, и NO, если нет.

**ПРИМЕР**  
  
Входные данные:  
6 8 7 6   
Вывод программы:  
NO

In [None]:
L = input().split()

print(L)

x = 0

for i in L:
    x += int(i)
    
print(x)

10 8 9
['10', '8', '9']
27


In [None]:
if x/len(L) >= 8:
    print('YES')
else:
    print('NO')

YES


### Задание 3. Несовершеннолетние студенты

Студсовет факультета организует вечеринку, но после 23 часов им нужно отвезти в общежитие всех несовершеннолетних студентов. Несовершеннолетними считаются все студенты, родившиеся после 2001 года.

**ФОРМАТ ВВОДА**

+ Вводится целое неотрицательное число N <= 1000  
+ Далее, вводится N строк формата "Имя Фамилия; Год рождения"

**ФОРМАТ ВЫВОДА**

+ Вывести список всех несовершеннолетних студентов

**ПРИМЕР**  
  
Входные данные:  
5  
Ivan Ivanov; 2001  
Petr Petrov; 2002  
Maria Smirnova; 2002  
Makar Makarov; 2002  
Tatiana Kuznetsova; 2000  

Вывод программы:   
Petr Petrov  
Maria Smirnova  
Makar Makarov  

In [None]:
N = int(input())
string = ''

i = 0

while i < N:
    st = input().split('; ')
    if int(st[1]) > 2001:
        string += st[0] + ' '
    i += 1

5
Ivan Ivanov; 2001
Petr Petrov; 2002
Maria Smirnova; 2002
Makar Makarov; 2002
Tatiana Kuznetsova; 2000


In [None]:
string.split()

['Petr', 'Petrov', 'Maria', 'Smirnova', 'Makar', 'Makarov']

In [None]:
for i in range(0, len(string.split()), 2):        # Обратите внимание, что установлен шаг = 2
    print(string.split()[i], string.split()[i+1])

Petr Petrov
Maria Smirnova
Makar Makarov
