# Программирование для всех (основы работы с Python)

*Алла Тамбовцева, НИУ ВШЭ*

## Кортежи, функция `zip()` и сортировка

### Кортежи

Кортежи встречаются не только в программировании, но и в математике. В математике под кортежем обычно понимают упорядоченную совокупность элементов, то есть совокупность, порядок элементов которой фиксирован. В кортеже мы точно знаем, какой элемент является первым, какой – вторым, и так далее.

Внешне кортежи в Python (тип `tuple`) несильно отличаются от списков (тип `list`). Единственное внешнее отличие – элементы кортежа заключаются в круглые, а не в квадратные скобки. При этом Python умеет создавать кортежи «по умолчанию» – если мы просто перечислим элементы через запятую, он автоматически добавит круглые скобки и сформирует кортеж:

In [1]:
1, 0

(1, 0)

In [2]:
1, 8, 9

(1, 8, 9)

Однако мы можем создать кортеж и самостоятельно, поставив нужные скобки:

In [3]:
# питон Петя, которому 5 лет, живет в загородном доме
# в кортеже могут быть элементы разных типов

info = ("Петя", 5, "дом")
print(info)

('Петя', 5, 'дом')


К элементам кортежа можно обращаться точно так же, как к элементам строки или списка:

In [4]:
print(info[0], info[-1])

Петя дом


Точно так же можно перебирать элементы в цикле:

In [5]:
for j in info:
    print(j)

Петя
5
дом


Однако, несмотря на кажущееся сходство, кортежи и списки – принципиально разные объекты. Главное отличие кортежей от списков заключается в том, что кортежи – неизменяемые объекты. Другими словами, изменять элементы кортежа нельзя. 

Проверим: попробуем выбрать элемент кортежа и через `=` присвоить ему новое значение:

In [6]:
# нет
# на этом типе (tuple) такая операция не разрешена

info[1] = 2

TypeError: 'tuple' object does not support item assignment

Иногда это свойство бывает полезным (некоторая «защита» от изменений), иногда – не очень, но для нас пока важно познакомиться с разными объектами в Python, чтобы потом не удивляться. Ведь многие более продвинутые функции могут возвращать результат или, наоборот, принимать на вход только кортежи или только списки.

Если посмотреть на методы, применяемые к кортежам, то можно заметить, что методов, определённых на кортежах, всего два – это `.index()` и `.count()`:

In [7]:
# какой индекс у элемента 5
info.index(5)

1

In [9]:
# сколько элементов "дом"
info.count("дом")

1

Во многом это связано с тем, что кортеж нельзя изменить. Но вот «склеивать» кортежи, создавая при этом новый, легко, оператор `+` одинаково работает с последовательностями разных типов (по аналогии со строками и списками):

In [10]:
(1, 3) + (7, 8)

(1, 3, 7, 8)

### Кортежи и цикл `for` для вложенных структур

Рассмотрим такую задачу. В списке `pairs` сохранены пары *имя студента*-*оценка*:

In [11]:
pairs = [("Anna", 10), ("Kate", 8), ("Paul", 7), ("Nick", 9)]
print(pairs)

[('Anna', 10), ('Kate', 8), ('Paul', 7), ('Nick', 9)]


Нам нужно вывести информацию по каждому студенту с новой строки – имя и оценку через пробел. Если мы просто переберем элементы в `pairs` через цикл `for`, мы получим не совсем то, что нужно:

In [12]:
for pair in pairs:
    print(pair)

('Anna', 10)
('Kate', 8)
('Paul', 7)
('Nick', 9)


Для цикла выше `pair` – это одна пара, то есть кортеж, целиком. Поэтому целиком Python его и выводит на экран, со всеми скобками и запятыми. Как быть? Мы знаем, что раз `pair` – это кортеж, из него можно выбрать первый и второй элемент по индексу:

In [13]:
for pair in pairs:
    print(pair[0], pair[1])

Anna 10
Kate 8
Paul 7
Nick 9


Задача решена! Усложним задачу – будем выводить на экран имена только тех студентов, у которых отличная оценка, 8 и выше. Добавим внутри цикла условие на второй элемент в паре, а в `print()` поместим первый:

In [14]:
for pair in pairs:
    if pair[1] >= 8:
        print(pair[0])

Anna
Kate
Nick


Решения выше получились рабочими и довольно лаконичными, однако Python позволяет выполнить те же действия более изящно. Если мы точно знаем, что в `pair` всегда два элемента, мы можем каждый из них назвать (как переменные) и указать оба названия перед `in` в цикле `for`:

In [15]:
for name, grade in pairs:
    print(name, grade)

Anna 10
Kate 8
Paul 7
Nick 9


In [16]:
for name, grade in pairs:
    if grade >= 8:
        print(name)

Anna
Kate
Nick


В циклах выше Python понимает, что внутри `pairs` хранятся пары (потому что перед `in` указаны через запятую два названия), первый элемент в каждой паре мы называем `name`, второй – `grade`. Поэтому далее, чтобы не «таскать» за собой квадратные скобки и индексы элементов в каждой паре, мы сможем обращаться к ним через `name` и `grade`.

> Такое упрощение возможно благодаря тому, что в Python разрешено множественное присваивание. Если мы напишем `a, b = 0, 1`, Python прочитает это как `(a, b) = (0, 1)` и сохранит в переменную `a` число 0, а в переменную `b` – число 1. Так и здесь, на каждом шаге цикла Python разбирает пару на элементы и записывает в `name` имя студента, а в `grade` – оценку.

### Функция `zip()`

Как работать с одним списком мы уже знаем – можно, например, перебирать его элементы с помощью цикла `for` и выполнять с ними какие-то действия. А как быть, если у нас есть несколько списков одинаковой длины, и мы хотим работать одновременно с первыми элементами всех списков, вторыми элементами всех списков, третьими элементами всех списков, и так далее?

Рассмотрим такую задачу. Для каждого из семи сотрудников зафиксирован год начала работы в университете (`start`) и год окончания работы в университете (`end`). Нам нужно посчитать, сколько лет сотрудник проработал в университете.

In [18]:
# если сотрудник еще работает, указан текущий год

start = [1998, 2000, 2012, 2016, 2023, 2024, 2014]
end = [2021, 2025, 2022, 2018, 2023, 2025, 2025]

Убедимся, что списки точно одинаковой длины, иначе задача потеряет смысл:

In [19]:
print(len(start) == len(end))

True


Раз в списках одинаковое число элементов, первый логичный шаг – делать перебор не самих элементов списков, а их индексов. Тогда мы сможем выбрать первый элемент списка `end` и вычесть из него первый элемент списка `start`, получить результат для первого сотрудника, а затем проделать эту операцию для всех остальных.
Всего мы должны выполнить вычитание семь раз – длины списков одинаковы и равны 7.

Чтобы универсальным образом (работающим не только для списков из семи элементов) получить набор индексов, нам понадобятся функции `range()` и `len()`:

In [20]:
# длина 7
# индексы 0, 1, 2, 3, 4, 5, 6

print(len(start))
print(list(range(0, len(start))))

7
[0, 1, 2, 3, 4, 5, 6]


Используя эти индексы, мы сможем перебрать элементы сразу в двух списках:

In [21]:
# на первом шаге i=0, первые элементы списков
# на втором шаге i=1, вторые элементы списков ...

if len(start) == len(end):
    for i in range(0, len(start)):
        print(end[i] - start[i])

23
25
10
2
0
1
11


Осталось только записать результаты в новый список. Воспользуемся методом `.append()`:

In [22]:
years = []

if len(start) == len(end):
    for i in range(0, len(start)):
        print(end[i] - start[i])
        years.append(end[i] - start[i])
print(years)

23
25
10
2
0
1
11
[23, 25, 10, 2, 0, 1, 11]


Однако задач такого рода можно найти и более изящное решение – при работе в Python стараются избегать перебора элементов по индексам, сама конструкция `for ... in range(len(...))` считается нежелательной. Да и просто громоздко получается. Для этого решения нам понадобится функция `zip()`. 

Название этой функции говорящее – она как «молния» на одежде соединяет списки одинаковой длины, образуя пары/тройки/четверки элементов, в зависимости от количества списков. Функция `zip()` создает специальный объект типа `zip()`, элементы которого, как и в случае с `range()`, нам не видны:

In [26]:
# в какой-то ячейке памяти 0x1088f4550 временно хранится результат

print(zip(start, end))

<zip object at 0x1088f4550>


Чтобы увидеть результат, переделаем его в список – объект типа `zip` внутри не отличим от списка из кортежей:

In [27]:
# пары элементов

print(list(zip(start, end)))

[(1998, 2021), (2000, 2025), (2012, 2022), (2016, 2018), (2023, 2023), (2024, 2025), (2014, 2025)]


In [28]:
# тройки элементов

print(list(zip(start, end, start)))

[(1998, 2021, 1998), (2000, 2025, 2000), (2012, 2022, 2012), (2016, 2018, 2016), (2023, 2023, 2023), (2024, 2025, 2024), (2014, 2025, 2014)]


Как нам использовать функцию `zip()` в нашей задаче? Вернемся к парам лет и сделаем перебор по полученному списку пар. Как мы уже убедились, Python умеет выполнять перебор в цикле `for` сразу по нескольким элементам, если мы укажем их через запятую:

In [31]:
if len(start) == len(end):
    for s, e in zip(start, end):
        print(e - s)

23
25
10
2
0
1
11


Для получения решения, эквивалентному полученному выше через `range()` и индексы, допишем часть для создания списка `years`:

In [33]:
years = []

if len(start) == len(end):
    for s, e in zip(start, end):
        years.append(e - s)
print(years)

[23, 25, 10, 2, 0, 1, 11]


Гораздо приятнее и компактнее!

### Сортировка

В заключение рассмотрим примеры сортировки, в том числе вложенных структур. Рассмотрим сортировку с помощью функции `sorted()` – в отличие от метода `.sort()`, который работает только на списках, эта функция более универсальная. Начнем с простого примера – сортировки обычного списка чисел:

In [34]:
L = [1, 3, 7, 9, 5, 0]

По умолчанию сортировка производится по возрастанию:

In [35]:
sorted(L)

[0, 1, 3, 5, 7, 9]

Если нужна сортировка по убыванию, добавим аргумент `reverse = True`:

In [36]:
sorted(L, reverse = True)

[9, 7, 5, 3, 1, 0]

Сам список `L` при этом никак не изменится, функция `sorted()` возвращает измененную копию (ее можем через `=` сохранить в переменную при необходимости):

In [37]:
print(L)

[1, 3, 7, 9, 5, 0]


Теперь рассмотрим более сложный пример сортировки. Пусть есть список пар `R`:

In [38]:
R = [(2, 0), (3, 1), (1, 5), (6, 7), (0, -1)]

Все пары состоят из чисел, сортировка точно возможна. Применим функцию `sorted()`:

In [39]:
sorted(R)

[(0, -1), (1, 5), (2, 0), (3, 1), (6, 7)]

Что произошло? По умолчанию Python отсортировал все пары по первому элементу – сначала идет пара с 0 на первом месте, затем – с 1, и так далее. 

Если мы хотим отсортировать по второму элементу, нам нужно задать правило (ключ) сортировки в аргументе `key`: 

In [40]:
sorted(R, key = lambda x: x[1])

[(0, -1), (2, 0), (3, 1), (1, 5), (6, 7)]

Что означает запись `lambda x: x[1]`? На самом деле, здесь мы создаем анонимную функцию, которая принимает на вход пару элементов, а на выходе возвращает второй элемент пары. Что это функция, Python понимает по ключевому слову `lambda`, а описание функции мы задаем через `x`, часть до двоеточия – что на входе, часть после двоеточия – что на выходе. Вместо `x` могли выбрать любое название, как в циклах:

In [41]:
sorted(R, key = lambda y: y[1])

[(0, -1), (2, 0), (3, 1), (1, 5), (6, 7)]

Что удобно, одним выбором не-первых элементов функции в `key` не ограничиваются. Можно, например, выполнить сортировку по убыванию суммы элементов в паре:

In [42]:
sorted(R, key = lambda x: sum(x), reverse = True)

[(6, 7), (1, 5), (3, 1), (2, 0), (0, -1)]

Или выполнить сортировку по модулю второго элемента в паре:

In [43]:
sorted(R, key = lambda x: abs(x[1]))

[(2, 0), (3, 1), (0, -1), (1, 5), (6, 7)]

Или сортировку по произведению элементов в паре:

In [44]:
sorted(R, key = lambda x: x[0] * x[1])

[(2, 0), (0, -1), (3, 1), (1, 5), (6, 7)]