# Python для сбора и анализа данных

*Алла Тамбовцева*

## Кортежи и функция `zip()`

### Кортежи (tuples)

Кортежи встречаются не только в программировании, но и в математике. В математике под кортежем обычно понимают упорядоченную совокупность элементов, то есть совокупность, порядок элементов которой фиксирован. В кортеже мы точно знаем, какой элемент является первым, какой – вторым, и так далее.

Внешне кортежи несильно отличаются от списков. Единственное внешнее отличие – элементы кортежа заключаются в круглые, а не в квадратные скобки.

In [1]:
t = (4, 0, 2, "abc")  
t

(4, 0, 2, 'abc')

К элементам кортежа можно обращаться точно так же, как к элементам списка:

In [2]:
t[0]

4

Но, несмотря на кажущееся сходство, кортежи и списки – принципиально разные объекты. Главное отличие кортежей от списков заключается в том, что кортежи – неизменяемые объекты. Другими словами, изменять элементы кортежа нельзя. Проверим:

In [3]:
t[0] = 40

TypeError: 'tuple' object does not support item assignment

Иногда это свойство бывает полезным (некоторая «защита» от изменений), иногда – не очень, но для нас пока важно познакомиться с разными объектами в Python, чтобы потом не удивляться. Ведь многие более продвинутые функции могут возвращать результат или, наоборот, принимать на вход только кортежи или только списки.

При желании кортеж можно превратить в список:

In [4]:
list(t)

[4, 0, 2, 'abc']

И наоборот:

In [5]:
L = [5, 8, 1, -2] 
tuple(L)

(5, 8, 1, -2)

Если посмотреть на методы, применяемые к кортежам (например, набрать `t.` и нажать *Tab*), то можно заметить, что методов для кортежей сильно меньше по сравнению с методами для списков.

In [6]:
t.index(4) # индекс элемента

0

In [7]:
t.count(2) # считаем 2

1

Это связано с тем, что кортеж нельзя изменить. Но вот «склеивать» кортежи, создавая при этом новый, легко:

In [9]:
(1, 3) + (7, 8)

(1, 3, 7, 8)

### Функция `zip()`

Как работать с одним списком мы уже знаем – можно, например, перебирать его элементы с помощью цикла `for` и выполнять с ними какие-то действия. А как быть, если у нас есть несколько списков одинаковой длины, и мы хотим работать одновременно с первыми элементами всех списков, вторыми элементами всех списков, третьими элементами всех списков, и так далее? 

Логичное решение – делать перебор не самих элементов списков, а их индексов. Для примера рассмотрим такую задачу. В списках `names`, `rating` и `marks` хранятся имена трёх студентов, их место в рейтинге и оценки за контрольную работу:

In [11]:
names = ["Anna", "Ben", "Nick"]
rating = [1, 2, 3]
marks = [10, 7, 9]

Нам нужно вывести на экран имя каждого студента, а рядом с ним место в рейтинге и оценку через пробел. 

Чтобы универсальным образом (работающим не только для списков из трёх элементов) получить набор индексов, нам понадобятся функции `range()` и `len()`:

In [12]:
# индексы элементов

list(range(len(names)))

[0, 1, 2]

Используя эти индексы, мы сможем перебрать элементы сразу в трёх списках:

In [13]:
# на первом шаге i=0, первые элементы
# на втором шаге i=1, вторые элементы...

for i in range(len(names)):
    print(names[i], rating[i], marks[i])

Anna 1 10
Ben 2 7
Nick 3 9


Ура, получилось!

Однако для этой задачи можно найти и более изящное решение – при работе в Python стараются избегать перебора элементов по индексам. Для этого решения нам понадобится функция `zip()`. Название этой функции говорящее – она как «молния» на одежде соединяет списки одинаковой длины, образуя пары/тройки/четверки элементов, в зависимости от количества списков:

In [16]:
# пары значений, первое из первого списка, второе – из второго
L1 = [1, 2, 3, 4]
L2 = [10, 20, 30, 40] 

list(zip(L1, L2))

[(1, 10), (2, 20), (3, 30), (4, 40)]

In [17]:
# четверки значений
list(zip(range(0, 10), range(10, 20), range(20, 30), range(30, 40)))

[(0, 10, 20, 30),
 (1, 11, 21, 31),
 (2, 12, 22, 32),
 (3, 13, 23, 33),
 (4, 14, 24, 34),
 (5, 15, 25, 35),
 (6, 16, 26, 36),
 (7, 17, 27, 37),
 (8, 18, 28, 38),
 (9, 19, 29, 39)]

Функция `zip()` создает специальный объект типа `zip()`, элементы которого, как и в случае с `range()`, нам не видны. Однако по сути этот объект представляет собой просто список, состоящий из кортежей. Как нам использовать функцию `zip()` в нашей задаче? Для начала применим ее к спискам с характеристиками студентов:

In [18]:
list(zip(names, rating, marks))

[('Anna', 1, 10), ('Ben', 2, 7), ('Nick', 3, 9)]

Теперь сделаем перебор по полученному списку «троек» значений. Python умеет выполнять перебор в цикле `for` сразу по нескольким элементам, если мы укажем их через запятую (наследие множественного присваивания):

In [19]:
# n – всегда первый элемент в каждой тройке
# r – всегда второй элемент в каждой тройке
# m – всегда  третий элемент в каждой тройке

for n, r, m in zip(names, rating, marks):
    print(n, r, m)

Anna 1 10
Ben 2 7
Nick 3 9


Готово! Результат такой же, как и в решении через индексы, но более аккуратный и без лишних нагромождений с `range()`, `len()` и квадратными скобками для вызова элементов.

Если не совсем понятно, как устроен код выше, попробуйте посмотреть на его альтернативу – перебор по «тройкам», созданным с помощью `zip()`:

In [20]:
# student = ('Anna', 1, 10) на первом шаге
# student = ('Ben', 2, 7) на втором шаге...

for student in zip(names, rating, marks):
    print(student[0], student[1], student[2])

Anna 1 10
Ben 2 7
Nick 3 9
