# Кортежи (```tuple```)

Помимо списков и словарей в Python реализовано еще несколько стандартных коллекцией. Одной из таких являются кортежи. Кортежи - это неизменяемая коллекция, которая по своему подобию очень похожа на список. Кортежи можно создавать с помощью литерала круглых скобок ```()``` или с помощью одноименной функции ```tuple()```. Кортежи имеют одноименный тип ```tuple```.

In [5]:
a = ()
b = tuple()
print(f'{type(a) = }')
print(f'{type(b) = }')

type(a) = <class 'tuple'>
type(b) = <class 'tuple'>


Непустой кортеж можно создать, записывая в круглых скобках элементы кортежа и разделяя их запятой. Одно из отличий от списков заключается в создании коллекции из одного элемента. Кортеж из одного элемента нельзя создать с помощью выражения ```(42)```, необходимо обязательно ставить запятую, т. е. ```(42, )```. Скобки можно опускать и записывать сразу элементы через запятую, в этом случае интерпретатор тоже создаст кортеж. Для большей читаемости кода не следует опускать скобки в одноэлементных кортежах.

In [6]:
a = (1, 2, 3)
b = (42, )
c = 1, 2, 3
d = 0,
print(f'{a = }')
print(f'{b = }')
print(f'{c = }')
print(f'{d = }')

a = (1, 2, 3)
b = (42,)
c = (1, 2, 3)
d = (0,)


В кортежах, как и в списках, можно хранить разные типы данных, в том числе изменяемые, например, списки, словари и др. 

In [7]:
foo = (
    'parker_square',  # str
    True, False,  # bool
    None,  # NoneType
    (42, 0.196, 1+2j),  # tuple[int, float, complex]
    [1, 2, 3],   # list[int]
    {
        'monty': 'python', 
        '42': 'The Ultimate Question of Life, the Universe, and Everything',
    },  # dict
    print,  # function
)

Кортежи - это неизменяемый тип данных. Они хранят ссылки на объекты. Поэтому в кортежах можно хранить ссылку на изменяемые типы данных. При этом объекты изменяемых типов, хранимые в кортежах, по-прежнему можно изменять. Если в программе не планируется изменять какой-либо набор значений, то стоит выбрать кортеж для их хранения. 

Работа изменяемых и неизменяемых типов данных будет рассмотрена позденее. 

In [8]:
a = (1, 2, [42])
a[-1].append(0)
print(f'{a = }')

a = (1, 2, [42, 0])


Однако, изменять сами элементы кортежа не разрешено. Попытка произвести эту операцию вызывает исключение ```TypeError```.

In [9]:
a = (1, 2, [42])
a[-1] = 0  # TypeError

TypeError: 'tuple' object does not support item assignment

## Операции с кортежами

Кортежи - это неизменяемая коллекция. Поэтому они не поддерживают операции добавления, удаления и изменения элементов. Все остальные операции, аналогичнуе спискам, доступны:
- индексирование;
- срезы;
- вычисление длины;
- конкатенация;
- умножение на константу;
- подсчет всех вхождений элемента;
- поиск первого вхождения элемента;
- и другие.

In [10]:
a = (1, 2, 3, 1)
b = 3, 4

print(f'Длина: {len(a) = }')
print(f'Конкатенация: {a + b = }')
print(f'Умножение на целочисленную константу: {3 * a = }')
print(f'Индексация: {a[0] = }')
print(f'Индексация: {a[-2] = }')
print(f'Срез: {a[1::-1]}')
print(f'Индекс первого вхождения: {a.index(1) = }')
print(f'Подсчет всех вхлждения: {a.count(1) = }')

Длина: len(a) = 4
Конкатенация: a + b = (1, 2, 3, 1, 3, 4)
Умножение на целочисленную константу: 3 * a = (1, 2, 3, 1, 1, 2, 3, 1, 1, 2, 3, 1)
Индексация: a[0] = 1
Индексация: a[-2] = 3
Срез: (2, 1)
Индекс первого вхождения: a.index(1) = 0
Подсчет всех вхлждения: a.count(1) = 2


Одним из применений кортежей является замена объектов и их имен местами. В Python выражения оцениваются слева на право (см. [документацию](https://docs.python.org/3/reference/expressions.html#evaluation-order)). Выражение ```a, b = b, a``` будет выполняться в следующем порядке. Сначала выполниться левая часть, т. е. будет создан кортеж из двух элементов со ссылками на объекты, на которые ссылаются ```b``` и ```a``` соответственно. Затем кортеж будет связан с правой частью. Так как в правой части стоят два имени, то он будет распакован. Таким образом первый элемент кортежа, которых хранит ссылку на объект из ```b``` будет связан с именем ```a```, затем тоже самое произойдет со вторым элементом кортежа, он будет связан с именем ```b```. Про замену значений читайте [обсуждение](https://stackoverflow.com/questions/14836228/is-there-a-standardized-method-to-swap-two-variables-in-python) на stackoverflow.

In [11]:
a, b = 42, 0
b, a = a, b
print(f'{a = }')
print(f'{b = }')

a = 0
b = 42


В Python есть специальный модуль ```dis``` для просмотра байт-кода. Это специальное представление программы, которое непосредственно выполняется интерпретатором.

Убедиться в порядке выполнения этого выражения можно с помощью модуля ```dis``` и его функции ```dis```, которая принимает строку Python кода.

In [12]:
import dis

code = """
a, b = 1, 2
a, b = b, a
"""

dis.dis(code)

  2           0 LOAD_CONST               0 ((1, 2))
              2 UNPACK_SEQUENCE          2
              4 STORE_NAME               0 (a)
              6 STORE_NAME               1 (b)

  3           8 LOAD_NAME                1 (b)
             10 LOAD_NAME                0 (a)
             12 ROT_TWO
             14 STORE_NAME               0 (a)
             16 STORE_NAME               1 (b)
             18 LOAD_CONST               1 (None)
             20 RETURN_VALUE


Блок с номером 2 отвечает за выполнение строки ```a, b = 1, 2```, а с номером 3 за строку ```a, b = b, a```. Здесь можно увидеть, что в первой строке снача создается константа в виде кортежа из двух элементов 1 и 2.

```0 LOAD_CONST               0 ((1, 2))``` 

Затем выполняется операция распаковки. Эта операция связывает каждый элемент из кортежа с соответствующим именем в порядке следования.

# Кортежи vs списки

Для ясного понимания в каких ситуациях стоит использовать списки, а каких кортежи нужно подробнее разобрать достоинства и недостатки обоих типов данных. Основным отличием этих типов является изменяемость. Кортежи -- это неизменяемый тип данных, а списки наоборот изменяемый. Это означает, что при попытке, например, добавить к кортежу новый элемент, произойдет создание абсолютно нового объекта. Поведение списков в этом плане совершенно другое. При добавлении или удалении элементов списка пересоздание объекта происходить не будет. Не стоит забывать, что из-за неизменяемости кортежей у них нет специализированных методов для операций добавления, удаления и вставки. Это означает, что добавить элемент в кортеж можно только конкатенацией его с другим кортежем.

In [13]:
a = (1, 2, 3)
b = [1, 2, 3]
id_a = id(a)
id_b = id(b)
a += (196, )
b += [196]
print(f'{id_a == id(a) = }')
print(f'{id_b == id(b) = }')

id_a == id(a) = False
id_b == id(b) = True


Изменять элементы кортежа также не разрешено.

In [14]:
a = (1, 2, 3)
a[0] = 0  # TypeError

TypeError: 'tuple' object does not support item assignment

Поскольку размер кортежей фиксирован и у них отсутствуют методы добавления и удаления элементов, то в памяти они хранятся несколько более эффективно, чем списки. Это связано с тем, что в списках заранее выделяется несколько больший размер памяти, чем требуется для хранения элементов, для обеспечения большей эффективности добавления новых элементов.

In [15]:
a = list(range(10))
b = tuple(a)
print(f'Размер списка a: {a.__sizeof__()} байт')
print(f'Размер кортежа b: {b.__sizeof__()} байт')

Размер списка a: 120 байт
Размер кортежа b: 104 байт


Быстродействие разных операций с кортежами (создание, распаковка, доступ по индексу) также отличается от быстродействия этих операций со списками. Для измерения быстродействия воспользуемся модулем ```timeit```, подробнее о нем см. в [документации](https://docs.python.org/3/library/timeit.html). Если список или кортеж состоят из значений неизменяемых типов данных, кортеж сильно выигрывает в быстродействии операций создания и распаковки. Ситуация изменяется, когда в кортеже необходимо хранить объекты изменяемых типов. В этом случае различия в быстродействии становятся не такими значительными. Операция доступа по индексу осуществляется за сравнимое время у обоих типов коллекций.

In [16]:
import timeit

print(f'Создание списка (1): {timeit.timeit("[1, 2, 3]")}')
print(f'Создание кортежа (1): {timeit.timeit("(1, 2, 3)")}')
print(f'Распаковка списка (1): {timeit.timeit("x, y, z = [1, 2, 3]")}')
print(f'Распаковка кортежа (1): {timeit.timeit("x, y, z = (1, 2, 3)")}')
print('-' * 50)

print(f'Создание списка (2): {timeit.timeit("[1, 2, [42]]")}')
print(f'Создание кортежа (2): {timeit.timeit("(1, 2, [42])")}')
print(f'Распаковка списка (2): {timeit.timeit("x, y, z = [1, 2, [42]]")}')
print(f'Распаковка кортежа (2): {timeit.timeit("x, y, z = (1, 2, [42])")}')
print('-' * 50)

print(f'Индексация списка: {timeit.timeit("a[1]", setup="a = [1, 2, 3]", number=10_000_000)}')
print(f'Индексация кортежа: {timeit.timeit("a[1]", setup="a = (1, 2, 3)", number=10_000_000)}')

Создание списка (1): 0.0702684999999974
Создание кортежа (1): 0.009919300000035491
Распаковка списка (1): 0.10293610000002218
Распаковка кортежа (1): 0.02793640000004416
--------------------------------------------------
Создание списка (2): 0.1002641999999696
Создание кортежа (2): 0.09485689999996794
Распаковка списка (2): 0.09443300000003774
Распаковка кортежа (2): 0.08719190000005028
--------------------------------------------------
Индексация списка: 0.3103973999999994
Индексация кортежа: 0.3195034000000305


Различия в производительности заключаются в оптимизациях, которые выполняются над кортежами. Ниже приведен пример байт-кода создания списка и кортежа, сгенерированный с помощью модуля ```dis```. В приведенном байт-коде видно, что при создании списка поочередно создаются объекты, которые в него входят. С созданием кортежа дело обстоит иначе. Он создается за одну операцию. Здесь используется оптимизация, называемая [сверткой констант](https://ru.wikipedia.org/wiki/%D0%A1%D0%B2%D1%91%D1%80%D1%82%D0%BA%D0%B0_%D0%BA%D0%BE%D0%BD%D1%81%D1%82%D0%B0%D0%BD%D1%82). Если интерпретатору доступны все значения, которые будут храниться в кортеже, то он их вычисляет заранее.

In [17]:
import dis

dis.dis('[1, 2, 3]')

  1           0 BUILD_LIST               0
              2 LOAD_CONST               0 ((1, 2, 3))
              4 LIST_EXTEND              1
              6 RETURN_VALUE


In [18]:
dis.dis('(1, 2, 3)')

  1           0 LOAD_CONST               0 ((1, 2, 3))
              2 RETURN_VALUE


Подводя итог, различия списков и кортежей можно представить в виде таблицы.

| Критерий                | Список                             | Кортеж                     |
|-------------------------|:----------------------------------:|:--------------------------:|
| *Литералы*              | ```[]```                           | ```()```                   |
| *Функции*               | ```list```                         | ```tuple```                |
| *Изменяемый тип*        | &#10004;                           | &#10006;                   |
| *Сворачивание констант* | &#10006;                           | &#10004;                   |
| *Хранимые типы данных*  | Любые, желательно однородного типа | Любые, разнородного типа   |
| *Копирование*           | Поверхностная и глубокая копия     | Глубокая копия при наличии |
|                         |                                    | вложенных изменяемых типов |
| *Потребление памяти*    | Высокое, за счет дополнительных    | Ниже чем у списков         |
|                         |       накладных расходов           |                            |
| *Быстродействие*        | Низкое для создания, распаковки    | Высокое                    |

Стоит обратить особое внимание на то, что списки предназначены для хранения последовательностей из однородных объектов. В списке индекс означает порядок следования элемента в последовательности. Кортежи, наоборот, предназначены для хранения разнородных данных. Кортежи обладают структурой, т. е. индекс элемента не просто указывает на порядок следования элемента в последовательности, но и имеет определенный смысл. Например с помощью модуля ```time``` можно узнать текущее время и результат можно представить в виде кортежа чисел, где на первом месте всегда идет год, затем месяц и т. д. Другим примером является координаты точек в трехмерном пространстве, представимых в виде ```(x, y, z)```, или что тоже самое координаты геопозиционирования с широтой, долготой и высотой. Упорядочивать или сортировать такие последовательности не имеет смысла, иначе потеряется исходная структура данных и они станут бесполезными. Поэтому, если необходимо хранить данные, которые обладают некоторым смыслом, например данные о человеке (имя, фамилию, возраст и т. д.), то стоит выбирать кортеж.

In [19]:
import time


date = time.localtime()
print(f'Год: {date[0]}')
print(f'Месяц: {date[1]}')
print(f'День: {date[2]}')

Год: 2020
Месяц: 11
День: 13


# Полезные ссылки

- [Кортежи более эффективны, чем списки в Python? (здесь можно посмотреть как кортежи и списки представлены в виде Си структур)](https://stackoverflow.com/questions/68630/are-tuples-more-efficient-than-lists-in-python)
- [В чем разница между списками и кортежами? (здесь хорошо описано, в какиких случаях стоит применять кортежи)](https://stackoverflow.com/questions/626759/whats-the-difference-between-lists-and-tuples)