# Кортежи

**Кортеж** -- неизменяемая гетерогенная последовательность.

**Неизменяемая последовательность** -- последовательность, значения которой невозможно изменить.

**Гетерогенная последовательность** -- последовательность, которая может хранить в себе значения разного типа (в отличии от гомогенных последовательностей).

In [2]:
t1 = (1, 5, 4)
t2 = ("Hello", "world", 42, 5.6)
t3 = 1, 2, 3
print(t1)
print(t2)
print(t3)

(1, 5, 4)
('Hello', 'world', 42, 5.6)
(1, 2, 3)


Получение элемента по индексу:

In [4]:
t = ("Hello", "world", 42, 5.6)
print(t[0]) # вывод нулевого элемента кортежа
print(t[3]) # вывод первого элемента кортежа

Hello
5.6


Можно использовать отрицательную индексацию. Если указан отрицательный индекс, берётся определенное значение с конца последовательности:

In [5]:
t = (1, 2, 3, 4, 5, 6)
print(t[-1], t[-2], t[-3])

6 5 4


Изменение элементов кортежа запрещено. При попытке это сделать, будет выдана ошибка:

In [4]:
t = (1, 2, 3, 4, 5, 6)
t[0] = 10

TypeError: 'tuple' object does not support item assignment

Кортежи могут выполнять функции записей / структур в некоторых других языках программирования. Например, кортежем можно представлять точки на плоскости, где первой координатой была бы координата $x$, а вторая координата -- координата $y$:

In [6]:
point = (10, 20)
print(point)
point3D = (10, 20, 0)
print(point3D)

(10, 20)
(10, 20, 0)


Можно привести другой пример. Представим окружность координатами центра и радиусом:

In [7]:
circle = (0, 0, 10) # окружность с координатой центра (0, 0) и радиусом 10

При помощи кортежа можно хранить данные, например, о городе:

In [7]:
city = ("Лондон", 'Соединенное Королевство', 8_780_000)

In [8]:
# На самом деле, круглые скобки необязательны:
city = "Лондон", 'Соединенное Королевство', 8_780_000
# но это улучшает читаемость
print(city)

('Лондон', 'Соединенное Королевство', 8780000)


Хранить информацию можно в таком виде, однако есть один существенный недостаток: надо помнить что и на какой позиции находится (где располагается имя города, страна и численность). Есть и преимущество: гарантируется, что кортеж не сможет быть изменён чем-бы то ни было.

Рассмотрим пример задачи вычисления населения:

In [13]:
cities = (
    ("Лондон", 'Соединенное Королевство', 8_780_000),
    ("Москва", 'Россия', 11_920_000),
    ("Нью-Йорк", 'Соединённые Штаты Америки', 8_380_000),
)

total_population = 0
for city in cities:
    print(city)
    print(city[2])
    # total_population = total_population + city[2]
    total_population += city[2]

print(total_population)

('Лондон', 'Соединенное Королевство', 8780000)
8780000
('Москва', 'Россия', 11920000)
11920000
('Нью-Йорк', 'Соединённые Штаты Америки', 8380000)
8380000
29080000


Основной недостаток подхода состоит в том, что информация о городе завтра может измениться. Город будет описываться на тремя параметрами, а сотней параметров, из которых население будет не на 3 месте, а на 67. Тогда код написанный выше придётся переделывать, что не есть хорошо.

Кортежи поддерживают распаковку:

In [10]:
city = ("Москва", 'Россия', 11_920_000)
name, county, population = city
print(name)
print(county)
print(population)

Москва
Россия
11920000


Если при распаковке какая-то переменная не является нужной, используйте нижнее подчёркивание в качестве "заглушки":

In [14]:
city = ("Москва", 'Россия', 11_920_000, 1147)
name, county, _, _ = city
print(name, county)
print(_)

Москва Россия
1147


Вы должны осознавать, что `_` - легальное имя переменной. Однако мы будем его использовать, чтобы подчеркнуть тот факт, то что значение, мы не будем использовать

Рассмотрим ещё один пример распаковки. Допустим, что информация о городе представлена уже так:

In [12]:
city = ("Москва", 'Россия', "Столица России", "55°44′24.00", "37°36′36.00″", 11_920_000, 1147)

и стоит задача достать имя, численность населения и год основания. Допустимо написать такой код:

In [13]:
name, population, year = city[0], city[5], city[6]

Однако вместо него лучше использовать следующий:

In [14]:
name, *_, population, year = city
print(f"Город {name} основан в {year} году. Его население составляет {population / 1000000} млн. человек")

Город Москва основан в 1147 году. Его население составляет 11.92 млн. человек


Ещё раз обратим внимание на то, что у нас есть зависимость между позицией элемента в кортеже и смыслом элемента. Хотелось бы иметь более надежный подход. Для решения этой проблемы предлагается использование именованных кортежей.

# Именованные кортежи

Функция namedtuple генерирует новый класс, который обеспечивает именованный кортеж желаемым поведением:

In [15]:
from collections import namedtuple

# любой из трех способов допустим
Point2D = namedtuple('Point2D', ['x', 'y'])
Point2D = namedtuple('Point2D', 'x y')
Point2D = namedtuple('Point2D', 'x, y')

pt = Point2D(10, 20)
print(pt)

Point2D(x=10, y=20)


Класс `nametuple` является подклассом класс `tuple`:

In [16]:
issubclass(Point2D, tuple)

True

Попытки изменить именованный кортеж закончатся ошибкой:

In [19]:
pt = Point2D(10, 20)
pt.x = 100

10 20


AttributeError: can't set attribute

Однако до сих пор имеется доступ к получению значений:

In [21]:
pt = Point2D(10, 20)
print(pt.x, pt.y)

10 20


Чтобы узнать, какими атрибутами обладает объект, используется свойство `_fields`:

In [22]:
pt._fields

('x', 'y')

Метод `._asdict()` позволяет выполнить приведение к словарю:

In [20]:
pt._asdict()

{'x': 10, 'y': 20}

Можно создать функции, оперирующие точками:

In [21]:
def dot_product(a: Point2D, b: Point2D):
    return a.x * b.x + a.y * b.y

dot_product(Point2D(1, 0), Point2D(-1, 0))

-1

In [23]:
City = namedtuple('City', 'name, country, population')
city = City('Москва', 'Россия', 11_920_000)
print(city)
print(city.name, city.country, city.population)

City(name='Москва', country='Россия', population=11920000)
Москва Россия 11920000


In [24]:
City = namedtuple('City', 'name, country, population')

cities = [
    City("Лондон", 'Соединенное Королевство', 8_780_000),
    City("Москва", 'Россия', 11_920_000),
    City("Нью-Йорк", 'Соединённые Штаты Америки', 8_380_000),
]

total_population = 0
for city in cities:
    total_population += city.population

print(total_population)

29080000


In [25]:
City = namedtuple('City', 'population, name, country')

cities = [
    City(8_780_000, "Лондон", 'Соединенное Королевство'),
    City(11_920_000, "Москва", 'Россия'),
    City(8_380_000, "Нью-Йорк", 'Соединённые Штаты Америки'),
]

total_population = 0
for city in cities:
    total_population += city.population

print(total_population)

29080000


Иногда может возникнуть задача получить другую точку, которая похожа на какую-то старую, просто у неё изменена координата. Возможное решение:

In [24]:
pt1 = Point2D(0, 0)
pt2 = pt1._replace(x=10)
print(pt1, pt2)

Point2D(x=0, y=0) Point2D(x=10, y=0)


Предположим, что нам потребовались сейчас точки в 3D пространстве. Мы бы хотели лишь дополнить координату $z$ к нашей точке и получить новый класс. Это возможно сделать:

In [25]:
new_fields = Point2D._fields + ('z',)
Point3D = namedtuple('Point3D', new_fields)
print(Point3D._fields)
p1 = Point3D(1, 2, 3)
print(p1)

('x', 'y', 'z')
Point3D(x=1, y=2, z=3)


Если требуются поля со значениями по умолчанию, используется следующий синтаксис:

In [26]:
Vector3D = namedtuple("Vector3D", "x, y, z")
Vector3D.__new__.__defaults__ = (0, 0)

v1 = Vector3D(x=10)
v2 = Vector3D(x=10, z=20)
print(v1)
print(v2)

Vector3D(x=10, y=0, z=0)
Vector3D(x=10, y=0, z=20)


Основное приложение для именованных кортежей и кортежей в принципе -- возможность вернуть несколько значений из функции.

In [27]:
import random

Color = namedtuple("Color", 'red, green, blue')

def get_random_color():
    return Color(
        random.randint(0, 255),
        random.randint(0, 255),
        random.randint(0, 255)
    )

color = get_random_color()
print(color.red)

196
