# Составные структуры данных в Python

Мы уже познакомились с вами с очень важным типом данных, который называется строки.

В этом уроке мы рассмотрим другие немаловажные типы данных. Их называют составными или, иногда, "контейнеры", то есть это типы данных, которые могут в содержать другие типы, те же строки например.

Наш план на этот урок узнать что такое:
- Списки: создание, срезы, вставка и удаление элементов, индексация.
- Кортежи: отличие от списков, создание.
- Словари: создание, методы, ограничения.
- Множества: создание, операции.

Составные труктуры (списки, кортежи, словари и множества) — важные инструменты для работы с данными. Они позволяют эффективно и просто решать любые задачи на Python, начиная от бытовых (список дел, покупок), заканчивая статистическими исследованиями и разработкой сложных сервисов.



# Списки (`list`)


Начнём с простого примера. Давай представим, что мы покупаем продукты в интернет-магазине. Продукты мы кладём в корзину.

Можно создать корзину с помощью известных нам строк. Давайте посмотрим, как это будет выглядеть.



In [None]:
purchase_cart = "Молоко, Хлеб, Картофель, Фарш"
print(purchase_cart)

Молоко, Хлеб, Картофель, Фарш


Как нам например получить отдельно первую позицию в списке, ведь это целая строка? Не очень удобно для использования. Давайте попробуем другой вариант.

## Создание списка

Представим, что корзина — это список продуктов. Конечно, разработчики бэкенда этого магазина поспорили бы, ведь корзина — не просто список, там есть и счётчики, и дополнительные параметры в виде цены, веса. Но для нас это неважно, мы просто создаём список покупок, кликая мышкой на нужный продукт и нажимая кнопку «Добавить в корзину».

А теперь посмотрим, как создать список в Python.
Как мы сказали в начале, списки могут содержать в себе строки. Давайте создадим список со строками внутри.

Чтобы создать список, достаточно перечислить названия продуктов через запятую и заключить в квадратные скобочки. Совсем несложно, создадим список purchase_cart с нашими покупками.

In [None]:
purchase_cart = ["Молоко", "Хлеб", "Картофель", "Фарш"]

Попробуем распечатать список с помощью функции print.

In [None]:
print(purchase_cart)

['Молоко', 'Хлеб', 'Картофель', 'Фарш']


Список позволяет обращаться к элементом по отдельности. Например, можно напечатать третий элемент списка покупок.

In [None]:
print(purchase_cart[2])

Картофель


Как это? Мы хотели вывести третий элемент, а в скобках написали 2. Но напечатан всё равно третий по счёту.  

Дело в длине списка. Этот термин пригодится в большинстве задач, связанных со структурами данных.

Длина списка — это количество элементов в нём. В нашем случае — количество продуктов в корзине. Как узнать длину списка? Посчитать элементы, конечно.

Текущий список покупок у нас такой: <br>
``['Молоко', 'Хлеб', 'Картофель', 'Фарш']``

Сколько в нём элементов?
1. Молоко.
2. Хлеб.
3. Картофель.
4. Фарш.

Чтобы мы не считали самостоятельно, в Python есть функция len.

In [None]:
len(purchase_cart)

4

### Индексация в списках

Теперь мы готовы к ещё одному важному определению.

То, что мы пишем в скобках (как в ```purchase_cart[2]```) называется **индексом.** Это порядковый номер элемента. Нумерация в списках начинается с нуля: первому элементу соответствует индекс 0, второму 1, а третьему 2.

В нашем примере «Картофель» — это элемент с индексом 2. Данное утверждение актуально, пока мы не меняли списки.



Индекс — это всегда целое число, оно не может быть дробным. Но в Python индексы бывают отрицательными. Диапазон значений индекса — от 0 до len() - 1.

Мы видим, что элемент с индексом -1 совпадает с последним элементом в списке.

In [None]:
print(purchase_cart[-1])

Фарш


Индекс -1 означает последний элемент.
Также последний элемент может быть получен выражением ```длина списка - 1```.


> Если указать индекс вне диапазона (0 до значения len() - 1), интерпретатор Python выдаст ошибку ```IndexError```.


### Срезы в списках

Бывают случаи, когда нужно получить значения не по одному конкретному индексу, а по диапазону: например, с нулевого по третий. Для таких целей существуют срезы.

Как написать срез? Практически так же, как индекс, то есть в квадратных скобках около названия списка. Но срез — это не один элемент, а несколько, то есть какой-то кусочек самого списка.

`название_списка[индекс_начала: индекс_конца]`

Нужно быть внимательным, потому что правый конец не включается в результат, то есть будут элементы до этого индекса, не включа/щие его.

Рассмотрим на нашей корзине с продуктами. Прежде чем запускать код ниже, подумаем какой будет результат.
Мы идём с нуля (начало списка) до элемента с индексом 2 (то есть до третьего элемента), не включая его.

In [None]:
print(purchase_cart[0:2])

['Молоко', 'Хлеб']


Списки — это изменяемые объекты, поэтому над ними можно произодить преобразования: например, вставлять и удалять элементы, объединять списки.

### Вставка элементов в список

Допустим, мы вспомнили, что нам нужны овощи, и захотели добавить в корзину ещё огурцы и помидоры.

Добавить элементы в список можноис помощью нескольких магических функций:

*   list.append(value) — добавление в конец списка,
*   list.insert(index, value) — вставка по индексу.

Как говорилось выше, о магии функций будет отдельный материал. А пока добавим овощи в корзину — в конец нашего списка.


Зафиксируем изначальный размер корзины, проверим длину списка с помощью функции len.

In [None]:
len(purchase_cart)

4

In [None]:
purchase_cart.append("Помидоры")

Распечатаем корзину с помощью функции print.

In [None]:
print(purchase_cart)

['Молоко', 'Хлеб', 'Картофель', 'Фарш', 'Помидоры']


Видим, что в конец списка добавились помидоры.

Проверим, изменилась ли длина списка с помощью той же функции len.

In [None]:
len(purchase_cart)

5

Длина списка увеличилась с 4 элементов на 5.

### Удаление элементов из списка



Если покупать помидоры мы передумаем, их нужно будет удалить из корзины. Помидоры лежат в конце списка, поэтому их можно удалить с помощью функции pop. Она удаляет последний элемент и возвращает его (грубо говоря, показывает нам его).

In [None]:
purchase_cart.pop()

'Помидоры'

Допустим, мы хотим удалить фарш, но не знаем, какой это элемент по счёту. Можно использовать функцию remove, она удаляет элемент со значением, равным тому, что мы укажем.

In [None]:
purchase_cart.remove("Фарш")

Если этого элемента нет, функция страшно ругается. Если мы попробуем удалить финики. Мы увидим ошибку
```
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-3-6348d22ee3a0> in <cell line: 1>()
----> 1 purchase_cart.remove("Финики")

ValueError: list.remove(x): x not in list
```

Мы уже сильно поменяли наш исходный список, что-то удалили, давайте пересоздадим его с нуля, чтобы можно было дальше проводить с ним операции.

In [None]:
purchase_cart = ["Молоко", "Хлеб", "Картофель", "Фарш", "Помидоры"]

Чтобы вместо помидоров положить огурцы, можно удалить помидоры и добавить в конец списка огурцы. Но можно просто получить элемент по индексу и заменить его.

purchase_cart[-1] — это последний элемент в списке.

len(purchase_cart) — это длина списка.

(len(purchase_cart) - 1) — это индекс последнего элемента в списке.

In [None]:
# Вариант 1

last_elem = len(purchase_cart) - 1
purchase_cart[last_elem] = "Огурцы"

In [None]:
# Вариант 2

purchase_cart[-1] = "Огурцы"

Попробуем заменить третий элемент на бананы. Третий элемент имеет индекс 2, не забываем про это.

In [None]:
purchase_cart[2] = "Бананы"

In [None]:
print(purchase_cart)

['Молоко', 'Хлеб', 'Бананы', 'Фарш', 'Огурцы']


## Вывод по спискам

Итак, чему мы научились в данном разделе:
* Создавать корзину продуктов с помощью списка:

```purchase_cart = ["Молоко", "Хлеб", "Картофель", "Фарш", "Помидоры"]```
* Добавлять в конец корзины новые продукты.

```purchase_cart.append("Помидоры")```

* Удалять из корзины последний элемент:

```purchase_cart.pop()```

* Удалять из корзины продукт по названию:

```purchase_cart.remove("Фарш")```

* Заменять элементы в корзине на новые:

```purchase_cart[2] = "Бананы"```

Списки хороши тем, что их можно менять на ходу. Когда мы заранее знаем, что данные нужно будет менять в процессе работы, например добавлять или удалять из корзины продукты, список — отлично подходящая для этого структура данных.

Но бывают и неизменяемые структуры.

# Кортежи (`tuple`)

Кортеж (англ. tuple) — неизменяемый список. Как только мы создали кортеж, менять его больше нельзя.

Для чего же нужны кортежи, если их нельзя менять? Они быстрее чем списки. Если заранее известно, что данные не будут меняться, лучше использовать кортежи.

Основное преимущество кортежей в том, что они могут использоваться в качестве ключей в словарях, а списки не могут. Сейчас може быть непонятно, что такое ключи в словарях, но об этом ниже.

## Создание кортежа

Чтобы создать непустой кортеж, достаточно перечислить элементы и обернуть их в круглые скобки.

Давай создадим кортеж из школьных предметов. Возьмём всего 3 предмета для наглядности.

In [None]:
lessons_tuple = ("Математика", "Физика", "Информатика")

Как и в случае со списками, можно узнать длину кортежа и индекс элементов в нём, можно распечатать элемент по индексу.

Но для кортежей неприменимы методы, изменяющие данные: append, insert, remove, pop, присвоение элементов по индексу, как мы делали выше с бананами.

In [None]:
lessons_tuple[0]

'Математика'

In [None]:
print(len(lessons_tuple))

3


Попробуем присвоить новое значение элементу кортежа.

`lessons_tuple[2] = "История"`

Получим ошибку следующего вида:

```
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-54-91a5ced16488> in <cell line: 1>()
----> 1 lessons_tuple[2] = "История"

TypeError: 'tuple' object does not support item assignment
```


> Это потому что кортеж нельзя менять: каким мы его создали, таким он и остаётся.

Но кортеж можно преобразовать в список. А списки менять легко. Обратное преобразование в кортеж тоже возможно.

In [None]:
list(lessons_tuple)

['Математика', 'Физика', 'Информатика']

In [None]:
tuple(lessons_tuple)

('Математика', 'Физика', 'Информатика')

## Вывод по кортежам

* Кортеж — неизменяемая структура данных.  
* Из кортежа можно получить список, но это уже будет новый объект. Сам исходный кортеж не меняется.
Аналогично из списка можно получить кортеж.
* В кортежах есть длина и индексы по аналогии со списками.

# Словари (`dict`)

Словарями в Python называются наборы значений аналогично спискам и кортежам. Отличие в том, что каждому элементу словаря соответствуют ключ и связанное с ним значение.

## Создание словаря

Например, у нас есть дневник школьника, где указан предмет и оценка за него. Дневник можно представить в виде списка.

In [None]:
marks_list = ["Физика", "5", "Математика", "4", "Информатика", "3"]

Если спросить, какая оценка у школьника по информатике, можно пробежаться глазами и увидеть оценку 3, но если предметов больше 10, 100, 1000? Кажется, здесь уже будет не очень удобно пробегаться глазами.

Что же делать?

Если мы сохраним данные в словаре, то будет выглядеть так:




In [None]:
marks_dict = {"Физика": "5", "Математика": "4", "Информатика": "3"}

Для разделения каждой пары «ключ:значение» используется двоеточие, ключи и значения мы записали в двойных кавычках.

В данном примере ключ — это предмет, например физика.
Значение — это оценка, например 5.

Обрати внимание, что элементы словаря заключены в фигурные (а не круглые или квадратные) скобки.

Распечатаем оценку за математику, использовав название этого предмета в качестве ключа.

In [None]:
print(marks_dict["Математика"])

4


Ключ пишется в квадратных скобках аналогично индексу в списках, но это не одно и тоже. Пожалуйста, не путай.



## Методы словарей

Рассмотрим основные методы.

- `keys()`: возвращает список ключей.
- `values()`: возвращает список значений.
- `items()`: возвращает список пар ключ-значение.


In [None]:
# Получаем все предметы в виде списка

marks_dict.keys()

dict_keys(['Физика', 'Математика', 'Информатика'])

In [None]:
# Получаем все значения в виде списка

marks_dict.values()

dict_values([5, 4, 3])

In [None]:
# Получаем ключи и значения в виде списка, внутри которого кортежи

marks_dict.items()

dict_items([('Физика', 5), ('Математика', 4), ('Информатика', 3)])

Представим, что школьник пересдал математику и получил за нее 5. Так держать! Обновим дневник.

In [None]:
marks_dict["Математика"] = "5"

In [None]:
marks_dict

{'Физика': '5', 'Математика': '5', 'Информатика': 3}

Ещё школьник сдал химию. Её нет в дневнике, давай добавим. Для этого нужно использовать название предмета в качестве ключа и записать значение.

In [None]:
marks_dict["Химия"] = "3"

## Ограничения на ключи словарей

### Уникальность ключей
Каждый ключ в словаре должен быть уникальным. Если попытаться добавить элемент с уже существующим ключом, новое значение заменит старое.

### Неизменяемость ключей
Ключи словарей должны быть неизменяемыми объектами.
Мы не можем в качестве ключа использовать список предметов, но можем использовать один предмет.

## Вывод по словарям


* Словари содержат в себе ключ и значение. По ключу можно получить значение.
* Словари можно менять, в отличие от кортежей.
* Из словаря можно получить список значений, ключей или и того и другого.
* В словарях нет индексов, есть ключи.

# Множества (`set`)

Множество (англ. set) в Python — это неупорядоченная коллекция уникальных элементов. Оно очень похожи на математическое. Множество — изменяемый тип данных. Важная особенность множеств — это уникальность. Во множестве не могут повторяться значения.


Множество можно использовать, когда не хотим задумываться о повторяющихся элементах. Например, если мы хотим знать имена школьников в классе, но имена только уникальные, без повторений.

## Создание множества

Чтобы создать множество, нужно перечислить его содержимое и обернуть в фигурные скобки.

In [None]:
names = {"Ваня", "Петя", "Аня", "Маша", "Аня"}

print(names)

{'Петя', 'Маша', 'Ваня', 'Аня'}


Обрати внимание: мы создаём дублирующиеся имена (Аня), однако во множестве содержатся только уникальные значения.

## Операции со множествами


- Объединение (`union()`).
- Пересечение (`intersection()`).
- Разность (`difference()`).
- Симметричная разность (`symmetric_difference()`).

Давай создадим 2 школьных класса и перечислим в них имена.

In [None]:
names_class_a = {"Ваня", "Петя", "Аня", "Маша", "Аня"}
names_class_b = {"Миша", "Вова", "Аня", "Дима", "Сережа"}


# Допустим, мы хотим объединить имена в двух классах

class_a_b = names_class_a.union(names_class_b)
print(class_a_b)

{'Сережа', 'Петя', 'Миша', 'Ваня', 'Маша', 'Вова', 'Дима', 'Аня'}


Найдём одинаковые имена в классах.

In [None]:
uniq_names = names_class_a.intersection(names_class_b)

print(uniq_names)

{'Аня'}


Найдём имена, которые есть только в одном из классов.

In [None]:
different_names = names_class_a.difference(names_class_b)

print(different_names)

{'Петя', 'Маша', 'Ваня'}


## Вывод по множествам

* Множества можно изменять.
* Во множестве нет повторяющихся элементов.

# Вывод

Итак, что мы узнали нового в этом уроке?

- Мы рассмотрели списки и как они создаются на примере корзины покупок.
- Рассмотрели индексацию и методы работы со списками.
- Узнали, чем кортежи отличаются от списков. 
- Изучили словари и методы работы с ними на примере дневника оценок.
- Рассмотрели множества и их особенности, а также основные методы на примере имен школьников в классе.