# Лекция 2. Структуры данных в Python: списки, кортежи, словари, множества

В прошлой лекции мы с вами впервые познакомились с языком программирования Python, узнали, что его можно использовать как простой калькулятор, разобрались, что в Python есть разные типы данных (они еще называются, примитивы), например, целые и вещественные числа, строки и логический тип. А еще узнали, что такое переменные.

Здорово! Теперь мы пойдем дальше и узнаем, как можно удобно записывать, хранить и использовать данные внутри Python.

## Списки

### Списки и индексы

Первая структура данных, с которой мы познакомимся, – список (list). Списком называют упорядоченный набор каких-то элементов. В Python элементы списка заключены в квадратные скобки и разделены запятой. Например, представьте, что вы составили список товаров, которые нужно купить в магазине. В Python он будет выглядеть как-то так:

In [18]:
['Apples', 'Oranges', 'Water']

['Apples', 'Oranges', 'Water']

Список можно присвоить какой-нибудь переменной.

In [19]:
products_to_buy = ['Apples', 'Oranges', 'Water']

print(products_to_buy)

['Apples', 'Oranges', 'Water']


У списка есть длина, узнать ее можно, вызвав специальную функцию len(), вот так:

In [20]:
len(products_to_buy)

3

Мы видим, что в этом списке три элемента, соответственно и его длина равна трем. У каждого элемента списка есть свой номер, программисты называют этот номер индексом. Важно, что в программировании вообще почти вся нумерация начинается с нуля – это такой программерский секрет, чтобы отсеивать непосвященных :) (на самом деле все довольно просто, подробнее, почему все же с нуля, а не с единицы, можно почитать тут – ).

Поэтому и индексы в списке тоже начинаются с нуля. Мы можем обратиться к первому элементу списка – элементу с индексом 0 – и посмотреть, что в нем находится. 

In [21]:
print('First: ', products_to_buy[0])
print('Second: ', products_to_buy[1])
print('Third: ', products_to_buy[2])

First:  Apples
Second:  Oranges
Third:  Water


Как мы уже поняли, в списке всего 3 элемента, поэтому если мы попробуем обратиться к четвертому, что получим ошибку.

In [22]:
products_to_buy[3]

IndexError: list index out of range

Мы можем посмотреть тип переменной products_to_buy, чтобы убедиться, что это действительно список

In [23]:
type(products_to_buy)

list

Обратите внимание, что интерпретатор говорит нам, что тип products_to_buy это list. Однако мы ничего не знаем о типах элементов, которые лежат в этом списке. Но мы можем посмотреть это с помощью такой записи

In [24]:
type(products_to_buy[0])

str

Как и предполагалось, это строка :)

Давайте теперь представим, что нам нужно изменить наш список покупок. Например, оказалось так, что яблоки у нас уже есть, а вот бананы закончились. Это сделать несложно – нам нужно сказать интерпретатору, что в списке products_to_buy в ячейке с индексом 0 теперь будут 'Bananas'.

In [25]:
products_to_buy[0] = 'Bananas'
print(products_to_buy)
print(products_to_buy[0])

['Bananas', 'Oranges', 'Water']
Bananas


### Добавление и удаление элементов списка

А что если нам нужно не изменить имеющийся, а добавить новый элемент в список? Например, выяснилось, что дома у нас нет еще и молока. Это можно сделать с помощью метода append()

In [26]:
products_to_buy.append('Milk')
print(products_to_buy)

['Bananas', 'Oranges', 'Water', 'Milk']


Обратите внимание, что 'Milk' добавился в конец списка. Кстати, чтобы получить последний элемент списка в Python можно написать вот такую штуку

In [27]:
print(products_to_buy[-1])

Milk


Прикольно! Нам еще нужно купить мясо, но мясной отдел находится сразу за отделом с фруктами, а вода стоит у самой кассы, поэтому нам логично сначала купить фркутов, потом мясо, потом молоко, а потом уже взять воду. Если мы будем использовать append(), то мясо встанет в конец списка, а хотелось бы, чтобы список продуктов тоже был упорядочен :( 

Можно ли вставить молоко перед водой? Можно! Для этого есть метод insert(), в котором мы указываем, на какое место (индекс) нужно вставить элемент

In [28]:
products_to_buy.insert(2, 'Meat')
print(products_to_buy)

['Bananas', 'Oranges', 'Meat', 'Water', 'Milk']


Придя в магазин, мы вспомнили, что мясо у нас все-таки есть. Надо бы удалить его из списка. Легко

In [29]:
products_to_buy.pop(2)
print(products_to_buy)

['Bananas', 'Oranges', 'Water', 'Milk']


Хмм... но для этого нужно всегда знать индекс элемента. А что если у нас список из 10 тысяч элементов и искать индекс ну совершенно неудобно? Тогда можно удалить элемент по значению. Вот так

In [32]:
products_to_buy.remove('Water')
print(products_to_buy)

['Bananas', 'Oranges', 'Milk']


Классно, но если воды нет в списке, то когда мы будем ее удалять, возникнет ошибка, ведь так? Совершенно верно. Нам нужно узнать, есть ли вода в списке. Это можно сделать разными способами, о которых мы еще поговорим позже, а пока самый простой из них – написать вот такой простой код, который вернет булево (логическое) значение

In [35]:
'Water' in products_to_buy

False

In [36]:
'Oranges' in products_to_buy

True

### "Склеивание" списков, операции split и join

Что еще можно сделать со списками? Их, например, можно "склеить"

In [38]:
my_list_1 = ['a', 'b', 'c']
my_list_2 = ['d', 'e', 'f']

print(my_list_1 + my_list_2)

['a', 'b', 'c', 'd', 'e', 'f']


А еще можно превратить список в строку...

In [40]:
str(my_list_1)

"['a', 'b', 'c']"

Обратите внимание, что у нас получилась строка с квадратными скобками и кавычками... Можно, конечно, удалить из нее все ненужное с помощью метода replace(), но есть вариант и попроще – сразу сделать нормальную строку без лишних символов с помощью метода join()

In [42]:
print(''.join(my_list_1))
print('***'.join(my_list_1))
print(' '.join(my_list_1))

abc
a***b***c
a b c


join() – метод строки, а не списка, но на вход он принимает именно список, который надо заджойнить. Приведенная выше запись означает **"соединить элементы списка my_list_1 с разделителем *"**

Если список можно превратить в строку, то и обратная операция должна быть? И она есть

In [43]:
list('строка')

['с', 'т', 'р', 'о', 'к', 'а']

С помошью ключевого слова list() мы можем разбить строку на отдельные элементы по символу. А что если мы хотим разбить строку по какому-то специальному разделителю? И так тоже можно 

In [44]:
'Mango,Papaya,Bananas,Kiwi'.split(',')

['Mango', 'Papaya', 'Bananas', 'Kiwi']

### Срезы

А что если нам нужно посмотреть первые N элементов списка? А если мы хотим посмотреть элементы списка со 2 по 5? А последние 5?

Для этого в Python есть срезы. Например, вот такая запись говорит, что _нам нужны элементы списка my_list_3 с 0 по 3._

In [46]:
my_list_3 = ['a', 'b', 'c', 'd', 'e', 'f', 'g']

my_list_3[:3]

['a', 'b', 'c']

А вот такая, что со 2 по 4

In [47]:
my_list_3[1:4]

['b', 'c', 'd']

_Заметили подвох?_

В срезе левая граница _всегда_ исключающая, а правая – включающая. То есть если мы пишем, my_list_3[1:4], то получаем элементы с индексами со 2 по 4. Как думаете, что нужно написать, чтобы получить элементы с 5 и до конца списка?

### И еще немного про списки

Вообще-то говоря, в списке могут лежать не только строки, а вообще все, что угодно. Возможно, вы уже знакомы с языками программирования со строгой типизацией, где в списке строк не могут находиться, например, вещественные числа. Python же такого не запрещает :)

In [49]:
my_mixed_list = [1, 2, 'a', True, 'c', 1.2]
my_mixed_list.append('anything you want')

print(my_mixed_list)

[1, 2, 'a', True, 'c', 1.2, 'anything you want']


Элементом списка может быть даже другой список

In [51]:
my_mixed_list.append([1, 2, 3])
print(my_mixed_list)

[1, 2, 'a', True, 'c', 1.2, 'anything you want', [1, 2, 3]]


На самом деле со списками можно делать множество операций. Например, находить максимальный или минимальный элемент...

In [53]:
print(max(my_list_1))
print(min(my_list_1))

c
a


...сортировать или разворачивать

In [57]:
print(my_list_1)
# разворачиваем список
my_list_1.reverse()

print(my_list_1)
# снова сортируем список от меньшего к большему
my_list_1.sort()

print(my_list_1)

['a', 'b', 'c']
['c', 'b', 'a']
['a', 'b', 'c']


...и еще много чего другого. Подробнее можно почитать, например, тут https://pythontutor.ru/lessons/lists/

## Кортежи

Есть в Python еще одна структура данных, которя чем-то напоминает список. Называется кортеж. Основная разница между списком и кортежем состоит в том, что список является _изменяемым_ – мы можем поменять, добавить или удалить элементы, а кортеж – _неизменяемым_.

Кортеж похож на список – это тоже несколько элементов, разделенных запятой, но только _не в квадратных, а в круглых скобках_.
Создать кортеж можно с помощью скобок или через ключевое слово tuple(), которое можно применить к строке.

In [61]:
my_tuple_1 = (1, 2, 3)
print(my_tuple_1)

my_tuple_2 = tuple('456')
print(my_tuple_2)

(1, 2, 3)
('4', '5', '6')


_Но будьте внимательны, когда создаете кортеж из одного элемента с помощью скобок!_

Такая запись на первый взгляд должна создать новый кортеж...

In [63]:
my_tuple_3 = (1)

type(my_tuple_3)

int

_Неожиданно, правда?_

На самом деле все логично. Скобки в Python воспринимаются именно как скобки, мы можем их использовать в логических или математических операциях. Поэтому, чтобы создать кортеж из одного элемента нам нужно написать вот так

In [64]:
my_tuple_3 = (1,)

type(my_tuple_3)

tuple

С кортежами можно делать те же самые операции, что и со списками, за исключением добавления, удаления и измемения элементов.

In [65]:
print(my_tuple_1)

print(my_tuple_1[0])

(1, 2, 3)
1


In [68]:
len(my_tuple_1)

3

In [69]:
my_tuple_1.index(1)

0

_Зачем вообще нужны кортежи, если есть списки?_

Ответ простой – для защиты. Вы дейстивительно можете сделать со списком все операции, доступные для кортежей. И скорее всего в большинстве случаев вы будете использовать именно списки (возможно, вы даже вообще не будете работать с кортежами), но тем не менее иногда в коде важно предусмотреть _незименяемый_ элемент. Для этого и нужны кортежи.

## Словари

До этого мы с вами работали с упорядоченными наборами данных – списками и кортежами. Но существует и еще кое-что.

Словарь – неупорядоченная структура данных, хранящая информацию по схеме ключ-значение, где все ключи уникальны. Чтобы проще было понять, что такое словарь, представьте себе список, у которого индексами являются не номера элементов, а что-то произвольное.

In [71]:
my_dict_1 = {1: "a", 2: "b", 3: "c"}
print(my_dict_1)

{1: 'a', 2: 'b', 3: 'c'}


В данном случае ключами у нас являются **1, 2, 3**, а значениями соответственно **a, b, c**.

Кстати, мы можем получить список ключей и список значений словаря с помощью специальных методов.

In [75]:
print('Keys: ', my_dict_1.keys())
print('Values: ', my_dict_1.values())

Keys:  dict_keys([1, 2, 3])
Values:  dict_values(['a', 'b', 'c'])


А можно сразу получить и ключи, и значения. К слову, внутри лежат те самые кортежи :)

In [78]:
my_dict_1.items()

dict_items([(1, 'a'), (2, 'b'), (3, 'c')])

### Создание словаря

Но не будем забегать вперед. Давайте разберемся, как создать словарь. Один способ (с помощью литерала – фигурных скобочек) мы уже увидели. Посмотрим, какие еще есть варианты.

Можно это сделать с помощью функции dict()

In [84]:
my_dict_2 = dict(a=3, b='b')
print(my_dict_2)

my_dict_3 = dict([(1,'a'), (2,'b')])
print(my_dict_3)

{'a': 3, 'b': 'b'}
{1: 'a', 2: 'b'}


Или через функцию fromkeys()

In [85]:
my_dict_4 = dict.fromkeys(['a', 'b', 3], 100)
print(my_dict_4)

{'a': 100, 'b': 100, 3: 100}


### Что можно делать со словарями

В словари можно добавлять значения, можно менять их, а можно удалять. Обращаться к значению нужно не по индексу, а по ключу.

In [90]:
print(my_dict_2)
print(my_dict_2['a'])

my_dict_2['a'] = 10
print(my_dict_2)

my_dict_2.pop('b')
print(my_dict_2)

{'a': 10, 'b': 'b'}
10
{'a': 10, 'b': 'b'}
{'a': 10}


Если мы попробуем обратиться к несуществующему ключу, то получим ошибку. Примерно так же как и в случае с обращением к несуществующему индексу списка или кортежа.

In [91]:
my_dict_2['t']

KeyError: 't'

_Помните, что словари в отличие от списков и кортежей неупорядочены! Поэтому никогда не рассчитывайте на то, что жлементы в нем будут расположены в том же порядке, что и при создании._

Подробнее почитать про методы словарей можно тут – https://pythonworld.ru/tipy-dannyx-v-python/slovari-dict-funkcii-i-metody-slovarej.html

## Множества

Ох, еще одна структура данных! В Python множество очень похоже на множество математическое – "контейнер" с уникальными элементами, расположенными в неупорядоченном виде. Если простыми словами, то множество это список, в котором все элементы уникальны, а порядок не гарантируется.

### Создание множества

Создать множество можно только с помощью ключевого слова set().

In [114]:
my_set_1 = set([1, 2, 4])
print(my_set_1)
type(my_set_1)

{1, 2, 4}


set

Будьте внимательны – несмотря на то, что множество тоже обозначается фигурными скобками, вот так создать _пустое_ множество не получится – вы создатите словарь :)

In [123]:
my_set_2 = {1, 2, 3, 3}
print(my_set_2)
type(my_set_2)

{1, 2, 3}


set

In [125]:
empty_set = {}
type(empty_set)

dict

С помощью множества удобно удалять пересекающиеся элементы

In [117]:
set('hello')

{'e', 'h', 'l', 'o'}

In [122]:
{1, 2, 3, 3, 3, 3}

{1, 2, 3}

### Операции с множествами

С множествами можно производить большое количество операций, например, можно узнать, принадлежит ли элемент множеству

In [127]:
1 in {1, 2, 3}

True

In [128]:
'a' in {'b', 'c'}

False

Можно объединять множества

In [132]:
{1, 2}.union({2, 3})

{1, 2, 3}

Можно находить пересечения множеств

In [133]:
{1, 2}.intersection({2, 3})

{2}

С помощью метода **{set}.difference({other_set})** находить множество из всех элементов set, не принадлежащие other_set

In [135]:
{1, 2}.difference({1, 3})

{2}

Можно также проверить через метод **set.isdisjoint(other)**, имеют ли множества общие элементы. _Возвращает истину, если множества НЕ имеют общих элементов._

In [137]:
{1, 2}.isdisjoint({2, 3})

False

Также в множество можно добавлять элементы

In [144]:
my_set_1 = {1, 2}
my_set_1.add(3)

my_set_1

{1, 2, 3}

Можно удалять первый элемент. Но! 

_Поскольку множества неупорядочены, то нельзя точно сказать, какой именно элемент будет удален!_

In [145]:
my_set_1.pop()
my_set_1

{2, 3}

Поэтому есть специальный метод для удаления элемента по значению. Если элемент содержится в множестве, он будет удален.

In [147]:
my_set_1.discard(3)
my_set_1

{2}

In [148]:
my_set_1.discard(10)
my_set_1

{2}

### Frozenset

Есть еще frozenset – замороженное множество. В целом это то же самое, что и обычное множество, только неизменяемое. Ситуация похожа на списки и кортежи.

Например, во frozenset нельзя добавить или удалить элемент.

In [150]:
my_frozen_set = frozenset([1, 2, 3])
type(my_frozen_set)

frozenset

In [151]:
my_frozen_set

frozenset({1, 2, 3})

Подробнее про set и frozenset можно почитать тут – https://pythonworld.ru/tipy-dannyx-v-python/mnozhestva-set-i-frozenset.html