В этом ноутбуке кратко рассмотрим простейшие выстроенные в Python структуры данных. 

Структуры данных - форматы для организации и хранения данных. Этот «макет» позволяет структуре данных быть эффективной в некоторых операциях и неэффективной в других.

**Простейшие структуры данных Python**

| Структура     | Пример    | Описание                  |
|----------|------------|------------------------------|
| `list`      | `[1, 2, 3]`      | списки - упорядоченные коллекции                   |
| `tuple`    | `(1, 2, 3)`    | кортежи - неизменяемые списки    |
| `dict`  | `{'a':1, 'b':2, 'c':3}`	 | неупорядоченные коллекции вида "ключ" - значение            |
| `set`     | 	`{1, 2, 3}`   | неупорядоченные коллекции - множества |

В Python по умолчанию не реализованы массивы, что решается сторонней, но уже практически базовой библиотекой **numpy**.

Также существуют другие структуры данных, например, в модуле COllections. О них можно почитать, например, [тут](https://pythonworld.ru/moduli/modul-collections.html)

# List
Структура вида "элемент-голова + указатель на следующий элемент". Полседний элемент просто указывает на None, за счёт чего к нему удобно добавить следующий элемент.
![title](imgs/list.png)

Списки  удобны, когда вам нужен "паровозик" данных, в котором вы будете проходиться по каждому вагону и, возможно, цеплять или убирать новые.

In [1]:
l = [2,3,5,7,11]

In [2]:
# действительно, из списка легко вытащить "голову" и "тело"
head, *body = l
# почему перед body стоит звёздочка, поговорим позже

In [3]:
head

2

In [4]:
body

[3, 5, 7, 11]

In [5]:
# можно, кстати, наоборот, вытащить тело с голоовой и последний элемент (ноги) списка
*head, body = l

In [6]:
head

[2, 3, 5, 7]

In [7]:
body

11

Массив - изменяемая структура в Python. Новый элемент списка добавляется методом **append**.

Тут проявляется динамическая типизация Python: в структуре данных могут содержаться данные разных типов.

## `list.append()`

In [8]:
# например, и числа, и строки
l.append("one more")

In [9]:
# это может быть удобно в "бытовой" практике, но является плохим тоном при разработке приложений
l

[2, 3, 5, 7, 11, 'one more']

In [10]:
# как и для строк, можем измерить длину списка
len(l)

6

## `индексация` (в т.ч. отрицательная)
![title](imgs/list_indices.png)

In [11]:
l[0], l[4], l[5]

(2, 11, 'one more')

In [12]:
l[-1]

'one more'

In [13]:
# срезы списка по индексу. Сам список l при этом не меняется.
l[1:5]

[3, 5, 7, 11]

In [14]:
# срезы через более чем один элемент.
# например, каждый второй элемент списка с индексом от 1 до 5
l[1:6:2]

[3, 7, 'one more']

In [15]:
# срезы в обратную сторону
l[-1:-5:-1]

['one more', 11, 7, 5]

In [16]:
# а также суммирование списков
l2 = l + ["element from another list"]
l2

[2, 3, 5, 7, 11, 'one more', 'element from another list']

In [17]:
# метод pop() "отрывает" у списка последний элемент. Например, было:
l

[2, 3, 5, 7, 11, 'one more']

In [18]:
l.pop()

'one more'

In [19]:
# стало
l

[2, 3, 5, 7, 11]

In [20]:
# либо тот элемент, который вы укажете. Например, нулевой (голову списка)
l.pop(0)

2

In [21]:
# стало
l

[3, 5, 7, 11]

In [22]:
# при этом, введённый выше список l2 был создан как новый объект, поэтому с ним ничего не произошло
l2

[2, 3, 5, 7, 11, 'one more', 'element from another list']

## `list.extend()`

In [23]:
# если требуется расширить список на несколько элементов, используйте функцию extend или оператор +=
l = [1, 2]
l.extend([3, 4])
l += [5,6]
l

[1, 2, 3, 4, 5, 6]

## `list.append()`

In [24]:
# не забывайте о том, что в отличие от написанного выше, ".append" не расширит список, а добавит список ещё одни элементов
l.append([7, 8])
l

[1, 2, 3, 4, 5, 6, [7, 8]]

In [25]:
l.append(1)
# в списке можно найти индекс первого вхождения нужного элемента
print(l.index(1))
print(l.index([7,8]))

0
6


In [26]:
# можно посчитать, сколько в списке содержится конкретных элементов
# например, сколько в списке единиц?
l.count(1)

2

## `list.sort()`

In [27]:
# можно отсортировать список по возрастанию
l.sort()
# однако сейчас мы получим ошибку, т.к. один из элементов не число, и интерпретатор не может сравнить его с другими элементами

TypeError: '<' not supported between instances of 'list' and 'int'

In [28]:
# можно убрать из списка первое вхождение конкретного элемента
del l[6:7]
l

[1, 2, 3, 4, 5, 6, 1]

In [29]:
# и теперь отсортировать
l.sort()
l

[1, 1, 2, 3, 4, 5, 6]

## `sorted(list)`
позволяет сделать упорядоченную копию списка, не меняя исходный

In [None]:

numbers = [8, 1, 6, 5, 10]
sorted_numbers = sorted(numbers)

In [30]:
# и убрать первое вхождение конкретного элемента
l.remove(1)
# remove - это то же самое, что del l[индекс элемента x]
l

[1, 2, 3, 4, 5, 6]

# Tuple
Кортежи - те же списки, только неизменяемые

In [31]:
t = (2,3,5,7,11)
t

(2, 3, 5, 7, 11)

In [32]:
# можно записывать без скобок
t = 2,3,5,7,11
t

(2, 3, 5, 7, 11)

In [33]:
# кортеж неизменяем, к нему нельзя добавить новый элемент
t.append("new element")

AttributeError: 'tuple' object has no attribute 'append'

In [34]:
# однако, если метод создаст новый объект, а не поменяет старый, то почему бы и нет
a = ("new element",)
t + a

(2, 3, 5, 7, 11, 'new element')

In [35]:
# сам кортеж t при этом не поменялся, сколько раз к нему что-то не прибавляй
t

(2, 3, 5, 7, 11)

In [36]:
# кортежи поддерживают те же операции доступа к элементам, что и списки
t[0:4]

(2, 3, 5, 7)

Не забывайте, что создание нового объекта требует выделения памяти. Процесс небыстрый, поэтому если вы захотите много раз увеличивать длину кортежа, создавая новый кортеж, это будет происходить медленно.

На практике проверим это.

## Зачем нам нужен такой объект?

Кортежи занимают меньше памяти и работают быстрее списков, если нам не нужно менять сам кортеж.

Чаще всего кортежи используются, когда нам нужно передать несколько аргументов функции.

Либо в функциях, возвращающих больше одного аргумента

О функциях потом, но вот пример:

In [37]:
def fsum(a, b, c): 
    ''' функция от трёх аргументов'''
    return a+b+c

fsum(5, 6, 7)

18

In [38]:
# мы можем обозначить 5, 6, 7 разным целочисленным переменным, подставить их в функцию и получить тот же ответ

v1 = 5
v2 = 6
v3 = 7

# либо, что то же самое
v1, v2, v3 = 5, 6, 7

fsum(v1, v2, v3)

18

In [39]:
# либо можем подставить в функицию кортеж одной переменной, предварительно "раскрыв его" операцией "*"
# воспринимайте "*" как удаление скобок вокруг кортежа

t1 = (5, 6, 7)
fsum(*t1)

18

In [40]:
def algebraic_operators(a): 
    ''' функция, которая возвращает 3 элемента'''
    return a+a, a*a, a**a

algebraic_operators(3)

(6, 9, 27)

In [41]:
type(algebraic_operators(3))

tuple

In [42]:
# таже список можно явным образом преобразовать в кортеж
tuple([1, 2, 3, 4])

(1, 2, 3, 4)

# Dictionary
Удобная изменяемая структура вида ключ-значение
![title](imgs/dictionary.png)

Для ускорения работы в Python словари на самом деле реализованы как хеш-таблицы, что позволяет им работать быстрее, но занимая больше памяти.
Можно прочитать про хеш-таблицы в Python [по ссылке](http://thepythoncorner.com/dev/hash-tables-understanding-dictionaries/)

![title](imgs/hashtable.png)

На практике используем словари для разгадывания Римского шифра

## создание и доступ к элементам словаря

In [43]:
my_dict = {'key1':'value1', 'key2':'value2', 'key3':'value3'}

In [44]:
# доступ к элементам осуществляется по ключам
my_dict['key2']

'value2'

In [46]:
# можно проверить, есть ли конкретный ключ в словаре
'key2' in my_dict
# в Python 2 для этого использовался метод my_dict

True

In [47]:
# В качестве ключа может использоваться любой "хешируемый" (т.е. чаще всего неизменяемый) тип или структура данных. Даже кортеж!
my_dict = {(1,2,3): 1}
my_dict[(1,2,3)]

1

In [48]:
# список уже не может быть ключом, т.к. если мы изменим список, изменится и хеш, по которому Python находит значение в словаре
my_dict = {[1,2,3]: 1}

TypeError: unhashable type: 'list'

In [2]:
# но может быть значеним в словаре
# к которому, кстати, можно сразу применить срез или доступ по индексу

my_dict = {'key1':'value1', 'key2':'value2', 'key3':[1, 2, 3]}
my_dict['key3'][0:2]

[1, 2]

Словари - неупорядоченные структуры. В будущем, попытавшись пройти по словарю циклом, вы можете сделать это не в том же порядке, в котором вы определяли словарь.

In [3]:
# В словарь можно добавить новую пару ключ-значение
my_dict['key10050'] = "new value"
my_dict

{'key1': 'value1',
 'key2': 'value2',
 'key3': [1, 2, 3],
 'key10050': 'new value'}

## удаление элементов словаря

In [4]:
del my_dict['key10050']
my_dict

{'key1': 'value1', 'key2': 'value2', 'key3': [1, 2, 3]}

## `dict.keys(), dict.values(), dict.items()`

In [5]:
# можно получить список всех ключей
my_dict.keys()

dict_keys(['key1', 'key2', 'key3'])

In [6]:
# или всех значений
my_dict.values()

dict_values(['value1', 'value2', [1, 2, 3]])

# Set

Множества - просто алгебраические множества. Неупорядоченные изменяемые структуры, к которым удобно применять операции на множествах - объединение, пересечение, сложение, вычитание, симметричное вычитание

In [53]:
myset = {1,2,3}
myset

{1, 2, 3}

In [54]:
# множества удобно создавать, явно преобразовывая из других структур с помощью функции set()
myset = set([1,2,3])

In [55]:
# элементы добавляются методом add()
myset.add(4)
myset

{1, 2, 3, 4}

In [56]:
# что будет, если добавить к множеству элемент, который в нём уже есть?
myset.add(4)
# спойлер: ничего не будет
myset

{1, 2, 3, 4}

In [57]:
# в множестве нет повторяющихся элементов, поэтому нередко это простой способ быстро убить все повторяющиеся элементы в структуре
myset = set([1,1,1,1,1,1,1,2,2,2,2,2,3])
myset

{1, 2, 3}

In [58]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

In [59]:
# основные операции над множествами можно осуществлять как с помощью операторов |, &, +, -, ^, так и с помощью методов
primes | odds      # with an operator
primes.union(odds)

{1, 2, 3, 5, 7, 9}

In [60]:
primes & odds             # with an operator
primes.intersection(odds)

{3, 5, 7}

In [61]:
primes - odds           # with an operator
primes.difference(odds)

{2}

In [62]:
primes ^ odds                     # with an operator
primes.symmetric_difference(odds)

{1, 2, 9}

In [4]:
def f(x): return x
type(f)

function