In [None]:
# Алгоритмы. Основные структуры данных

![001](artifacts/001.jpeg)

# 1. Что такое алгоритмы, зачем их изучать

### Алгоритм представляет собой набор команд для выполнения какой-либо задачи.

### Все данные, необходимые для решения задачи, организуются особым образом в структуры данных.

Для чего нужно изучать алгоритмы?

1. Практика решения задач:
    * Анализ условий
    * Декомпозиция задачи на подзадачи
    * Поиск решения
    * Проверка решения
2. Практика написания кода
3. Прохождение собеседования

# 2. Еще немного об О-нотации

### Производительность алгоритма определяется функцией, которая указывает, насколько ухудшается работа алгоритма с усложнением поставленной задачи

Производительность по памяти - Space Complexity - какое количество дополнительной памяти понадобится алгоритму для выполнения
Производительность по времени - Time Complexity - какое количество операций потребуется для выполнения алгоритма

![002](artifacts/002.png)

## O(1) - Алгоритм всегда выполняется за фиксированное время, вне зависимости от размера данных

In [1]:
def find_deviding_point(values):
    last_index = len(values) - 1

    number_1 = values[0]
    number_2 = values[last_index]
    number_3 = values[last_index // 2]

    if number_2 <= number_1 <= number_3:
        return number_1
    if number_1 <= number_2 <= number_3:
        return number_2
    return number_3

In [4]:
from random import shuffle

# Неупорядоченный массив от 0 до 99
values = [i for i in range(100)]
shuffle(values)

In [5]:
%timeit find_deviding_point(values)

368 ns ± 42.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [6]:
from random import shuffle

# Неупорядоченный массив от 0 до 99
values = [i for i in range(1000)]
shuffle(values)

In [7]:
%timeit find_deviding_point(values)

380 ns ± 36.6 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


# 3. Основные структуры данных в Python - list, dict, tuple, set

## 3.1 List

### List - структура данных, которая реазилует динамический массив. Это означает, что можно добавлять и удалять элементы, и List автоматически реализует управление памятью "под капотом".
### List - типонезависимый, может содержать любые Python-типы.
### List - изменяемый **(mutable)** тип данных!!!

In [57]:
class Point:
    def __init__(self, x, y):
        self.x, self.y = x, y

    def __repr__(self):
        return f'({self.x}, {self.y})'

    def __hash__(self):
        return hash(f'{self.x}x') + hash('{self.y}y')

my_list = [
    1,
    0.1,
    False,
    None,
    'string',
    [1, 2, 3],
    (1, 2, 3),
    {1, 2, 3},
    {1: 'a', 'b': 2},
    find_deviding_point,
    Point(5, 3),
]

[type(v) for v in my_list]

[int,
 float,
 bool,
 NoneType,
 str,
 list,
 tuple,
 set,
 dict,
 function,
 __main__.Point]

In [11]:
values_100 = [i for i in range(100)]
shuffle(values)

In [None]:
%timeit values_100.insert(30, 1)

In [None]:
%timeit values_100.append(1)

In [14]:
%timeit values_100.pop(40)

68.8 ns ± 1.23 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


In [15]:
values_10000 = [i for i in range(10000)]
shuffle(values)

In [None]:
%timeit values_10000.insert(30, 1)

In [16]:
%timeit values_10000.append(1)

84 ns ± 5.84 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


In [17]:
%timeit values_10000.pop(40)

56.8 ns ± 2.15 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


## 3.2 Tuple

### Tuple - неизменяемая (immutable) структура данных!!! Это означает, что можно добавлять элементы можно только на этапе создания структуры.
### Tuple - типонезависимый, может содержать любые Python-типы.

In [20]:
tuple_1 = (
    1,
    0.1,
    False,
    None,
    'string',
    [1, 2, 3],
    (1, 2, 3),
    {1, 2, 3},
    {1: 'a', 'b': 2},
    find_deviding_point,
    Point(5, 3),
)
tuple_1

(1,
 0.1,
 False,
 None,
 'string',
 [1, 2, 3],
 (1, 2, 3),
 {1, 2, 3},
 {1: 'a', 'b': 2},
 <function __main__.find_deviding_point(values)>,
 (5, 3))

In [21]:
tuple_1[0]

1

In [22]:
tuple_1[0] = 10

TypeError: 'tuple' object does not support item assignment

In [23]:
del tuple_1[0]

TypeError: 'tuple' object doesn't support item deletion

## 3.3 Dict

### Dict - структура данных, в которой доступ к значениям осуществляется по уникальному ключу
### Уникальность ключа достигается с помощью хэш-функции
### Вставка, поиск и удаление по ключу происходит за О(1)
### Ключ должен быть хэшируемым!
### Dict - изменяемый (mutable) тип данных!!!

### Как работает dict
```
our_dict = dict(a=1)
```

1. При создании dict в памяти создается массив размером 8, резервируется 8 пустых ячеек. А также создается пустая таблица
```
[null, null, null, null, null, null, null, null]
```

hash | key | value
---- | ---- | ----
... | ... | ...

2. При вставке значения вычисляется hash от ключа
```
hash('a') -> C1E001
```
3. Вычисляется остаток от деления на 8. Полученное значение - индекс массива из п.1.
```
C1E001 % 8 -> 1
```
4. В массив из п.1 по полученному индексу записываем 0. Это обозначает номер строки в хэш-таблице
```
[null, 0, null, null, null, null, null, null]
```

hash | key | value
---- | ---- | ----
C1E001 | FFEB678C | 633241c4
... | ... | ...

In [None]:
our_dict['a']

In [35]:
p = Point(5, 5)

my_dict = {
    1: 1,
    2.0: 1.0,
    False: True,
    'string': 'string',
    None: 'None',
    p: Point(7, 8),
}

print(my_dict)

{1: 1, 2.0: 1.0, False: True, 'string': 'string', None: 'None', (5, 5): (7, 8)}


In [36]:
hash(1)

1

In [37]:
hash(2.0)

2

In [38]:
hash(False)

0

In [39]:
hash('string')

-7188663807684843087

In [40]:
hash(None)

-9223363241852847411

In [41]:
hash(p)

107716173578

In [42]:
my_dict[p]

(7, 8)

In [43]:
dict_100 = {i: i for i in range(100)}

In [44]:
%timeit dict_100[30]

82 ns ± 5.07 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


In [46]:
dict_10000 = {i: i for i in range(10000)}

In [47]:
%timeit dict_10000[3000]

71.2 ns ± 3.44 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


### Tuple тоже может быть ключом

In [48]:
{
    (1, 2.0, False, None, Point(5, 6)): [1, 2, 3, '4', '567']
}

{(1, 2.0, False, None, (5, 6)): [1, 2, 3, '4', '567']}

In [49]:
hash((1, 2.0, False, None, Point(5, 6)))

-3428213705806784297

### List и Set НЕ может быть ключом

In [50]:
{
    [1, 2, 3]: [11, 22, 33]
}

TypeError: unhashable type: 'list'

In [51]:
{
    {1, 2, 3}: [11, 22, 33]
}

TypeError: unhashable type: 'set'

In [None]:
class SomeClass:

    def __hash__(self):
        return ...

In [54]:
{
    1: 'a',
    1: 'b'
}

{1: 'b'}

In [71]:
class Point:
    def __init__(self, x, y):
        self.x, self.y = x, y

    def __repr__(self):
        return f'({self.x}, {self.y})'

    def __hash__(self):
        return hash(f'{self.x}x') + hash('{self.y}y')

    def __eq__(self, other):
        return hash(self) == hash(other)

In [77]:
p1 = Point(5, 5)
p2 = Point(6, 5)

In [78]:
hash(p1)

466902355881417452

In [79]:
hash(p2)

7134802665848902026

In [80]:
{
    p1: Point(7, 8),
    p2: Point(9, 8),
}

{(5, 5): (7, 8), (6, 5): (9, 8)}

## 3.4 Set

### Set - структура данных, которая не позволяет дублировать элементы.
### Set используют для быстрой проверки на вхождение во множество значений, для вставки и удаления значений, а также для поиска объединения и пересечения двух множеств.
### Set использует hash-функции аналогично с Dict, но вместо пары ключ-значение хранит только значение
### Set - изменяемый (mutable) тип данных!!!

In [81]:
set([1, 2, 2, 3, 4])

{1, 2, 3, 4}

In [82]:
set_1 = {i for i in range(1, 11)}  # 1-10
set_2 = {i for i in range(5, 16)}  # 5-15

In [83]:
set_1 | set_2

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15}

In [84]:
set_1.intersection(set_2)

{5, 6, 7, 8, 9, 10}

In [85]:
set_1 ^ set_2

{1, 2, 3, 4, 11, 12, 13, 14, 15}

In [None]:
to_create = []
to_update = []

for note in data:
    if Notes.objects.filter(uid=note['uid']).exists():
        to_create.append(Note(**note))
    else:
        to_update.append(Note(**note))

In [None]:
existent = set(Notes.objects.values_list('id'))
to_create = []
to_update = []

for note in data:
    if note['uid'] in existent:
        to_create.append(Note(**note))
    else:
        to_update.append(Note(**note))

# 4. Очереди

## 4.1 FIFO

![003](artifacts/003.png)

### FIFO-очередь реализует алгоритм First-In/First-Out (FIFO) - первый вошел / первый вышел

In [98]:
class FIFO:
    def __init__(self):
        self._container = []

    def enque(self, value):
        self._container.append(value)

    @property
    def head(self):
        return self._container[-1]

    def deque(self):
        return self._container.pop(0)

    @property
    def tail(self):
        return self._container[0]

In [99]:
fifo = FIFO()

In [100]:
fifo.enque(1)

In [101]:
fifo.head

1

In [102]:
fifo.tail

1

In [103]:
fifo.enque(2)

In [104]:
fifo.head

2

In [105]:
fifo.tail

1

In [106]:
fifo.deque()

1

In [107]:
fifo.deque()

2

In [108]:
fifo.deque()

IndexError: pop from empty list

## 4.2 LIFO. Он же ~~Гора, он же Жора, он же~~ стэк

![004](artifacts/004.png)

### Стэк реализует алгоритм last-In/First-Out (LIFO) - последний вошел / первый вышел

In [109]:
class Stack:
    def __init__(self):
        self._container = []

    def push(self, value):
        self._container.append(value)

    @property
    def head(self):
        return self._container[-1]

    def pop(self):
        return self._container.pop()

    @property
    def tail(self):
        return self._container[0]

In [110]:
stack = Stack()

In [111]:
stack.push(1)

In [112]:
stack.head

1

In [113]:
stack.tail

1

In [114]:
stack.push(2)

In [115]:
stack.head

2

In [116]:
stack.tail

1

In [117]:
stack.pop()

2

In [None]:
stack.pop()

In [None]:
stack.pop()

# 5. [collections](https://docs.python.org/3/library/collections.html)

![005](artifacts/005.png)

# 6. Полезные ресурсы

## 6.1 С чего начать

* [Python 3.10 documentation. Data structures](https://docs.python.org/3/tutorial/datastructures.html#tuples-and-sequences)
* [Common Python Data Structures](https://realpython.com/python-data-structures/)
* [collections](https://docs.python.org/3/library/collections.html)
* [Time Complexity](https://wiki.python.org/moin/TimeComplexity)
* [Как устроен dict](https://stackoverflow.com/a/44509302)

## 6.2 Что почитать

* [Грокаем алгоритмы](https://www.piter.com/product_by_id/109460742?recommended_by=instant_search&r46_search_query=%D0%B3%D1%80%D0%BE%D0%BA%D0%B0%D0%B5%D0%BC)
* [Род Стивенс. Алгоритмы](https://eksmo.ru/book/algoritmy-teoriya-i-prakticheskoe-primenenie-2-e-izdanie-ITD1210854/)
* [Стивен Скиена. Алгоритмы](https://bhv.ru/product/algoritmy-rukovodstvo-po-razrabotke-2-e-izd/)

## 6.3 Где попрактиковаться

* [CodinGame](https://www.codingame.com/)
* [HackerRank](https://www.hackerrank.com/)
* [LeetCode](https://leetcode.com/)
