![](https://gohighbrow.com/wp-content/uploads/2018/07/Computer-science-fundamentals_6.1.png)

In [None]:
# [] -> [0] -> [0, 1] -> [0, 1, 2] -> [0, 1]
stack = list()

# add to stack
stack.append(0)  # O(1)
stack.append(1)  # O(1)
stack.append(2)  # O(1)

# delete from stack
print(stack.pop())  # O(1)
print(stack.pop())  # O(1)
print(stack.pop())  # O(1)

2
1
0


### ПСП (Правильная скобочная последовательность)

строка, состоящая из `(` и `)`

строка может быть ПСП либо не ПСП

ПСП:
1. пустая строка - ПСП
2. если A ПСП -> (A) - ПСП
3. если A и B ПСП -> AB - ПСП


**ПСП**: последовательность с неотрициательным балансом на любом префиксе и вся строка имеет баланс 0


Баланс: `( == 1`, `) == -1`

In [None]:
s = "(()))()))(())(()"
stack = []

for i in s:
    if i == "(":
        stack.append(1)
    else:
        if len(stack) == 0:  # if not stack:
            print("BREAK ON PREFIX")
            print("NOT PSP")
            break
        else:
            stack.pop()
else:
    if len(stack) == 0:
        print("PSP")
    else:
        print("BALANCE NOT 0")
        print("NOT PSP")

BREAK ON PREFIX
NOT PSP


In [None]:
# queue
# [] -> [0] -> [0, 1] -> [0, 1, 2] -> [1, 2] -> [2] -> []
a = []

# add to queue
a.append(0)  # O(1)
a.append(1)  # O(1)
a.append(2)  # O(1)

# delete from queue
print(a.pop(0))  # O(N)
print(a.pop(0))  # O(N)
print(a.pop(0))  # O(N)

0
1
2


### Глава 0: дэк
Очень удобная структура данных, позволяющая добавлять элементы как в конец, так и в начало. На ее основе можно сделать очередь или двустороннюю очередь.
Все добавления и удаления из конца происходят за константное количество операций, то есть за $O(1)$. Это быстро и очень удобно. Удаление из любой другой части **не гарантируют** такую быстроту. Под капотом дэк устроен из трех массивов на самом деле.

In [None]:
from collections import deque

In [None]:
queue = deque()


queue.append(0)  # O(1)
queue.append(1)  # O(1)
queue.append(2)  # O(1)

print(queue.popleft())  # O(1)
print(queue.popleft())  # O(1)
print(queue.popleft())  # O(1)

0
1
2


In [None]:
stack = deque()


stack.append(0)  # O(1)
stack.append(1)  # O(1)
stack.append(2)  # O(1)

print(stack.pop())  # O(1)
print(stack.pop())  # O(1)
print(stack.pop())  # O(1)

2
1
0


In [None]:
deq = deque()
deq.appendleft(0)
deq.appendleft(1)
deq.appendleft(2)

deq

deque([2, 1, 0])

In [None]:
deq[1] = 10

In [None]:
deq

deque([2, 10, 0])

### Глава 1: введение в хэши

**Definition:** A hash function is a function that takes a set of inputs of any arbitrary size and fits them into a table or other data structure that contains fixed-size elements.


Более просто (но это не общий случай), можно считать, что некоторый объект `obj` может быть передан некоторой функции $f$, такой что $f(obj) \in H\subset\mathbb{Z}$.

С точки зрения практики, это, например, позволяет "укомплектовать" любого размера строчки в числа. При этом могут быть коллизии:

<img src="https://upload.wikimedia.org/wikipedia/commons/d/d0/Hash_table_5_0_1_1_1_1_1_LL.svg" style="background-color:white">

**Пример:** как хэшировать строки? Например, пусть у нас есть некоторые простые числа $p > 2$ и $M$ (достаточно большое) и некоторая строка $s$ длины $n$, тогда
$h(s) = s_1 * p + s_2 * p^2 + \ldots + s_n * p^n \mod M$

Модуль здесь нужен, чтобы не хранить большие числа, так как такая полиномиальная функция обычно имеет без модуля очень большое значение. В питоне это не так критично, но в языках, где чаще всего размер числа ограничен 8 байтами, это может привести к проблемам.

Простота чисел $p$ и $M$ здесь важна чтобы избежать случая, когда строки из одинаковых символов будут давать по модулю 0.

Однако понятно, что тут все равно могут быть коллизии, причем коллизия будет порядка $\frac{n - 1}{M}$ для строк длины $n$. Если $M$ достаточно большое простое, то это не так критично и хэш таблица такие случаи решать умеет (смотри картинку выше).

### Глава 2: множества

Множества в питоне -- это один из примеров реализации хэш-таблицы в питоне. Позволяет хранить неповторяющиеся объекты и быстро проверять их наличие. Добавление и проверка наличия происходит за $O(1)$, удаление -- тоже за $O(1)$ (с поправкой на коллизии).

In [None]:
a = {1,2,3,4,5}
# set([1,2,3,4,5])

# add to set
a.add(6)  # O(1)

# remove from set
a.remove(6)  # O(1)

# check if in set
print(1 in a)  # O(1)
print(7 in a)  # O(1)

True
False


In [None]:
N_NUMBERS = 10 ** 4

my_list = [i ** 2 for i in range(N_NUMBERS)]
my_set = {i ** 2 for i in range(N_NUMBERS)}

In [None]:
%%timeit

for i in range(N_NUMBERS):
    i in my_list

1.14 s ± 329 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [None]:
%%timeit

for i in range(N_NUMBERS):
    i in my_set

684 µs ± 24 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [None]:
# set consists of unique elements
a = {1,2,3,4,5}

print(a)
a.add(1)
print(a)

{1, 2, 3, 4, 5}
{1, 2, 3, 4, 5}


In [None]:
# remove may raise an exception

a = {1,2,3,4,5}
a.remove(5)
print(a)
a.remove(5)

{1, 2, 3, 4}


KeyError: ignored

In [None]:
a = {1,2,3,4,5}
a.discard(5)
print(a)
a.discard(5)
print(a)

{1, 2, 3, 4}
{1, 2, 3, 4}


In [None]:
# empty set
s = set()
print(type(s))

<class 'set'>


In [None]:
s = {}
print(type(s))

<class 'dict'>


In [None]:
# set from collection
values = [1, 2, 1, 1, 1, 2, 2, 3, 5, 4, 4, 3, 5, 2, 1]
print(set(values))
print(f"original: {len(values)}, set: {len(set(values))}")

{1, 2, 3, 4, 5}
original: 15, set: 5


In [None]:
# set consists of arbitrary elements
s = {1, 1.0, "str", (1,2,3,4,5)}
print(s)

{1, (1, 2, 3, 4, 5), 'str'}


In [None]:
# NOTE
s = {1, 1.0, "str", (1,2,3,4,5), [1,2,3,4]}

TypeError: ignored

-5659871693760987716