<a href="https://colab.research.google.com/github/8persy/algoritms_colab/blob/main/%D0%97%D0%B0%D0%BD%D1%8F%D1%82%D0%B8%D0%B53_%D0%A1%D0%BB%D0%BE%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%2B_%D0%9B%D0%B8%D0%BD%D0%B5%D0%B9%D0%BD%D1%8B%D0%B5_%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D1%8B_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Сложность алгоритмов и структур данных


**Главная идея Big O** - от передаваемых параметров зависит количество операций, которые будут выполнены перед тем, как алгоритм завершится


**Функция, описывающая сложность алгоритмов**

<img src="https://i0.wp.com/apptractor.ru/wp-content/uploads/2023/12/35276c9c-9288-4123-8944-00ed42ab40e2.png?resize=740%2C511&ssl=1"/>

## Правила подсчета Big O

- Отбрасывание констант\
$O(3n) = O(n)$\
$O(10000000n) = O(n)$\
$O(C*n) = O(n), C - const$

- Максимум суммы\
$ O(n + k) = O(max(n, k)) $\
$ O(n^2 + n) = O(n^2) $\
$ O(n! + logn) = O(n!) $

- Мультипликативность (для оценки нескольких функций)\
$ O(n) * O(k) = O(nk) $

## Сложность O(1) - Константная сложность

In [None]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


Если код всегда выполняется за одно и то же время и никак не зависит от размера входных данных, то сложность алгоритма является **константной**

## Сложность O(N) - Линейная сложность

In [None]:
def generate_numbers(N):
    ...
    for i in range(N):
        ...
    return i

In [None]:
def example(N):
    a = 1
    for i in range(N):
        print(i)
    a += 1

In [None]:
def example_two(N):
    a = 1
    for i in range(N):
        print(i)
    for j in range(N):
        print(j)
    a += 1

In [None]:
def example_three(N, K):
    a = 1
    for i in range(N):
        print(i)
    for j in range(K):
        print(j)
    a += 1

In [None]:
def example_(N, K):
    a = 1
    for i in range(N):
        for j in range(K):
          print(i + j)
    a += 1

## Полиномиальная сложность
- $ O(N^2) $
- $ O(N^3) $
- $ O(N^4) $\
$\dots$
- $ O(N^k) $



In [None]:
def func(N):
    a = 1
    for i in range(N):
        for j in range(N):
            print(i + j)
    a += 1

In [None]:
def func(N):
    a = 1
    for i in range(N):
        for j in range(N):
            for q in range(N):
                print(i + j + q)
    a += 1

In [None]:
def func(N):
    a = 1
    for i in range(N):
        for j in range(N):
            print(i + j)
    for i in range(N):
        print(i)
    a += 1

## Сложность O(log N) - Логарифмическая сложность

**Бинарный поиск**

![binary_search](https://habrastorage.org/r/w1560/getpro/habr/post_images/d99/286/22b/d9928622b0685e9fa1e77ce4d9117694.png)

In [None]:
def binary_search(arr, target):
    left = 0
    right = len(arr) - 1

    while left <= right:
        mid = (left + right) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1

    return -1

## Сложность O(N * log N) - Линейно-логарифмическая сложность

- Сортировки
- Алгоритмы Дейкстра и Краскала

Рассмотри подробнее позже

## Сложность O(K^N) - Экспоненциальная сложность

- $O(2^N)$

Применяется, когда есть N значений, каждое из которых может принимать K значений и необходимо перебрать все варианты

In [None]:
def make_bit_set(N):
  bit_set = []

  tmp_list = ["0"] * N
  def make_value(pos):
    if pos == N:
      bit_set.append(''.join(tmp_list));
      return
    tmp_list[pos] = "0"
    make_value(pos + 1)
    tmp_list[pos] = "1"
    make_value(pos + 1)

  make_value(0)

  return bit_set

In [None]:
make_bit_set(1)

['0', '1']

In [None]:
make_bit_set(2)

['00', '01', '10', '11']

In [None]:
make_bit_set(3)

['000', '001', '010', '011', '100', '101', '110', '111']

In [None]:
make_bit_set(4)

['0000',
 '0001',
 '0010',
 '0011',
 '0100',
 '0101',
 '0110',
 '0111',
 '1000',
 '1001',
 '1010',
 '1011',
 '1100',
 '1101',
 '1110',
 '1111']

## Сложность O(N!) - Факториальная сложность

In [None]:
def fact_func(n):
  for i in range(n):
    fact_func(n-1)

# Линейные структуры данных

## Массивы и списки

### Массивы

- Хранятся в памяти вместе, в соседних ячейках
  - Благодаря этому можно быстро получать доступ к данным
- Имеют фиксированный размер
  - При необходимости добавить/удалить элемент, необходимо пересоздавать массив
- Объекты должны быть однородными, только одного класса

Есть модуль [array](https://docs.python.org/3/library/array.html), но будем пользоваться массивами из numpy, т.к они более функциональны

![direct_access_arrays](https://static.javatpoint.com/ds/images/ds-array2.png)

In [None]:
import numpy as np

arr = np.array([1, 2, 3, 4, 5])

arr

array([1, 2, 3, 4, 5])

Однако в numpy можно указать разнородные данные, но тогда numpy будет их "подгонять" под некоторый общий тип

In [None]:
arr2 = np.array([1, "2", True])

arr2

array(['1', '2', 'True'], dtype='<U21')

In [None]:
if arr[2] == True:
  print("Always has been!")

Но можно создавать массивы объектов, правда numpy нужно явно указывать что это будут за объекты

[Документация по типам](https://numpy.org/doc/stable/reference/arrays.dtypes.html)

In [None]:
custom_dtype = np.dtype([
    ("name", 'U64'),
    ("points", np.int_),
    ("banned", np.bool_),
])

players = np.array([
    ("Петя", 10, False),
    ("Петя_читер", 199999, True),
], dtype=custom_dtype)

players

array([('Петя',     10, False), ('Петя_читер', 199999,  True)],
      dtype=[('name', '<U64'), ('points', '<i8'), ('banned', '?')])

In [None]:
if players[-1][2]:
  print("Ты забанен! Я не буду тебя разбанивать!")

if players[0][1] > 5:
  name = players[0][0]
  print(f"Ого, {name} набрал так много очков")

Ты забанен! Я не буду тебя разбанивать!
Ого, Петя набрал так много очков


In [None]:
players.shape

(2,)

In [None]:
def find_cheater(players_arr):
  n = players_arr.shape[0]
  for i in range(n):
    player = players_arr[i]
    name, points, banned = player
    if banned:
      return player

  return None


In [None]:
find_cheater(players)

('Петя_читер', 199999, True)

Какая сложность, если хотим добавить/удалить значение?


**Добавление**
- Создаем массив длины + 1
- Добавлем туда все элементы **до** того места, куда нужно вставить значение
- Добавляем туда новый элемент
- Добавлем туда все элементы **после** того места, куда нужно вставить значение

In [None]:
np.empty(players.shape, dtype=players.dtype)

array([('', 0, False), ('', 0, False)],
      dtype=[('name', '<U64'), ('points', '<i8'), ('banned', '?')])

In [None]:
from copy import deepcopy

In [None]:
def add_to_beginning(player, players_arr):
  n = players_arr.shape[0]
  new_shape = (n + 1,)
  new_arr = np.empty(new_shape, dtype=players_arr.dtype)

  new_arr[0] = deepcopy(player)
  for i in range(n):
    new_arr[i + 1] = deepcopy(players_arr[i])


  return new_arr

In [None]:
begin_players = add_to_beginning((
    "Аня", 9999, False
), players)

begin_players

array([('Аня',   9999, False), ('Петя',     10, False),
       ('Петя_читер', 199999,  True)],
      dtype=[('name', '<U64'), ('points', '<i8'), ('banned', '?')])

#### Чекпоинт 1

Реализуйте функцию добавления в конец массива

In [None]:
def add_to_end(player, players_arr):
  pass

In [None]:
end_players = add_to_end((
    "vItAlII", -1, True
), begin_players)

end_players

array([('Аня',   9999, False), ('Петя',     10, False),
       ('Петя_читер', 199999,  True), ('vItAlII',     -1,  True)],
      dtype=[('name', '<U64'), ('points', '<i8'), ('banned', '?')])

Реализуйте функцию добавления в середину массива (после элемента на месте k)

In [None]:
def add_to_middle(player, k, players_arr):
  pass

In [None]:
new_player = (
    "12321", 1, False
)

add_to_middle(new_player, 4, end_players)

array([('Аня',   9999, False), ('Петя',     10, False),
       ('Петя_читер', 199999,  True), ('vItAlII',     -1,  True),
       ('12321',      1, False)],
      dtype=[('name', '<U64'), ('points', '<i8'), ('banned', '?')])

Удаление делается по аналогии

**Поиск по индексу** - $ O(1)$\
**Добавление/Удаление**: $O(N)$

### Списки

- Хранятся в памяти в разных ячейках, в случайных местах
- Объекты могут быть разнородными
- Храним ссылку на начало списка и работаем с ней

![](https://media.geeksforgeeks.org/wp-content/uploads/20220816144425/LLdrawio.png)

**Секрет Полишинеля**\
Все это время мы пользовались списками, а не массивами\
![](https://i.gifer.com/origin/37/376be8c2f7237f730fa5f936fec83e58_w200.gif)

Попробуем сделать list с нуля\
Начнем с класса для ячейки списка

In [None]:
import dataclasses
from __future__ import annotations

@dataclasses.dataclass
class NodeItem:
  data: int
  next: NodeItem | None

Можно сделать не только int, а все что угодно при помощи [generics](https://docs.python.org/3/library/typing.html#generics)

In [None]:
list_head = NodeItem(1, None)

list_head

NodeItem(data=1, next=None)

Сделаем функцию поиска значения по индексу

In [None]:
def find_by_list_index(idx: int):
  elem = list_head
  for i in range(idx):
    elem = elem.next
  return elem

In [None]:
find_by_list_index(0)

NodeItem(data=1, next=None)

Сделаем функцию добавления элемента в начало

In [None]:
def add_data_to_list(data: int):
  global list_head
  node = NodeItem(data=data, next=list_head)
  list_head = node

In [None]:
add_data_to_list(2)

list_head

NodeItem(data=2, next=NodeItem(data=1, next=None))

In [None]:
find_by_list_index(0)

NodeItem(data=2, next=NodeItem(data=1, next=None))

In [None]:
find_by_list_index(1)

NodeItem(data=1, next=None)

In [None]:
add_data_to_list(3)

list_head

NodeItem(data=3, next=NodeItem(data=2, next=NodeItem(data=1, next=None)))

#### Чекпоинт 2

Реализуйте функцию, возвращающую длину списка

In [None]:
def custom_len(list_head):
  pass

In [None]:
custom_len(list_head)

3

Реализуйте функцию добавления в середину (после idx)

P.S. пользоваться тем что сделали раньше - хорошо

In [None]:
def insert(idx: int, data: int):
    pass

In [None]:
insert(1, 15)

list_head

NodeItem(data=3, next=NodeItem(data=2, next=NodeItem(data=15, next=NodeItem(data=1, next=None))))

Реализуйте функцию удаления

In [None]:
def delete(idx: int):
  pass

In [None]:
delete(1)

list_head

NodeItem(data=3, next=NodeItem(data=15, next=NodeItem(data=1, next=None)))

#### Чекпоинт 3

Соберем все в один класс

In [None]:
class CustomList:
  def __init__(self):
    self.head: NodeItem | None = None

  def __len__(self):
    pass

  def __getitem__(self, idx: int):
    pass

  def insert(self, idx: int, data: int):
    pass

  def push(self, data: int):
    pass


  def delete(self, idx: int):
    pass

  def __repr__(self):
    if self.head is not None:
      return self.head.__repr__()
    return "()"

In [None]:
my_list = CustomList()

my_list.insert(0, 1)

NodeItem(data=1, next=None)

In [None]:
len(my_list)

2

In [None]:
my_list.push(1)

NodeItem(data=1, next=NodeItem(data=1, next=NodeItem(data=1, next=None)))

In [None]:
len(my_list)

3

In [None]:
my_list[0]

NodeItem(data=1, next=NodeItem(data=1, next=NodeItem(data=1, next=None)))

In [None]:
res = my_list[-1]

print(res)

NodeItem(data=1, next=None)


In [None]:
res = my_list[1]

print(res)

NodeItem(data=1, next=None)


In [None]:
my_list.push(5)

NodeItem(data=1, next=NodeItem(data=1, next=NodeItem(data=5, next=None)))

In [None]:
my_list

NodeItem(data=1, next=NodeItem(data=1, next=NodeItem(data=5, next=None)))

In [None]:
my_list.insert(1, 3)

NodeItem(data=1, next=NodeItem(data=3, next=NodeItem(data=1, next=NodeItem(data=5, next=None))))

In [None]:
my_list.delete(1)

NodeItem(data=1, next=NodeItem(data=1, next=NodeItem(data=5, next=None)))