# Организационные моменты

[Ссылка на лекции](https://drive.google.com/drive/folders/1cO6Lw62jSwQzYJW3PC4VLe3UOKx0-HKC)

### Общее
Взаимодействие в RocketChat

Кто не записался на онлайн-курс, записаться:

https://e.moevm.info/enrol/index.php?id=45

### Лабки
* На каждую лабу по 3 пары
* Допуск на защиту - Pull Request
* Обязательное условие -- декомпозиция программы
* В Moodle заливаем всё пеленой, сдаём красиво и по файлам
* Unit-тестрование кода

### Защита
Пользоваться только документацией и презентациями с лекций (IDE, в целом, можно)

### Отчет 
НАДО!!!!

Всё написано на сайте и в самих лабах

### Курсач
Инфа будет позже

# Сложность алгоритма
---

* Временная
* Пространственная

Асимптотическая оценка описывает поведение алгоритма при $N \to \infty$

Виды оценок:
1. $Θ$ - оценка сверху и снизу
2. $O$ - оценка только сверху
3. $Ω$ - оценка только снизу

Сложность:

$O(1)$

$O(\log n)$ $O(n)$ 

$O(n \log n)$

$O(n^2)$

$O(2^n)$

### Методы амортизационного анализа:
* Агрегирующий (усреднение)
> Делим сложность на количество
* Метод предоплаты (метод бух. учета)
> Каждой операции присваемаем амортизированную стоимость. В итоге за дорогие операции мы платим заранее частями, создавая избыток сложности на простых операциях.

* Метод потенциалов
> Потенциал $\Phi$ предсталяет собой ту стоимость дорогостоящих операций, которая была отложена с более простых операций. (Чуть более намудренный метод предоплаты)

  > Амортизированная стоимость = Реальная стоимость + $\Delta\Phi$

С помощью амортизационного анализа можно доказать, что, к примеру, вставка в динамический массив не зависит от расширения границ за $O(N)$, поскольку у нас используется очень много операций по $O(1)$, а расширение происходит достаточно редко



# Структуры данных
---


***Структура данных*** определяет расположение данных в памяти

***Абстрактный тип данных*** предоставляет интерфейс для взаимодействия с данными, а релизация может быть разной

---
#### Массив

|  | Вставка | Удаление |
--|--|--
| Начало |$O(n)$ | $O(n)$ |
| Середина|$O(n)$|$O(n)$ |
| Конец| $O(1)$| $O(1)$|\\

#### Односвязный список

|  | Вставка | Удаление |
--|--|--
| Начало |$O(1)$ | $O(1)$ |
| Середина|$O(n)$|$O(n)$ |
| Конец| $O(n)$ или $O(1)$| $O(n)$

#### Двусвязный список

|  | Вставка | Удаление |
--|--|--
| Начало |$O(1)$ | $O(1)$ |
| Середина|$O(n)$|$O(n)$ |
| Конец| $O(n)$ или $O(1)$| $O(n)$ или $O(1)$ |

#### Циклический связный список

|  | Вставка | Удаление |
--|--|--
| Начало |$O(1)$ | $O(1)$ |
| Середина|$O(n)$| $O(n)$ |
| Конец| $O(1)$| $O(1)$ |

#### Развернутый связный список
* Представляет из себя связный список из массивов. В каждой ноде хранится количество элементов в содержащемся массиве.
* Имеет такую же асимптотику, как связный список, но работает быстрее
* В среднем тратим такое же количество памяти, как в связном списке

|  | Вставка | Удаление | 
--|--|--
| Начало |$O(1)$ | $O(1)$ | 
| Середина|$O(n)$|$O(n)$ |
| Конец| $O(n)$ или $O(1)$| $O(n)$ или $O(1)$ |
### Абстрактные типы данных:
#### Стек
* LIFO
* Стандартные операции:
  * Вставка в конец
  * Доступ и удаление из конца
* Сложность стандартных операций $O(1)$
####  Очередь
* FIFO
* Стандартные операции:
  * Вставка в конец
  * Доступ и удаление из начала 
* Сложность стандартных операций $O(1)$
#### Дек
* Двусторонний стек или двустороняя очередь
* Амортизированная сложноть операций - $O(1)$

# Сортировки

## Сортировка подсчетом
$O(N + k)$ по времени и по памяти

$N$ - количество элементов

$k$ - количество разнообразных элементов


## Сортировка вставками
#### Время
В лучшем случае:
$O(n)$

В среднем и худшем:
$O(n^2)$

#### Память
in-place

Устойчивая

## Сортировка Шелла
Усовершенствованный вариант сортировки вставками, основанный на идее предварительной сортировке элементов, отстоящих друг от друга на некотором расстоянии $h_i$
#### Сложность
(Зависит от последовательности)
|Тип||Время|
|-|-|-|
|По Шеллу | $N/2, N/4, \dots 1$| $O(N^2)$|
|По Хиббарду |все $2^i - 1 \leq N$ | $O(N^{3/2})$|
|По Пратту |$2^{i}*3^{j}\leq N/2$| $O(N \log^2 N)$|

## Сортировка слиянием
#### Время
$O(N \log N)$

#### Память
$O(N)$

Устойчивая

## Быстрая сортировка
#### Время
Средний и лучший случай $(N \log N)$

Худший случай $N^2$

#### Память
$O(N)$ (в оптимизации $O(\log N)$) 

Не устойчивая

## Цифровая сортировка (radix sort)
Сортировка по разрядам

### LSD - от младших разрядов к старшим

#### Время 
$O(m*T(N))$. 

$O(m*(N+k))$ - при CountSort 

#### Память 
$O(T(N))$

$m$ - количество разрядов

$k$ - основание системы счисления

$T(N)$ - сложность устойчивой сортировки

Устойчивая

### MSD - от старших разоядов к младшим
#### Время

$O(Nk)$ - худший случай 

$\Omega(N \log_b N)$ - лучший

#### Память
$O(N+k)$

$b$ - количество частей, на которое делим

Не устойчивая

## Timsort
- гибридный алгоритм сортировки, сочетающий различные подходы.

На массивах данных, которые содержат упорядоченные подмассивы, данный алгоритм показывает себя намного лучше других сортировок.

1. Входной массив разбиваем на подмассивы фикс длины, вычисляемой определенным образом 
2. Каждый массив сортируем вставками, пузырьком или любой другой устойчивой сортировкой
3. Слияние подмассивов
   * Создается стек блоков
   * В стек добавляется текущий блок
   * Если в стеке есть хотя бы 2 блока, то проверяются инварианты:
     - Z > X + Y (если в стеке есть хотя бы 3 блока)
     - Y > X

    > где X, Y, Z - размеры 1-го, 2-го и 3-го блока в стеке соответственно
    * если хотя бы одно условие не выполняется, то блок Y сливается с наименшьшим из X и Y (либо с X,, если блока всего 2)
    * Данный шаг выполняется, пока не будут выполнены инварианты (либо станет меньше 2-х блоков)
4. Переход к шагу `2`


`n` - размер входного массива

`run` - подмассив во входном массиве, который обязан быть упорядочен:
- строго по убыванию $a_i > a_{i+1}>\dots$
- нестрого по возрастанию $a_i \leq a_{i+1}\leq\dots$

`minrun` - минимальный размер подмассива

оптимальный `n/minrun` - степень двойки

Автором алгоритма выбран оптимальный minrun $[32;65)$

Если $n < 64$, то Timsort превращается в сортировку вставками


### Оптимизация
* Галоп
Если 7 элементов подряд из блока A, то делаем предположение, что дальше так и будет. Поэтому ищем дальше по бинарному поиску
* 


#### Время
Худщий и средний $O(N\log N)$

Лучший $O(N)$

#### Память
$O(N)$