In [1]:
%pylab inline
import seaborn as sns

Populating the interactive namespace from numpy and matplotlib


# Алгоритмы

## План лекции
1. Алгоритм как совокупность операций
1. Массивы
1. Случайные числа
1. Планирование экспериментов

![](algo.png)

## Итеративный алгоритм

- операция повторяется многократно
- условие прекращения 

Вложенные итерации увеличивают число операций кратно.

## Жадный алгоритм

перебор всех вариантов по очереди от начала до конца.

<b class=tag>Greedy algorythm</b>

### Условия начала и конца

Вариант - очередь в реальном времени:
- заканчиваются данные, но потом снова появляются.


Потоки данных: входящий и выходящий
вход и выход
труба к трубе (pipeline)

<b class=tag>конвеер</b>

## FIFO, LIFO

![](fifolifo.png)

труба, стопка

## Конечный массив

есть начало, конец, размер.

### Виды массивов в Python
- list
- numpy.array
- pandas.DataFrame, pandas.Series

### Линейная алгебра (ЛА)

*Матрица* $A_{m,n}$ - набор чисел в ячейках размером $m$ на $n$

Если $m==1$ или $n==1$, то такая матрица называется *вектор*.

Если $m==1$ **и** $n==1$, то такая матрица называется *скаляр* (скалярная величина, обычное единичное число).

Специальная операция - cкалярное произведение (перемножение матриц, dot-product)

Матрицы можно только умножать.
Вместо деления - инверсия.

$$\frac{B}{A} = A^{-1}B $$



Умножение на диагональную матрицу - растяжение (stretching, scaling)

Умножение на ортонормальную (unitary) матрицу - вращение (rotating)

SVD-разложение: $U, \Sigma, V$ - вращение, растяжение, вращение

- для обратного вращения - транспорнированная матрица вращения $U^T$

- для обратного растяжения - инвертированная матрица весов $\Sigma^{-1}$

Согласование размерностей

![](numpy_broadcasting.png)

### Геометрическая интерпретация

Вектор (строчка матрицы) - это координаты конца стрелочки (arrow head), если начало вектора (хвостик, tail) при этом в нулевой точке. Но, если сместить вектор в пространстве, не меняя направления, то это тот же вектор, значит числа отражают разницу между концом и началом вдоль осей координат.

Размер вектора ( длина, расстояние между началом и концом) вычисляют по теореме Пифагора (для 2-мерного пространства L2-norm)

$$ L = |X|_p = \left(\sum{x_i^p}\right)^{1/p}, p=2$$

### Интервалы

- открытые
- закрытые
- полуоткрытые

используются при индексации массивов

### Индексация массивов полуоткрытая

- по-умолчанию от 0
- разность конца и начала = размеру подмассива
- логичное определение пустых интервалов `v[0:0]`


# EM-алгоритм

На каждой итерации проводится два шага:

### E - evalution
Оценка текущего состояния

### M - maximisation 
Максимизация параметров. Т.е. "подгонка" модели под текущую выборку объектов. Например, путем минимизации ошибки.

![](emalg.png) 
 
Иллюстрация применения ЕМ-алгоритма для разделения смеси нормальных распределений
с двумя компонентами. На рис. а показана исходная выборка и начальное приближение для двух
компонент. На рис. b показан результат Е шага. При этом цвета объектов соответствуют значениям
γ nk . На рис. c-f показаны результаты вычислений после 1, 2, 5 и 20 итераций.

Варианты ЕМ-алгоритма:
- K-means
- Фильтр Кальмана
- Алгоритмы оптимизации

### Приведение к нахождению минимума

- функция потерь (loss function)
- минимизация 

если потери = 0, то идеальное решение, иначе оптимальное.

Алгоритмы

Жесткие | Нежесткие
-|-
однозначная траектория | приблизительная траектория
перебор всех вариантов | неполный случайный выбор вариантов
скорость предопределена | скорость в пределах от и до
решение гарантировано | лучше усреднить несколько проходов

## Случайные числа

In [12]:
rand()

0.26058434996981117

## ГСЧ

In [57]:
seed()
rand(), rand(), rand(), rand()

(0.9982953629878466,
 0.6796555704280653,
 0.4358626575970751,
 0.9590666209451498)

[Визуализация алгоритмов](https://bost.ocks.org/mike/algorithms/)

## Динамическое программирование

Подход к решению задач, при котором есть перекрытие между подзадачами и исходной задачей, т.е. они замыкаются друг на друга (рекурсия). Процесс решения включает этапы:
1. Выделение фрагментов задачи.
2. Разбор примитивных случаев с простыми решениями (с конца).
3. Запоминание вариантов решений в таблицу или задание порядка пересчета.
4. Подбор пошаговых решений из таблицы или переформулирование сложной задачи в виде рекурсивной последовательности более простых подзадач.

## Планирование экспериментов

### +++

[Почему индексация от 0](http://gestaltrevision.be/wiki/python/zerobased)