In [None]:
import numpy
import pandas

# Искуственный интеллект

**Слабый искусственный интеллект** - который реализует ограниченную задачу.
**Сильный искусственный интеллект** - способен достичь и превзойти человека.**Интеллектуальная система** — система, решающая одну или несколько
задач искусственного интеллекта.
**Экспертная система** — интеллектуальная система, построенная на
основе фактов и правил, извлекаемых из экспертов.

## Отличие экспертной системы от машинного обучения

* Экспертная система: строится от общего к частному. Система машинного обучения: строится от частного к общему. (Пример, перевод с одного языка на другой)
* Экспертная система требует привлечения эксперта (лингвиста) и
формализации правил перевода. Машинное обучение требует набор данных с множеством текстов.

# Машинное обучение

* Наука о данных: задачи машинного обучения задаются набором данных $D$ и функцией качества (выигрыша, правдоподобия) $Q$, либо функцией ошибки (риска, потери) $L$.
* Алгоритм «учится» решать задачу, если он максимизирует $Q_D$ или минимизирует $L_D$ — **эмпирический риск**.

**Задача оптимизации**  $L(\Theta) \rightarrow min$.
**Задача машинного обучения** $L_D(θ) = \sum_{x \in D} L(x, \Theta) → min$.

![params](Pics\params.png)

**Безмодельные алгоритмы («in-place»)** — решают задачу без явного
построения модели.
**Моделирующие алгоритмы** — строят модель, которую можно применить
к новым данным, не обучая ничего заново.
**Алгоритмы онлайн обучения** — имеют возможность обновить модель на
новых данных.
Возможность объединить две модели.

**Валидация** — это способ вычислить $L(A, D)$ из $L_D(a_θ)$.
**Тестирование $a_θ$ на множестве $D$** — вычисление $L_D(a_θ)$ из $L(\bar{y}, y)$.
**Применение** (вывод, inference) — вычисление $a_θ(x)$.

# Представление данных

Представляется обычно при помощи таблички. В строках стоит объект, в столбцах признак/функция...

## Базовые типы

![base_types](Pics/base_types.png)

**Категория**
* Конечное число элементов как у Enum. Заранее известны все значения.
* Над элементами нет отношения порядка как у Enum.
* Можно проверить на равенство.
* Принято сопоставлять каждому значению целое или натуральное число (аналог ordinal), но эти числа используется только для удобства хранения и операций над категориями (аналог hashCode).
* Обычно используют числа: $[0; . . . ; k − 1]$ или $[1; . . . ; k]$.

**Порядковый тип**
* Что-то среднее между категорией и числом: дискретный,
но над элементами есть порядок, и число элементов может
меняться.
* Во внешнем мире называется «категорией».
* Не популярен.

## Нормализация

### Мотивация

* Признаки с большей дисперсией могут больше влиять на результат.
* Численные признаки имеют единицы измерения: [кг], [м], [с] и т.д.
Для удобства хранения единицы измерения отбрасываются.
* Устранение единиц измерения необходимый, но не достаточный шаг.
* Так как от изменения единиц изменений скрытая зависимость в данных не изменяется, алгоритм должен быть статистически инвариантен к линейным преобразованиям над признаками.

### Методы

#### Minmax

$x_{new} = \frac{x_{old} - \min(x)}{\max(x) - min(x)}$

После нормализации $\min(x_{new}) = 0; \max(x_{new}) = 1$

#### Стандартизация

$x_{new} = \frac{x_{old} - E(x)}{\sqrt{D(x)}}$

После нормализации $E(x_{new}) = 0; D(x_{new}) = 1$

## Веса

![weights](Pics/weights.png)

# Базовые задачи машинного обучения

![tasks](Pics/tasks.png)

## Обучение с учителем

**Задача классификации**:
* Задача обучения с учителем, в которой типом целевого признака $Y$ является
категория. Этот признак называется: классом, меткой класса, label, типом.
* Наивное решение $a(x) = Mode[Y]$ (чаще всего встретившиеся значение).

**Задача мягкой классификации**:
* Для объекта $x$ алгоритм предсказывает массив чисел $(p_1, . . . p_k)$, где $p_c$ —  уверенность в том, что $x$ принадлежит классу $c$, а $k$ — число классов.
* Алгоритм обучается решать обычную задачу классификации.

**Задача вероятностной классификации**:
* Уверенность заменяется на вероятность, не стоит их путать

**Задача востановления регрессии**:
* По $n$ последним вычисляем $n-1$

![teacher](Pics/teacher.png)

### One-class classification

**Поиск аномалий**:
* Почти все объекты в тренировочном множестве принадлежат одному классу.
* Даже если есть объекты другого класса, неизвестно какие именно объекты.
*Задачи*:
* Поиск аномалий: найти объекты другого класса среди существующих.
Используется безмодельный алгоритм.
* Поиск новизны: найти объекты другого класса среди новых. Используется
обучение модели.

**Задача восстановления плотности**:
* Даны объекты, про которые известно, что они были получены из одного
распределения.
* Требуется восстановить плотность распределении для новых объектов.
* Если будет выходить из доверительного интервала - аномалия

**Задача генерации (синтеза) новых объектов**:
* По заданному множеству объектов сгенерировать новые.
*Оценка качества*
* Сохранение статистик реальных объектов.
* Сведение к классификации на два класса: реальный или сгенерированный.
* Экспертная оценка людьми (асессорами).

## Обучение без учителя

Задача машинного обучения, в которой тренировочная выборка не содержит
целевых признаков. Алгоритму требуется самому придумать новые признаки
$Y$ на основе существующих $X$.

**Задача класстеризации**:
* Помним/любим/скорбим
* Ошибка проверяется внутренними средствами

**Задача выделения признаков**:
* Алгоритм должен обучиться отображать объект из $X$ в пространство
числовых признаков $Y$ , которое он сам и придумает.
*Примеры функций ошибок/качества*
* Внешние: внутренние для задачи кластеризации.
* Внутренние: ошибка восстановления объекта в оригинальное пространство. $x \rightarrow y \rightarrow x$ получился тот же $x$?