# Общие понятия ML

## Искусственный интеллект, машинное обучение и глубокое обучение

### Искусственный интеллект

> **Искусственный интеллект (Artificial Intelligence, ИИ)** — \
это способность компьютерной системы имитировать когнитивные функции человека, \
такие как обучение и решение задач. \
ИИ позволяет компьютеру моделировать рассуждения людей для получения новых сведений \
и принятия решений (например, выдавать кредит заёмщику или нет).

Искусственный интеллект — это комплексная наука, \
находящаяся на стыке математики, биологии, психологии, логики и многих других дисциплин.

**Цель** этой науки — понять, как устроен мозг человека и научиться моделировать его работу с помощью компьютера. 

Существует два типа искусственного интеллекта:

#### Слабый ИИ (Weak AI)

Слабый ИИ способен решать только одну задачу. \
Зачастую он справляется с ней даже лучше, чем человек. \
В качестве примера слабого ИИ можно назвать [Deep Blue](https://www.ibm.com/ibm/history/ibm100/us/en/icons/deepblue/). \
Это компьютерная программа, которая обыграла Гарри Каспарова в шахматы ещё в 1996 году. \
Но Deep Blue не умеет делать ничего другого и никогда этому не научится.

Слабый ИИ используют в медицине, логистике, банковском деле, бизнесе.

#### Сильный ИИ (Strong AI)

Сильный искусственный интеллект пока остаётся мечтой.

> Это интеллект, который решает множество задач и умеет обучаться для решения других. \
Сильный ИИ осознаёт себя и своё существование.

В нашей реальности ближе всего к Strong AI находятся чат-боты и виртуальные ассистенты, \
которые имитируют человеческое общение. \
Ключевое слово здесь — имитируют. \
Siri или Алиса не думают и неспособны принимать решения в ситуациях, которым их не обучили.

В области искусственного интеллекта есть несколько подразделов:

- робототехника (Robotics),
- компьютерное зрение (Computer Vision),
- обработка естественного языка (Natural Language Processing),
- машинное обучение (Machine Learning).

Это такое разделение довольно условно и ни одна из приведённых областей не исключает другую.

### Машинное обучение

> **Машинное обучение (Machine Learning)** — это один из разделов науки об искусственном интеллекте. \
Машинное обучение заключается в построении моделей с помощью поиска закономерностей в данных \
и использовании их для того, чтобы спрогнозировать характеристики новых данных.

### Глубокое обучение

> **Глубокое обучение (Deep Learning)** — подраздел машинного обучения. \
Глубокое обучение основано на изучении и применении в качестве инструмента для решения задач **искусственных нейронных сетей**. \
Данные алгоритмы основаны на имитации работы человеческого мозга.

## Виды машинного обучения, типы задач и некоторые алгоритмы их решений

Схематически виды машинного обучения, типы задач и алгоритмы их решений можно представить следующим образом.

- Машинное обучение
    - Обучение с учителем (данные размечены)
        - Предсказать число (регрессия)
            - [Линейная регрессия (Linear Regression)](./linear_regression.ipynb)
            - [Полиномиальная регрессия (Polinomial Regression)](./polynomial_regression.ipynb)
            - Прогнозирование 
                - ARIMA
                - SARIMA (модификация ARIMA)
                - ARCH (модель для финансовых временных рядов)
        - Предсказать класс (классификация)
            - [Logistic Regression (логистическая регрессия)](./logistic_regression.ipynb)
            - [Decision Tree (деревья решений)](./decision_trees.ipynb)
            - [Rundom Forest (cлучайный лес)](./random_forest.ipynb)
            - Native Bayes (наивный байесовский классификатор)
            - kNN (метод ближайших соседей)
            - SVM (метод опорных векторов)
    - Обучение без учителя (данные не размечены)
        - Разделить на группы (кластеризация)
            - Методы кластеризации при известном заранее количестве кластеров:
                - [k-means (метод k-средних)](./k_means.ipynb)
                - Agglomerative (агломеративная кластеризация)
                - EM-алгоритм
            - Метод, который сам может определить количество кластеров
                - DBSCAN
        - Обобщить данные (понижение размерности)
            - PCA - Principal Component Analysis (метод главных компонент)
            - SVD (сингулярное разложение)
            - LDA (латентное размещение Дирихле)
            - LSA (латентный семантический анализ)
            - t-SNE
        - Выявить последовательности (ассоциация)
            - Apriori
            - Eclat
            - FP Growth
    - Обучение с подкреплением (взаимодействие со средой)        
        - Q-Learning (основан на [уравнении Беллмана](https://habr.com/ru/articles/443240/))
        - Deep Q-Learning
        - Генетический алгоритм
        - SARSA

### Обучение с учителем

#### Задача регрессии

> **Задача регрессии (regression)** — это задача, в которой необходимо \
предсказать вещественное число на основе признаков в наборе данных. \
То есть задача сводится к предсказанию целевого признака, который является числовым.

**Цель обучения** — построить модель, которая отражала бы \
зависимость между признаками и целевой числовой переменной.

> **Прогнозирование (forecasting)** — это задача регрессии, \
в которой мы пытаемся предсказать будущее поведение временного ряда, \
то есть целевая переменная является числовой и зависит от времени. \
Причём каждому моменту времени соответствует одно конкретное значение. \
Можно сказать, что прогнозирование — это частный случай регрессии.

Примеры таких задач: 
- прогнозирование стоимости ценной бумаги в будущем, 
- ожидаемого дохода магазина на следующий месяц, 
- курса валюты на следующую неделю, 
- выработки электроэнергии на солнечных батареях на следующий месяц.

#### Задача классификации

> **Задача классификации (classification)** — задача, в которой необходимо предсказать класс объекта на основе признаков в наборе данных. \
То есть задача сводится к предсказанию целевого признака, который является категориальным.

**Цель обучения** — построить модель, которая на основе признаков \
разделяет объекты на классы наилучшим образом.

### Обучение без учителя

#### Задача кластеризации

> **Задача кластеризации (clustering)** — это задача, \
в которой мы разделяем данные на группы на основе признаков в данных.

**Цель обучения** — построить модель, которая наилучшим образом объединит «похожие» объекты в группы.

Примеры использования кластеризации: 
- сегментация рынка на категории, 
- объединение близких точек на карте, 
- разделение клиентов по уровню платёжеспособности, 
- кластеризация студентов по их интересам или обучаемости, 
- анализ и разметка новых данных.

С помощью методов **кластеризации** мы можем разделить наши объекты на группы (кластеры) \
и попытаться проанализировать эти группы.

#### Задача понижения размерности

> **Понижение размерности (dimensionality reduction)** — \
задача, в которой мы пытаемся уменьшить количество признаков, характеризующих объект. \
Обычно количество признаков уменьшается до 2-3 чтобы получить возможность визуализировать данные.

**Цель обучения** — построить модель, которая переводит пространство признаков из размерности $n$ \
в размерность $m \ (m<n)$, при этом сохранив наибольший объём информации. \
Математически это записывается как $a: X^{n} \rightarrow X^{m}$.

Практическая польза этих методов состоит в следующем

- Можно объединить несколько признаков в один и получить абстракцию.\
(Например, собаки с треугольными ушами, длинными носами и большими хвостами объединяются в абстракцию «овчарки».)
- Увеличение скорости обучения модели за счет уменьшения количества признаков.\
(При этом точность моделей может сильно упасть, поэтому необходимо находить баланс.)
- Избавляемся от мультиколлинеарности признаков.\
Методы понижения размерности устроены так, что в первую очередь объединяют между собой наиболее коррелированные признаки.

Примеры использования методов понижения размерности: 
- визуализация, 
- рекомендательные системы, 
- определение тематик и поиск похожих между собой документов, 
- анализ фейковых изображений.

#### Задача ассоциации

> **Ассоциация (association)** — это задача, в которой необходимо найти правила и законы, \
по которым существует последовательность действий.

Примеры использования: 
- анализ товаров, покупаемых вместе, 
- расстановка товаров на полках, 
- анализ паттернов поведения на веб-сайтах.
- прогноз акций и распродаж, 

Методы **ассоциации** помогают находить закономерности в последовательных действиях.

### Обучение с подкреплением

> **Обучение с подкреплением** решает задачу взаимодействия со средой и «выживания» в ней.

Средой может быть видеоигра (в такой искусственной среде выживают встроенные в игру персонажи).\
Или реальный мир (с ним взаимодействуют например роботы-пылесосы или беспилотные летательные аппараты).

> Объект, который взаимодействует со средой (например, играет в игру), называется **агентом**.

Агент может получать от среды полные или частичные наблюдения о её состоянии. \
Он может выполнять действия согласно своим наблюдениям. \
По мере совершения действий агент может получить в ответ награду от среды.

Данные о среде могут быть полезны агенту, но они не являются главным фактором обучения. \
Неважно, сколько данных соберёт агент, — у него всё равно не получится предусмотреть все возможные ситуации.

Поэтому **цель обучения** — не рассчитать все ходы, а построить оптимальную стратегию \
для взаимодействия со средой и максимизировать финальную награду.

#### Q-learning

> В Q-learning рассматриваются все состояния, в которых может находиться агент, \
и все возможные переходы из одного состояния в другое, которые определяются действиями.

**Q-learning** — основан на [уравнении Беллмана](https://habr.com/ru/articles/443240/).

> Уравнение Беллмана помогает определить следующее оптимальное действие, такое, \
что значение Q-функции для определённой пары состояние-действие будет максимальной.

**Цель Q-learning** — приближённо найти (аппроксимировать) Q-функцию, \
которая ответит на вопрос, как нужно правильно действовать, чтобы получить максимум награды.

Если возможных вариантов состояние-действие очень много, тогда привлекаются нейронные сети, \
и такое обучение носит название **Deep Q-Network (DQN)**.

На идеях **Q-learning** основаны и другие алгоритмы, например алгоритм **SARSA**. \
Подробнее об алгоритмах можно почитать [здесь](https://habr.com/ru/articles/561746/).

#### Генетический алгоритм

Идея **генетичесих алгоритмов** отличается от идей Q-learning и состоит в следующем: \
мы бросаем множество агентов в среду и заставляем их идти к цели. \
Затем мы выбираем лучших из них — тех, кто прошёл дальше всех, \
скрещиваем, добавляем мутации и бросаем в среду ещё раз. \
Такие манипуляции мы проделываем огромное количество раз. \
В итоге по законам эволюции должно получиться разумное существо. \
Главный вопрос — сколько времени на это может понадобиться.

[Визуализация работы генетического алгоритма](https://rednuht.org/genetic_walkers/).

> Как выяснилось на практике, генетические алгоритмы значительно уступают в скорости обучения \
методам Q-learning и их производным, поэтому они используются всё реже.