## Введение в машинное обучение

Data Science состоит из трёх частей:
* Data Engineering (инженерия данных);
* Data Analytics (анализ данных);
* Machine Learning (машинное обучение)

![image.png](attachment:image.png)

**Искусственный интеллект** (Artificial Intelligence, ИИ) — это способность компьютерной системы имитировать когнитивные функции человека, такие как обучение и решение задач. ИИ позволяет компьютеру моделировать рассуждения людей для получения новых сведений и принятия решений (например, выдавать кредит заёмщику или нет):
* **Слабый ИИ** способен решать только одну задачу;
* **Сильный ИИ** пока остаётся мечтой. Это интеллект, которые решает множество задач и умеет обучаться для решения других. Сильный ИИ осознаёт себя и своё существование.

**Машинное обучение** (Machine Learning) — это один из разделов науки об искусственном интеллекте. Машинное обучение заключается в построении моделей с помощью поиска закономерностей в данных и использовании их для того, чтобы спрогнозировать характеристики новых данных.

![image.png](attachment:image-2.png)

За управление параметрами отвечает некоторая **функция ошибки** (функция потерь (loss function)). Это некоторая математическая функция, которая показывает различие между фактическими ответами и предсказаниями модели.

Самый простой пример функции ошибки — **MSE (Mean Squared Error)**, средний квадрат разницы между ответами:

$MSE = \cfrac{\sum_{i=1}^n(y - \^{y})^2}{n}$

где $y$ — истинные ответы, $\^{y}$ — предсказания, $n$ — количество примеров.

Схемы обучния:
* на основе минимизации ошибок;
* на основе прироста информации (используются в деревьях решений);
* на основе «сходства» объектов (используется в методе ближайших соседей);
* на основе вероятностных законов (например, метод максимального правдоподобия).

**Метрика** (metric) — это численное выражение качества модели (или её ошибки). Иногда метрика может совпадать с функцией потерь, но чаще всего они различны. Метрика, как правило, должна быть интерпретируемой и понятной — в этом её главное отличие от функции потерь.

Примеры моделей (алгоритмов) машинного обучения:
* линейная регрессия (Linear Regression),
* логистическая регрессия (Logistic Regression),
* наивный метод Байеса (Naive Bayes),
* метод k ближайших соседей (kNN),
* деревья решений (Decision Tree),
* случайный лес (Random Forest),
* градиентный бустинг (Gradient Boosting),
* нейронные сети (Neural Network).

**Глубокое обучение (Deep Learning)** — подраздел машинного обучения. Глубокое обучение основано на изучении и применении в качестве инструмента для решения задач искусственных нейронных сетей. Данные алгоритмы основаны на имитации работы человеческого мозга.

![image.png](attachment:image-3.png)

Виды машинного обучения:

![image.png](attachment:image-4.png)

### Обучение с учителем

Данный вид обучения основан на том, что у машины есть некий учитель, который сообщает ей, как поступать правильно, рассказывает, что на этой картинке изображена кошка, а на этой — собака. То есть мы заранее разделили все данные на кошек и собак, а машина учится на конкретных примерах и правильных ответах к ним.

Данные, в которых содержится информация о целевом признаке, называются **размеченными**.

![image.png](attachment:image.png)

Главная проблема обучения с учителем - возможностью **переобучения**. Это ситуация, когда модель полностью подстраивается под данные, на которых происходит обучение, но на реальных данных показывает значительно более низкое качество. 

Виды: 
* [Регрессия](./regression.ipynb)
* [Классификация](./classification.ipynb)

В категории обучения с учителем модели можно условно разделить на следующие **основные типы**:
* Линейные модели: линейная регрессия (для задачи регрессии) и логистическая регрессия (для задачи классификации) и производные от них.
* «Древесные» модели: дерево решений и производные от него. 
* Метрические алгоритмы: метод ближайших соседей и производные от него.
* Байесовские методы: метод наивного Байеса и производные от него.
* Ансамблевые методы: композиции из методов (бэггинг, стекинг, бустинг).

### Обучение без учителя

Обучение без учителя подразумевает, что у вас нет правильных ответов. То есть признак, который вы хотите предсказать, вам недоступен. Подход основан на том, что алгоритм самостоятельно выявляет зависимости в данных только на основе схожести объектов в данных между собой:
* [**Кластеризация**](./clustering.ipynb) - c помощью методов кластеризации мы можем разделить наши объекты на группы (кластеры) и попытаться проанализировать эти группы;
* [**Понижение размерности**](./dimensionality_reduction.ipynb) - c помощью методов понижения размерности мы можем отбросить ненужные признаки и выжать из данных только самые важные знания;
* [**Ассоциация**](./association.ipynb) - методы ассоциации помогают находить закономерности в последовательных действиях.


### Обучение с подкреплением

Это не задачи, связанные с анализом данных и предсказанием, а задачи взаимодействия со средой и «выживания» в ней. 

Средой может быть видеоигра: в такой искусственной среде «выживают», например, роботы, играющие в Mario, или интеллектуальные боты во множестве других игр. Средой может быть и реальный мир, точнее — его часть: в такой среде существуют, например, автопилот Tesla, роботы-пылесосы или беспилотные летательные аппараты.

Объект, который взаимодействует со средой (например, играет в игру), называется **агентом**.

![image.png](attachment:image.png)

**Цель обучения** — не рассчитать все ходы, а построить оптимальную стратегию для взаимодействия со средой и максимизировать финальную награду.

Классический метод обучения с подкреплением — **Q-learning** — основан на уравнении Беллмана.

В Q-learning рассматриваются все состояния, в которых может находиться агент, и все возможные переходы из одного состояния в другое, которые определяются действиями.

![image.png](attachment:image-2.png)

Вводится некоторая Q-функция, которая оценивает, какую награду получит агент при совершении действия из своего состояния.

Уравнение Беллмана помогает определить следующее оптимальное действие, такое, что значение Q-функции для определённой пары состояние-действие будет максимальной.

**Цель Q-learning** — приближённо найти (аппроксимировать) Q-функцию, которая ответит на вопрос, как нужно правильно играть, чтобы получить максимум награды.

Для сложных задач — сложные решения. В таких случаях для поиска сложных Q-функций привлекаются нейронные сети, а такое обучение носит название **Deep Q-Network (DQN)**.

Как выяснилось на практике, генетические алгоритмы значительно уступают в скорости обучения методам Q-learning и их производным, поэтому они используются всё реже.