**Искусственный интеллект** (Artificial Intelligence, ИИ) — это способность компьютерной системы имитировать когнитивные функции человека, такие как обучение и решение задач. ИИ позволяет компьютеру моделировать рассуждения людей для получения новых сведений и принятия решений.
Цель этой науки — понять, как устроен мозг человека и научиться моделировать его работу с помощью компьютера. 
В области искусственного интеллекта есть несколько подразделов:

* робототехника (Robotics),
* компьютерное зрение (Computer Vision),
* обработка естественного языка (Natural Language Processing),
* машинное обучение (Machine Learning).

**Машинное обучение** (Machine Learning) — это один из разделов науки об искусственном интеллекте. Машинное обучение заключается в построении моделей с помощью поиска закономерностей в данных и использовании их для того, чтобы спрогнозировать характеристики новых данных.
Всё машинное обучение держится на трёх очень важных столпах:
1) Набор данных (dataset) — это множество примеров (выборка), на котором происходит обучение модели. Это могут быть табличные данные, с которыми мы уже работали, текст, аудио, изображения (видео) и т. д.
2) Признаки (features) — это свойства, характеристики, которыми описываются наши объекты. Для недвижимости это могут быть площадь, этаж, район; для автомобиля — пробег, мощность двигателя, цвет и т. д.
Признак, который мы хотим предсказать, называется целевым признаком (target feature). Иногда признаки, на основе которых мы хотим предсказать целевой, могут называться факторами (factors).
3) Модель машинного обучения (ML-model) — это некоторый математически формализованный метод (алгоритм) описания зависимости в данных. Как правило, модель имеет настраиваемые (регулируемые) параметры.
В простом понимании модель — это математическая формула, которая связывает факторы с целевым признаком. Вспомним пример из школы: формула y = kx^2 связывает целевую переменную y и фактор x квадратичной зависимостью, а коэффициент k — это параметр.
В более обширном понимании модель может выражаться не формулой — это может быть математически описанная последовательность действий (алгоритм).

За управление параметрами отвечает некоторая функция ошибки, или, как её ещё называют, функция потерь (loss function). Это некоторая математическая функция, которая показывает различие между фактическими ответами и предсказаниями модели.

Самый простой пример функции ошибки — MSE (Mean Squared Error), средний квадрат разницы между ответами. Формально она записывается следующим образом:![image.png](attachment:image.png)

Примечание. Рассмотренная схема называется обучением на основе минимизации ошибок, или, говоря более научным языком, минимизацией эмпирического риска (риска ошибки).

Стоит отметить, что такая схема обучения далеко не единственная и подходит не для всех моделей. Однако она является наиболее популярной.

Помимо обучения на основе ошибок, существуют следующие схемы:

* на основе прироста информации (используются в деревьях решений);
* на основе «сходства» объектов (используется в методе ближайших соседей);
* на основе вероятностных законов (например, метод максимального правдоподобия).

Более того, мы увидим, что бывают задачи, где нет правильных ответов, то есть мы не можем подсчитать функцию ошибки. Этот класс задач называется обучением без учителя.

Очень часто функции ошибок сложно интерпретировать: например, существует функция ошибки log loss (логистическая функция потерь), она может изменяться от 0 до бесконечности. Непонятно, что считать хорошим качеством, а что — плохим, где эта грань. Например, 15.332 — это хороший результат? А 1.67 — это хороший результат? К тому же, если вам надо узнать, как часто ваша модель угадывает правильный ответ, log loss вам этого не скажет.

Поэтому для оценки качества модели вводится ещё одно понятие — метрика.

Примечание. Метрика ≠ функция потерь.

**Метрика** (metric) — это численное выражение качества модели (или её ошибки). Иногда метрика может совпадать с функцией потерь, но чаще всего они различны. Метрика, как правило, должна быть интерпретируемой и понятной — в этом её главное отличие от функции потерь.

**Глубокое обучение** (Deep Learning) — подраздел машинного обучения. Глубокое обучение основано на изучении и применении в качестве инструмента для решения задач искусственных нейронных сетей. Данные алгоритмы основаны на имитации работы человеческого мозга.
Самым важным качеством любой нейронной сети является её **архитектура** (набор и порядок её слоёв). От неё зависит качество и скорость обучения. В настоящее время миру известно множество различных архитектур, многие из которых объединены для решения целых классов задач.
![image-2.png](attachment:image-2.png)
в данных и особенностей обучения выделяют следующие виды машинного обучения:

* обучение с учителем (supervised learning),
* обучение без учителя (unsupervised learning).
В отдельную категорию, не похожую на предыдущие, выделяют ещё один вид машинного обучения — обучение с подкреплением (reinforcement learning).
При этом обучение с учителем и обучение без учителя содержат в себе отдельные типы задач машинного обучения, такие как регрессия, классификация, кластеризация, понижение размерности и ассоциация.
# **ОБУЧЕНИЕ С УЧИТЕЛЕМ**
![image-3.png](attachment:image-3.png)
Данный вид обучения основан на том, что у машины есть некий учитель, который сообщает ей, как поступать правильно, рассказывает, что на этой картинке изображена кошка, а на этой — собака. То есть мы заранее разделили все данные на кошек и собак, а машина учится на конкретных примерах и правильных ответах к ним.

Данные, в которых содержится информация о целевом признаке, называются размеченными.

Разметка данных — это, как правило, довольно сложный и длительный процесс, если его нельзя автоматизировать. Особенно сложна разметка текстов, звука и изображений. Причём легко догадаться, что от качества разметки зависит и качество финальной модели.

Например, для решения задач классификации, детектирования и сегментации объектов на изображениях разметку выполняют вручную.
На этом же примере можно выявить главную проблему обучения с учителем. Эта проблема называется возможностью **переобучения**. Это ситуация, когда модель полностью подстраивается под данные, на которых происходит обучение, но на реальных данных показывает значительно более низкое качество. Борьба с переобучением — очень важная задача, о которой мы поговорим отдельно.

Вид обучения с учителем включается в себя два основных типа задач: регрессия — предсказание числа и классификация — предсказание категории объекта.
##  **Регрессия**
Задача регрессии (regression) — это задача, в которой мы пытаемся предсказать вещественное число на основе признаков в наборе данных. То есть задача сводится к предсказанию целевого признака, который является числовым.
Классическими методами регрессии являются линейная (Linear) и полиномиальная (Polynomial) регрессия. Но они являются далеко не единственными.
Полиномиальная регрессия использует в качестве модели полином (многочлен), который отражает нелинейную зависимость.
![image-4.png](attachment:image-4.png)
Нередко в качестве отдельного подвида задачи регрессии выделяют задачу прогнозирования. 

**Прогнозирование** (forecasting) — это задача регрессии, в которой мы пытаемся предсказать будущее поведение временного ряда, то есть целевая переменная является числовой и зависит от времени. Причём каждому моменту времени соответствует одно конкретное значение. Можно сказать, что прогнозирование — это частный случай регрессии.
## **Классификация**
**Задача классификации** (classification) — задача, в которой мы пытаемся предсказать класс объекта на основе признаков в наборе данных. То есть задача сводится к предсказанию целевого признака, который является категориальным.
Чаще всего мы сталкиваемся с бинарной классификацией: целевой признак имеет две возможные категории («да» — 1 или «нет» — 0)
Когда классов, которые мы хотим предсказать, более двух, классификация называется мультиклассовой (многоклассовой). Например, предсказание модели самолёта по радиолокационным снимкам, классификация животных на фотографиях, определение языка, на котором говорит пользователь, разделение писем на группы.
Для решения задачи классификации может использоваться множество моделей:

* логистическая регрессия (Logistic Regression),
* метод опорных векторов (SVM),
* деревья решений (Decision Tree),
* наивный байесовский классификатор (Naive Bayes),
* метод ближайших соседей (kNN).