## Классификационные модели

Для прогнозирования стоимости проезда в такси в зависимости от расстояния поездки, дня недели и времени суток использовали несколько моделей. Регрессионные модели предсказывают числовые результаты и широко используются для прогнозирования продаж, цен, спроса и других показателей. 

Классификационные модели предсказывают категориальные результаты, например, является ли операция по
кредитной карте мошеннической или какую букву алфавита представляет тот или иной рукописный символ.

Большинство моделей классификации делятся на две категории: **бинарные (двоичные)**, в которых возможны только два исхода, и **мультиклассовые (многоклассовые)**, в которых возможны более двух исходов. В обоих случаях модель присваивает входным данным один класс, или метку класса. Реже встречаются многометочные модели классификации, которые могут классифицировать один входной сигнал как принадлежащий к нескольким классам, например предсказать, что документ является одновременно статьей по машинному обучению и статьей по лингвистике. Некоторые из них также могут предсказать, что входные данные не принадлежат ни к одному из возможных классов.

Многие алгоритмы обучения, используемые в регрессионных моделях, одинаково хорошо работают и в классификационных моделях. Существенное различие между регрессией и классификацией заключается в
способе измерения точности модели. 

Для классификационной модели не существует такого понятия, как показатель $R^2$ . Вместо него применяется показатели, такие как точность (precision), полнота (recall), специфичность (specificity),
чувствительность (sensitivity), Fl-мepa (Fl score) и др. 

## Логистическая регрессия
Для решения задач классификации существует множество алгоритмов обучения. Например, алгоритмы деревья решений, случайные леса и градиентный бустинг можно использовать и для классификации. В билбиотеке
Scikit имеются классы, как *DecisionTreeClassifier*, *RandomForestClassifier* и
*GradientBoostingClassifier*. Мы использовали класс *KNeighborsClassifier* для построенияклассиф икационной *модели с k ближайшими соседями* в качестве алгоритма обучения.

Эти алгоритмы обучения используются во многих современных моделях машинного обучения. Но одним из самых популярных алгоритмов классификации является **логистическая регрессия**, которая анализирует распределение данных и подбирает под него уравнение, определяющее вероятность принадлежности данной выборки к каждому из двух возможных классов.

В качестве примера рассмотрим наборы данных, которые принадлежат к двум классам: 0 (синий) и 1 (красный). Предположим, что ось х определяет количество часов, в течение которых человек готовился к экзамену, а ось у показывает, сдал он экзамен (1) или не сдал (0). Синие цвета попадают в диапазон от х = 0 до х = 10, а красные - в диапазон от х = 5 до х= 15. Вы не можете выбрать значение х,
разделяющее классы, поскольку оба имеют значения между х = 5 и х = 10. 

Можно построить кривую, которая, задавая х, показывает вероятность того, что точка с этим х принадлежит классу 1. С увеличением х растет и вероятность того, что точка относится к классу 1 ("зачет"), а не к классу 0 ("незачет"). Из кривой видно, что при х = 2 вероятность того, что точка соответствует классу 1, составляет менее 5%. Но если х = 10, то вероятность того, что она соответствует классу 1, составляет около 76%. Если бы вас попросили классифицировать эту точку как красную или синюю, вы бы пришли к выводу, что это красная точка, поскольку вероятность того, что она красная, гораздо выше, чем вероятность того, что она синяя.

<img src="L_Reg.JPG" widht=200 height=200 align='left'/>

Данная кривая на является сигмоидной кривой. Она представляет собой график функции, называемой логuстuческой функцией.

Для логистической регрессии функция определяется следующим образом: х - входное значение, m и b - параметры, полученные в процессе обучения

$
y=\frac{1}{1+e^{-(mx+b)}}
$

Это уравнение показывает, почему логистическая регрессия называется именно так. Экспонента е соответствует уравнению линейной регрессии.

Алгоритм обучения логистической регрессии подгоняет логистическую функцию под распределение данных и использует полученные значения *у* в качестве вероятностей для классификации точек данных. Он работает с любым количеством признаков ($х_1 , х_2 , х_3$ и т. д . )