## Линейная классификация

Зачем нужны линейные классификаторы?

Легкость, интерпретируемость, тест на линейную разделимость данных

Поговорим о задаче бинарной классификации.

1 или 0

### Перцептрон

1. Используется только в случаях, когда данные линейно разделимы
2. Задаётся парметрами: 

$\eta$  <-- темп обучения (learning rate)

$w$  <-- коэффициенты модели

![linear_sep](https://production-media.paperswithcode.com/tasks/classification-algorithm-in-machine-learning_ta1IkVQ.png)

$w = (w_0, w_1, w_2)$

$x = (1, x_1, x_2)$

$w_0$ - обязательная константа

$f(z) = \left\{ \begin{array}{rcl}
1 & if w\cdot x > 0\\ 
0 & otherwise
\end{array}\right.$

$w = (0, 1, 0.5)$

$x = (x_0, x_1, x_2)$

$\left[ \begin{array}{c}
0 * x_0 + \\
1 * x_1 + \\
0.5 * x_2 \end{array} \right]  > 0
$

$1 + x_1 + 0.5x_2 > 0$

$x_2 > -2x_1$

![a](https://i.ibb.co/TBNK0Ns/1.jpg)

$x_2 > -2x_1$

![image.png](https://i.ibb.co/RTkxnp1/2.jpg)

### Шаг обновления в перцептроне

Для неверно определенного примера $x_i$

$w_j' = w_j - \eta d x_{ij}$

$d = \left\{ \begin{array}{rcl}
1 &  (если)ответ = 1 \\ 
-1 & (если)ответ = 0
\end{array}\right.$

![](https://www.cs.cornell.edu/courses/cs4780/2018fa/lectures/images/perceptron/perceptron_algo.png)

![image.png](https://i.ibb.co/Vmk00sR/image.png)


[Ссылка на дополнительные пояснения Перцептрона](https://www.cs.cornell.edu/courses/cs4780/2018fa/lectures/lecturenote03.html)

А что если мы хотим оценить вероятность наступления некоторого события?

## Логистическая регрессия

### Понятие логита

Пн  --> дождь

Вт  --> не дождь

Ср  --> не дождь

Чт  --> дождь

Пт  --> не дождь

Cб  --> не дождь

_____________________

Коэффициент (odds) наступления дождя:

$ 2 / 4 = 0.5 $

Вероятность (probability) наступления дождя

$ 2 / 6 = 0.3 $

Пн  --> дождь

Вт  --> дождь

Ср  --> дождь

Чт  --> дождь

Пт  --> дождь

Cб  --> не дождь

_____________________

Коэффициент (odds) наступления дождя:

$\frac{5}{1} = 5 $

Вероятность (probability) наступления дождя

$\frac{5}{6} = 0.83 $

Можно высчитать коэфициент из вероятности

Отношение вероятности положительного исхода к отрицательному  = коэфициент

Вероятность наступления дождя

$\frac{5}{6} = 0.83 $

Вероятность НЕнаступления дождя

$ \frac{1}{6} = 0.17 $

$ \frac{0.83}{0.17} = 5$ (коэфициент)

Альтернативный способ записи расчета коэфициента

$\frac{p}{1 - p}$

Где $p$ - вероятность положительного исхода

Попробуем расчитать коэфициенты на большей выборке.

Если месяц не дождливый, то коэфициент, например:

$\frac{1}{31} = 0.03$

$\frac{7}{31} = 0.225$

Попробуем расчитать коэфициенты на большей выборке.

Если месяц не дождливый, то коэфициент, например:

$\frac{16}{14} = 1.06$

$\frac{25}{6} = 4.16$

$\frac{30}{1} = 30$

![magnitude odds](https://i.ibb.co/NZSTQ3w/image.png)

Взятие логарифма $log(odds)$ решает проблему, приводя масштаб коэфициентов к одному уровню

![image.png](https://i.ibb.co/ZWyvS6v/image.png)

$log(\frac{p}{1 - p})$ <-- логит. формирует основу логистической регрессии

# Логистическая регрессия

![](https://i.ibb.co/4mcXCRr/image.png)

![](https://i.ibb.co/g4S7JZD/image.png)

![](https://i.ibb.co/jTN0mYX/image.png)

Сигмоида (логит - преобразование)

$\sigma(x) = \frac{1}{1+e^{-x}}$

x -- стандартное уравнение регрессии

$\sigma(x)$ -- вероятность наступления события

$e$ - основание натурального логарифма

Результат - логистическая кривая.
Зависимость, связывающая вероятность события и некоторую величину.


![asd](https://www.researchgate.net/publication/236908607/figure/fig1/AS:601626985381906@1520450459171/Graph-of-logistic-curve-where-a-0-and-b-1.png)

$y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 ... \beta_px_p$  <--- уравнение линейной регресии

$P(y_i = 1) = \frac{1}{1+exp(\beta_0 + \beta_1x_1 + \beta_2x_2 ... \beta_px_p)}$  <--- преобразованное уравнение логистической регрессии

### Функция правдоподобия

$P(\theta) = P(x = X | \theta)$  -> maximum likelihood

$$
Q'(X, w) = -\frac{1}{\ell} \sum_{i=1}^{\ell} [y_i = 1]\log\sigma(\langle x_i, w \rangle) + [y_i = -1](1 - \log(\sigma(\langle x_i, w \rangle))
$$


$ Q'(X, w) -> min $

[Метод Ньютона](https://wiki.loginom.ru/articles/newton-method.html)

![нейросеть](https://loginom.ru/sites/default/files/blogpost-files/pic2-logist-neural.svg)