### реализация градиентного спуска для задачи  логистической регрессии

In [1]:
from math import exp

Результат работы логистической регрессии это прогноз вероятности
$$
y = {1\over 1 + e^{-b_0 + b_1 x}}
$$

In [2]:
def predict(row, coefficients):
    yhat = coefficients[0]
    for i in range(len(row)-1):
        yhat += coefficients[i + 1] * row[i]
    return 1.0 / (1.0 + exp(-yhat))

Градиентый спуск использоваться для нахождения набора коэффициентов в модели, которые приводят к наименьшей ошибке для модели в данных обучения. На каждой итерации коэффициенты (b) обновляются с использованием уравнения:
$$b = b + learningRate * (y - yhat) * yhat * (1 - yhat) * x$$
где b - коэффициент который оптимизируется,  
learningRate - это скорость обучения, которая настраивается (например, 0.01),  
(y - yhat) - это ошибка прогноза для модели на тренировочных данных, отнесенных к коэффициенту b,  
yhat - это прогноз , сделанный на текущих коэффициентах  
x - это входное значение

In [3]:
def coefficients_sgd(train, l_rate, n_epoch):
    coef = [0.0 for i in range(len(train[0]))]
    for epoch in range(n_epoch):
        sum_error = 0
        for row in train:
            yhat = predict(row, coef)
            error = row[-1] - yhat
            sum_error += error**2
            coef[0] = coef[0] + l_rate * error * yhat * (1.0 - yhat)
            for i in range(len(row)-1):
                coef[i + 1] = coef[i + 1] + l_rate * error * yhat * (1.0 - yhat) * row[i]
        print('>epoch=%d, lrate=%.3f, error=%.3f' % (epoch, l_rate, sum_error))
    return coef

Используем синтетический датасет от одной переменной, классифицирующий таргет по двум значениям (0 или 1)

In [4]:
dataset = [[2.7810836,0],
            [1.465489372,0],
            [3.396561688,0],
            [1.38807019,0],
            [3.06407232,0],
            [7.627531214,1],
            [5.332441248,1],
            [6.922596716,1],
            [8.675418651,1],
            [7.673756466,1]]
l_rate = 0.3
n_epoch = 1000
coef = coefficients_sgd(dataset, l_rate, n_epoch)
print(coef)

>epoch=0, lrate=0.300, error=2.500
>epoch=1, lrate=0.300, error=2.289
>epoch=2, lrate=0.300, error=2.169
>epoch=3, lrate=0.300, error=2.049
>epoch=4, lrate=0.300, error=1.936
>epoch=5, lrate=0.300, error=1.829
>epoch=6, lrate=0.300, error=1.730
>epoch=7, lrate=0.300, error=1.637
>epoch=8, lrate=0.300, error=1.551
>epoch=9, lrate=0.300, error=1.471
>epoch=10, lrate=0.300, error=1.395
>epoch=11, lrate=0.300, error=1.325
>epoch=12, lrate=0.300, error=1.260
>epoch=13, lrate=0.300, error=1.199
>epoch=14, lrate=0.300, error=1.143
>epoch=15, lrate=0.300, error=1.091
>epoch=16, lrate=0.300, error=1.044
>epoch=17, lrate=0.300, error=1.001
>epoch=18, lrate=0.300, error=0.961
>epoch=19, lrate=0.300, error=0.925
>epoch=20, lrate=0.300, error=0.891
>epoch=21, lrate=0.300, error=0.861
>epoch=22, lrate=0.300, error=0.833
>epoch=23, lrate=0.300, error=0.808
>epoch=24, lrate=0.300, error=0.784
>epoch=25, lrate=0.300, error=0.763
>epoch=26, lrate=0.300, error=0.743
>epoch=27, lrate=0.300, error=0.724
>e

Проверяем результаты с найденными коэффициентами

In [6]:
for row in dataset:
    yhat = predict(row, coef)
    print("Верный класс=%.3f, Предсказанный класс=%.3f [округленно=%d]" % (row[-1], yhat, round(yhat)))

Верный класс=0.000, Предсказанный класс=0.040 [округленно=0]
Верный класс=0.000, Предсказанный класс=0.003 [округленно=0]
Верный класс=0.000, Предсказанный класс=0.129 [округленно=0]
Верный класс=0.000, Предсказанный класс=0.002 [округленно=0]
Верный класс=0.000, Предсказанный класс=0.069 [округленно=0]
Верный класс=1.000, Предсказанный класс=0.999 [округленно=1]
Верный класс=1.000, Предсказанный класс=0.892 [округленно=1]
Верный класс=1.000, Предсказанный класс=0.996 [округленно=1]
Верный класс=1.000, Предсказанный класс=1.000 [округленно=1]
Верный класс=1.000, Предсказанный класс=0.999 [округленно=1]
