In [18]:
import numpy as np
import random
from scipy import stats

from sklearn.datasets.samples_generator import make_regression 

In [19]:
# генерируем случайные данные
x, y = make_regression(n_samples=100, n_features=1, n_informative=1, 
                        random_state=0, noise=35)

In [20]:
# размер данных
m, n = np.shape(x)
m, n

# преобразуем x к следующему виду
x = np.c_[ np.ones(m), x]
x[:5]

array([[ 1.        , -0.35955316],
       [ 1.        ,  0.97663904],
       [ 1.        ,  0.40234164],
       [ 1.        , -0.81314628],
       [ 1.        , -0.88778575]])

In [21]:
y_pr = (1/(1+np.exp(y))).round(0)

In [22]:
# шаг алгоритма
alpha = 0.01

In [23]:
def logloss(true_label, predicted, eps=1e-15):
  p = np.clip(predicted, eps, 1 - eps)
  if true_label == 1:
    return -np.log(p)
  else:
    return -np.log(1 - p)

In [24]:
def gradient_descent_3(alpha, x, y, numIterations):
    """
    Функция реализует алгоритм градиентного спуска. На каждом шаге выводится значение функции потерь
    """
    
    m = x.shape[0] # 100
    theta = np.ones(2) # [ 1.  1.] ВЕСА МОДЕЛИ!!!
    x_transpose = x.transpose() # транспонированная матрица x
    
    for iter in range( 0, numIterations ):
        hypothesis = np.dot(x, theta) # матричное произведение
        a = 1/(1+np.exp(-1*hypothesis))
        l = a - y
        loss2 = np.array( list(map(logloss,y,a)) )
        LL = np.sum(loss2**2) / (2 * m)  # функция потерь
        print( "iter %s | J: %.3f" % (iter, LL) )
        G = np.dot(x_transpose, l) / m        
        theta = theta - alpha * G  # update
    return theta

In [25]:
%%time
theta = gradient_descent_3(0.1, x, y_pr, 1000)

iter 0 | J: 1.146
iter 1 | J: 1.079
iter 2 | J: 1.015
iter 3 | J: 0.954
iter 4 | J: 0.897
iter 5 | J: 0.844
iter 6 | J: 0.793
iter 7 | J: 0.746
iter 8 | J: 0.702
iter 9 | J: 0.661
iter 10 | J: 0.622
iter 11 | J: 0.586
iter 12 | J: 0.553
iter 13 | J: 0.521
iter 14 | J: 0.493
iter 15 | J: 0.466
iter 16 | J: 0.441
iter 17 | J: 0.419
iter 18 | J: 0.398
iter 19 | J: 0.378
iter 20 | J: 0.360
iter 21 | J: 0.344
iter 22 | J: 0.329
iter 23 | J: 0.315
iter 24 | J: 0.303
iter 25 | J: 0.291
iter 26 | J: 0.280
iter 27 | J: 0.270
iter 28 | J: 0.261
iter 29 | J: 0.253
iter 30 | J: 0.246
iter 31 | J: 0.239
iter 32 | J: 0.232
iter 33 | J: 0.226
iter 34 | J: 0.221
iter 35 | J: 0.216
iter 36 | J: 0.211
iter 37 | J: 0.207
iter 38 | J: 0.203
iter 39 | J: 0.200
iter 40 | J: 0.197
iter 41 | J: 0.194
iter 42 | J: 0.191
iter 43 | J: 0.188
iter 44 | J: 0.186
iter 45 | J: 0.184
iter 46 | J: 0.182
iter 47 | J: 0.180
iter 48 | J: 0.178
iter 49 | J: 0.177
iter 50 | J: 0.175
iter 51 | J: 0.174
iter 52 | J: 0.172
ite

iter 438 | J: 0.210
iter 439 | J: 0.210
iter 440 | J: 0.210
iter 441 | J: 0.210
iter 442 | J: 0.210
iter 443 | J: 0.210
iter 444 | J: 0.210
iter 445 | J: 0.210
iter 446 | J: 0.210
iter 447 | J: 0.211
iter 448 | J: 0.211
iter 449 | J: 0.211
iter 450 | J: 0.211
iter 451 | J: 0.211
iter 452 | J: 0.211
iter 453 | J: 0.211
iter 454 | J: 0.211
iter 455 | J: 0.211
iter 456 | J: 0.211
iter 457 | J: 0.211
iter 458 | J: 0.211
iter 459 | J: 0.211
iter 460 | J: 0.211
iter 461 | J: 0.211
iter 462 | J: 0.211
iter 463 | J: 0.211
iter 464 | J: 0.211
iter 465 | J: 0.211
iter 466 | J: 0.211
iter 467 | J: 0.211
iter 468 | J: 0.212
iter 469 | J: 0.212
iter 470 | J: 0.212
iter 471 | J: 0.212
iter 472 | J: 0.212
iter 473 | J: 0.212
iter 474 | J: 0.212
iter 475 | J: 0.212
iter 476 | J: 0.212
iter 477 | J: 0.212
iter 478 | J: 0.212
iter 479 | J: 0.212
iter 480 | J: 0.212
iter 481 | J: 0.212
iter 482 | J: 0.212
iter 483 | J: 0.212
iter 484 | J: 0.212
iter 485 | J: 0.212
iter 486 | J: 0.212
iter 487 | J: 0.212


iter 908 | J: 0.219
iter 909 | J: 0.219
iter 910 | J: 0.219
iter 911 | J: 0.219
iter 912 | J: 0.219
iter 913 | J: 0.219
iter 914 | J: 0.219
iter 915 | J: 0.219
iter 916 | J: 0.219
iter 917 | J: 0.219
iter 918 | J: 0.219
iter 919 | J: 0.219
iter 920 | J: 0.219
iter 921 | J: 0.219
iter 922 | J: 0.219
iter 923 | J: 0.219
iter 924 | J: 0.219
iter 925 | J: 0.219
iter 926 | J: 0.219
iter 927 | J: 0.219
iter 928 | J: 0.219
iter 929 | J: 0.219
iter 930 | J: 0.219
iter 931 | J: 0.219
iter 932 | J: 0.220
iter 933 | J: 0.220
iter 934 | J: 0.220
iter 935 | J: 0.220
iter 936 | J: 0.220
iter 937 | J: 0.220
iter 938 | J: 0.220
iter 939 | J: 0.220
iter 940 | J: 0.220
iter 941 | J: 0.220
iter 942 | J: 0.220
iter 943 | J: 0.220
iter 944 | J: 0.220
iter 945 | J: 0.220
iter 946 | J: 0.220
iter 947 | J: 0.220
iter 948 | J: 0.220
iter 949 | J: 0.220
iter 950 | J: 0.220
iter 951 | J: 0.220
iter 952 | J: 0.220
iter 953 | J: 0.220
iter 954 | J: 0.220
iter 955 | J: 0.220
iter 956 | J: 0.220
iter 957 | J: 0.220
