# Курс ["Алгоритмы анализа данных"](https://gb.ru/lessons/177362)

# Урок 1. Алгоритм линейной регрессии. Градиентный спуск


## **Задание 1.**

### Проведите небольшое исследование алгоритма градиентного спуска. Оцените влияние значений скорости обучения (alpha) и количества итераций на ошибку алгоритма. 

### Как связаны эти два гиперпараметра между собой? 

### Подберите скорость обучения и количество итераций до совпадения ответов алгоритма с результатами МНК.

### Ответ

Как это уже видно из [этого файлa](https://nbviewer.org/github/VadimSpb/3_Algorithms/blob/hw01/hws/hw1.ipynb),  скорость обучения (alpha) влияет на скорость выхода на нужные веса; количество итераций на ошибку алгоритма ограничивает временной ресурс процесса - сколько допустимо итераций. Если представить MSE как целевой показатель на графике, то график будет близок к экспоненциальному. При этом параметры в некоторм смысле обратнопропорциональны - чем больше скорость обучения, тем за меньшее число итераций параметры весов будут максимально близки к оптимальным. В реальных примерах эти параметры подбираются эмпирически. 

## **Задание 2.(*)**

### В этом коде мы избавляемся от итераций по весам, но тут есть ошибка, исправьте ее:
​
```python
w = np.array([1, 0.5])
for i in range(1000):
    y_pred = np.dot(w, X.T)
    err = calc_mse(y, y_pred)
    w -= (alpha * (1/n * 2 * np.sum(X.T * (y_pred - y))))
    if i % 100 == 0:
         print(i, w, err)
```

In [1]:
import numpy as np

In [2]:
X = np.array([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
              [1, 1, 2, 1, 3, 0, 5, 10, 1, 2]])
y = [45, 55, 50, 59, 65, 35, 75, 80, 50, 60]

In [3]:
alpha = 0.01
w = np.array([1, 0.5])
n = X.shape[1]

In [4]:
def calc_mse(y, y_pred):
    err = np.mean((y - y_pred)**2)
    return err

In [5]:
for i in range(1000):
    y_pred = np.dot(w, X)
    err = calc_mse(y, y_pred)
    w -= alpha * 2/n * np.dot((y_pred - y), X.T)
    if i % 100 == 0:
         print(i, w, err)

0 [2.102 3.9  ] 3173.15
100 [31.88770806  6.74418155] 175.19445858001856
200 [41.83683774  4.90699865] 61.9177717428135
300 [45.33508261  4.26102097] 47.913169919666785
400 [46.56511152  4.03388672] 46.181755648107604
500 [46.99760587  3.95402334] 45.96769776787538
600 [47.14967657  3.92594232] 45.941233404700036
700 [47.20314662  3.91606866] 45.93796156758051
800 [47.2219474   3.91259695] 45.93755706443538
900 [47.228558    3.91137626] 45.937507054979434


## **Задание 3.(*)** 

### Вместо того, чтобы задавать количество итераций, задайте условие остановки алгоритма - когда ошибка за итерацию начинает изменяться ниже определенного порога.

### Сколько нужно сделать итераций, если установить допустимое отклонение MSE в размере diff=10e−6, а значение alpha=10e−2?

In [6]:
X = np.array([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
              [1, 1, 2, 1, 3, 0, 5, 10, 1, 2]])
y = [45, 55, 50, 59, 65, 35, 75, 80, 50, 60]

In [7]:
w = np.array([1, 0.5])
n = X.shape[1]

In [8]:
def calc_mse(y, y_pred):
    err = np.mean((y - y_pred)**2)
    return err

In [9]:
alpha = 10e-2
min_error_diff = 10e-6
error_diff = np.inf
errors = []
iter_num = 0

In [10]:
while error_diff > min_error_diff:
    y_pred = np.dot(w, X)
    err = calc_mse(y, y_pred)
    errors.append(err)
    
    w -= alpha * 2/n * np.dot((y_pred - y), X.T)
    if iter_num % 50 == 0:
        print(iter_num, w, err)
    
    if iter_num >= 1:
        error_diff = errors[iter_num - 1] - errors[iter_num]
    iter_num += 1

0 [12.02 34.5 ] 3173.15


In [11]:
print(iter_num)

2
