# Курс ["Алгоритмы анализа данных"](https://gb.ru/lessons/177362)

# Урок 1. Алгоритм линейной регрессии. Градиентный спуск


## **Задание 1.**

### Проведите небольшое исследование алгоритма градиентного спуска. Оцените влияние значений скорости обучения (alpha) и количества итераций на ошибку алгоритма. 

### Как связаны эти два гиперпараметра между собой? 

### Подберите скорость обучения и количество итераций до совпадения ответов алгоритма с результатами МНК.

### Ответ

Как это уже видно из [этого файлa](https://nbviewer.org/github/VadimSpb/3_Algorithms/blob/hw01/hws/hw1.ipynb),  скорость обучения (alpha) влияет на скорость выхода на нужные веса; количество итераций на ошибку алгоритма ограничивает временной ресурс процесса - сколько допустимо итераций. Если представить MSE как целевой показатель на графике, то график будет близок к экспоненциальному. При этом параметры в некоторм смысле обратнопропорциональны - чем больше скорость обучения, тем за меньшее число итераций параметры весов будут максимально близки к оптимальным. В реальных примерах эти параметры подбираются эмпирически. 

## **Задание 2.(*)**

### В этом коде мы избавляемся от итераций по весам, но тут есть ошибка, исправьте ее:
​
```python
w = np.array([1, 0.5])
for i in range(1000):
    y_pred = np.dot(w, X.T)
    err = calc_mse(y, y_pred)
    w -= (alpha * (1/n * 2 * np.sum(X.T * (y_pred - y))))
    if i % 100 == 0:
         print(i, w, err)
```

In [12]:
X = np.array([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
              [1, 1, 2, 1, 3, 0, 5, 10, 1, 2]])
y = [45, 55, 50, 59, 65, 35, 75, 80, 50, 60]

In [13]:
alpha = 0.01
w = np.array([1, 0.5])
n = X.shape[1]

In [14]:
def calc_mse(y, y_pred):
    err = np.mean((y - y_pred)**2)
    return err

In [23]:
for i in range(1000):
    y_pred = np.dot(w, X)
    err = calc_mse(y, y_pred)
    w -= alpha * 2/n * np.dot((y_pred - y), X.T)
    if i % 100 == 0:
         print(i, w, err)

0 [47.23088237  3.91094704] 45.937500872219864
100 [47.23169965  3.91079613] 45.93750010783411
200 [47.23198702  3.91074306] 45.93750001333172
300 [47.23208806  3.9107244 ] 45.93750000164824
400 [47.23212359  3.91071784] 45.937500000203784
500 [47.23213608  3.91071554] 45.937500000025196
600 [47.23214048  3.91071473] 45.93750000000313
700 [47.23214202  3.91071444] 45.93750000000038
800 [47.23214256  3.91071434] 45.93750000000003
900 [47.23214275  3.9107143 ] 45.937500000000014


## **Задание 3.(*)** 

### Вместо того, чтобы задавать количество итераций, задайте условие остановки алгоритма - когда ошибка за итерацию начинает изменяться ниже определенного порога.

### Сколько нужно сделать итераций, если установить допустимое отклонение MSE в размере diff=10e−6, а значение alpha=10e−2?

In [25]:
alpha = 0.01
W = np.array([1, 0.5])
max_iter = 1e4
min_error_diff = 1e-8
error_diff = np.inf
errors = []
iter_num = 0

In [26]:
while error_diff > min_error_diff and iter_num < max_iter:
    y_pred = np.dot(W, X)
    err = calc_mse(y, y_pred)
    errors.append(err)
    
    W -= alpha * 2/n * np.dot((y_pred - y), X.T)
    if iter_num % 50 == 0:
        print(iter_num, W, err)
    
    if iter_num >= 1:
        error_diff = errors[iter_num - 1] - errors[iter_num]
    iter_num += 1

0 [2.102 3.9  ] 3173.15
50 [21.35487986  8.68914872] 413.5487715072509
100 [31.88770806  6.74418155] 175.19445858001856
150 [38.13335681  5.59087473] 91.38594686849362
200 [41.83683774  4.90699865] 61.9177717428135
250 [44.03289    4.5014808] 51.556373747502974
300 [45.33508261  4.26102097] 47.913169919666785
350 [46.10724347  4.11843556] 46.63217153149881
400 [46.56511152  4.03388672] 46.181755648107604
450 [46.83661344  3.98375182] 46.023383498786444
500 [46.99760587  3.95402334] 45.96769776787538
550 [47.09306951  3.93639524] 45.94811793240307
600 [47.14967657  3.92594232] 45.941233404700036
650 [47.18324284  3.91974405] 45.93881271420132
700 [47.20314662  3.91606866] 45.93796156758051
750 [47.21494897  3.91388927] 45.93766229323273
800 [47.2219474   3.91259695] 45.93755706443538
850 [47.22609726  3.91183065] 45.93752006460609
900 [47.228558    3.91137626] 45.937507054979434
950 [47.23001715  3.91110681] 45.937502480623564
1000 [47.23088237  3.91094704] 45.937500872219864
