# 1. Подключение датасетов моделей регрессии

#### Импортируем библиотеки

In [27]:
import numpy as np
import matplotlib.pyplot as plt
import mglearn
import mglearn.datasets 

#### Подключаем необходимые датасеты

In [2]:
from sklearn.datasets import load_diabetes
from sklearn.datasets import load_linnerud

diabetes = load_diabetes()
linnerud = load_linnerud()

# 2. Изучение подключенных данных

### Изучим load_diabetes()

In [3]:
print("Ключи diabetes: \n{}".format(diabetes.keys()))
print("\n")
print("Форма массива data для набора diabetes: {}".format(diabetes.data.shape))
print("\n")
print("Имена признаков:\n{}".format(diabetes.feature_names))

Ключи diabetes: 
dict_keys(['data', 'target', 'frame', 'DESCR', 'feature_names', 'data_filename', 'target_filename', 'data_module'])


Форма массива data для набора diabetes: (442, 10)


Имена признаков:
['age', 'sex', 'bmi', 'bp', 's1', 's2', 's3', 's4', 's5', 's6']


### Изучим load_linnerud()

In [4]:
print("Ключи linnerud: \n{}".format(linnerud.keys()))
print("\n")
print("Форма массива data для набора linnerud: {}".format(linnerud.data.shape))
print("\n")
print("Имена признаков:\n{}".format(linnerud.feature_names))
print("\n")
print("Название ответов: {}".format(linnerud.target_names))

Ключи linnerud: 
dict_keys(['data', 'feature_names', 'target', 'target_names', 'frame', 'DESCR', 'data_filename', 'target_filename', 'data_module'])


Форма массива data для набора linnerud: (20, 3)


Имена признаков:
['Chins', 'Situps', 'Jumps']


Название ответов: ['Weight', 'Waist', 'Pulse']


# 3. Построение моделей регрессии (KNeighborsRegressor, LinearRegression, Ridge, Lasso, LogisticRegression) для полученных датасетов

## Построим модели регрессии для load_diabetes()

In [7]:
# Сначала имортируем необходимые части библиотек
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsRegressor
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import Ridge
from sklearn.linear_model import Lasso
from sklearn.linear_model import LogisticRegression

# Разделение на обучающие и тестовые данные
X_train_d, X_test_d, y_train_d, y_test_d = train_test_split(diabetes.data, diabetes.target, random_state=0)

# Модель регрессии ближайших соседей (KNeighborsRegressor)
reg_d = KNeighborsRegressor(n_neighbors=1)
reg_d.fit(X_train_d, y_train_d)

# Линейная модель регрессии (метод наименьших квадратов) (LinearRegression)
lr_d = LinearRegression().fit(X_train_d, y_train_d)

# Модель гребневой регрессии (Ridge)
ridge_d = Ridge().fit(X_train_d, y_train_d)

# Модель регрессии Лассо (Lasso)
lasso_d = Lasso().fit(X_train_d, y_train_d)

# Модель регрессии LogisticRegression
logreg_d = LogisticRegression().fit(X_train_d, y_train_d)

### a. Настроим наилучшие параметры моделей для diabetes.

#### KNeighborsRegressor

In [33]:
for n_neighbors in range(1, 50):
    reg = KNeighborsRegressor(n_neighbors=n_neighbors)
    reg.fit(X_train_d, y_train_d)
    print("R^2 на обучающем при {} соседей наборе: {:.2f}".format(n_neighbors, reg.score(X_train_d, y_train_d)))
    print("R^2 на тестовом наборе: {:.2f}".format(reg.score(X_test_d, y_test_d)))
    print('\n')

R^2 на обучающем при 1 соседей наборе: 1.00
R^2 на тестовом наборе: -0.55


R^2 на обучающем при 2 соседей наборе: 0.78
R^2 на тестовом наборе: -0.08


R^2 на обучающем при 3 соседей наборе: 0.71
R^2 на тестовом наборе: 0.15


R^2 на обучающем при 4 соседей наборе: 0.63
R^2 на тестовом наборе: 0.18


R^2 на обучающем при 5 соседей наборе: 0.62
R^2 на тестовом наборе: 0.19


R^2 на обучающем при 6 соседей наборе: 0.60
R^2 на тестовом наборе: 0.23


R^2 на обучающем при 7 соседей наборе: 0.60
R^2 на тестовом наборе: 0.23


R^2 на обучающем при 8 соседей наборе: 0.59
R^2 на тестовом наборе: 0.23


R^2 на обучающем при 9 соседей наборе: 0.58
R^2 на тестовом наборе: 0.26


R^2 на обучающем при 10 соседей наборе: 0.57
R^2 на тестовом наборе: 0.26


R^2 на обучающем при 11 соседей наборе: 0.57
R^2 на тестовом наборе: 0.29


R^2 на обучающем при 12 соседей наборе: 0.56
R^2 на тестовом наборе: 0.32


R^2 на обучающем при 13 соседей наборе: 0.56
R^2 на тестовом наборе: 0.33


R^2 на обучающем пр

Как мы видим сверху, при увеличении количества соседей снижается правильность подгонки к обучающим данным, а подгонка к тестовым данным наоборот увеличивается. 

По моему мнению, при количестве 30 соседей имеет более лучшую результативность, чем другие.

In [34]:
reg_d = KNeighborsRegressor(n_neighbors=30).fit(X_train_d, y_train_d)
print("R^2 на обучающем наборе: {:.2f}".format(reg_d.score(X_train_d, y_train_d)))
print("R^2 на тестовом наборе: {:.2f}".format(reg_d.score(X_test_d, y_test_d)))

R^2 на обучающем наборе: 0.50
R^2 на тестовом наборе: 0.39


#### LinearRegression

In [79]:
print("Правильность на обучающем наборе: {:.2f}".format(lr_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(lr_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


В лабораторной №5 ничего было написано про улучшения прогонки, поэтому так и оставил.

#### Ridge

In [36]:
print("Правильность на обучающем наборе: {:.2f}".format(ridge_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(ridge_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.46
Правильность на тестовом наборе: 0.36


Прогонка очень плохая. Показали меньше даже чем другие модели регрессии. Поэтому попробуем поменять значение alpha.

In [39]:
for alpha in [0.0001, 0.001, 0.01, 0.1, 10]:
    ridge = Ridge(alpha=alpha).fit(X_train_d, y_train_d)
    print("Правильность при alpha={} на обучающем наборе: {:.2f}".format(alpha, ridge.score(X_train_d, y_train_d)))
    print("Правильность на тестовом наборе: {:.2f}".format(ridge.score(X_test_d, y_test_d)))
    print('\n')

Правильность при alpha=0.0001 на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


Правильность при alpha=0.001 на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


Правильность при alpha=0.01 на обучающем наборе: 0.55
Правильность на тестовом наборе: 0.36


Правильность при alpha=0.1 на обучающем наборе: 0.55
Правильность на тестовом наборе: 0.37


Правильность при alpha=10 на обучающем наборе: 0.17
Правильность на тестовом наборе: 0.14


Как видим результаты сверху, самый лучший вариант при alpha = 0.001. Дальше уменьшение нет смысла, потому что прогонка остановился меняться при alpha = 0.001. Поэтому поменяем значение нашей модели ridge_d.

In [40]:
ridge_d = Ridge(alpha=0.001).fit(X_train_d, y_train_d)
print("Правильность на обучающем наборе: {:.2f}".format(ridge_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(ridge_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


#### Lasso

In [41]:
print("Правильность на обучающем наборе: {:.2f}".format(lasso_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(lasso_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.41
Правильность на тестовом наборе: 0.28


Прогонка очень плохая. Поэтому попробуем поменять значение alpha.

In [71]:
for alpha in [0.0001, 0.001, 0.01, 1, 0.1, 10]:
    lasso = Lasso(alpha=alpha, max_iter=100000).fit(X_train_d, y_train_d)
    print("Правильность при alpha={} на обучающем наборе: {:.2f}".format(alpha, lasso.score(X_train_d, y_train_d)))
    print("Правильность на тестовом наборе: {:.2f}".format(lasso.score(X_test_d, y_test_d)))
    print("Количество использованных признаков: {}".format(np.sum(lasso.coef_ != 0)))
    print('\n')

Правильность при alpha=0.0001 на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36
Количество использованных признаков: 10


Правильность при alpha=0.001 на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36
Количество использованных признаков: 10


Правильность при alpha=0.01 на обучающем наборе: 0.55
Правильность на тестовом наборе: 0.35
Количество использованных признаков: 9


Правильность при alpha=1 на обучающем наборе: 0.41
Правильность на тестовом наборе: 0.28
Количество использованных признаков: 2


Правильность при alpha=0.1 на обучающем наборе: 0.55
Правильность на тестовом наборе: 0.36
Количество использованных признаков: 7


Правильность при alpha=10 на обучающем наборе: 0.00
Правильность на тестовом наборе: -0.00
Количество использованных признаков: 0


Как видим результаты сверху, самый лучший вариант при alpha = 0.001. Дальше уменьшение нет смысла, потому что прогонка остановился меняться при alpha = 0.001. Поэтому поменяем значение нашей модели lasso_d.

In [47]:
lasso_d = Lasso(alpha=0.001).fit(X_train_d, y_train_d)
print("Правильность на обучающем наборе: {:.2f}".format(ridge_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(ridge_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


#### LogisticRegression

In [48]:
print("Правильность на обучающем наборе: {:.2f}".format(logreg_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.03
Правильность на тестовом наборе: 0.01


In [64]:
logreg_d100 = LogisticRegression(C=444).fit(X_train_d, y_train_d)
print("Правильность на обучающем наборе: {:.2f}".format(logreg_d100.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_d100.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.39
Правильность на тестовом наборе: 0.01


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


Самая лучшая прогонка в данном случае это при C=444.

In [65]:
logreg_d = LogisticRegression(C=444).fit(X_train_d, y_train_d)
print("Правильность на обучающем наборе: {:.2f}".format(logreg_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.39
Правильность на тестовом наборе: 0.01


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


### b. Сравнение результатов diabetes.

In [66]:
# Прогонка при модели регрессии KNeighborsRegressor
print("Правильность на обучающем наборе: {:.2f}".format(reg_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(reg_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.50
Правильность на тестовом наборе: 0.39


In [67]:
# Прогонка при модели регрессии LinearRegression
print("Правильность на обучающем наборе: {:.2f}".format(lr_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(lr_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


In [68]:
# Прогонка при модели регрессии Ridge
print("Правильность на обучающем наборе: {:.2f}".format(ridge_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(ridge_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


In [69]:
# Прогонка при модели регрессии Lasso
print("Правильность на обучающем наборе: {:.2f}".format(lasso_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(lasso_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.56
Правильность на тестовом наборе: 0.36


In [70]:
# Прогонка при модели регрессии LogisticRegression
print("Правильность на обучающем наборе: {:.2f}".format(logreg_d.score(X_train_d, y_train_d)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_d.score(X_test_d, y_test_d)))

Правильность на обучающем наборе: 0.39
Правильность на тестовом наборе: 0.01


По результатам прогонка моделей регрессии LinearRegression, Ridge, Lasso одинаковые и лучшие чем остальные, но атак такие результаты считаются плохими, что указывает на недообучение.

Модель LogisticRegression выдает самую худшую оценку.

## Построим модели регрессии для load_linnerud()

In [83]:
# Разделение на обучающие и тестовые данные
y = linnerud.target[:, 0]
X_train_l, X_test_l, y_train_l, y_test_l = train_test_split(linnerud.data, y, random_state=0)

# Модель регрессии ближайших соседей (KNeighborsRegressor)
reg_l = KNeighborsRegressor(n_neighbors=1)
reg_l.fit(X_train_l, y_train_l)

# Линейная модель регрессии (метод наименьших квадратов) (LinearRegression)
lr_l = LinearRegression().fit(X_train_l, y_train_l)

# Модель гребневой регрессии (Ridge)
ridge_l = Ridge().fit(X_train_l, y_train_l)

# Модель регрессии Лассо (Lasso)
lasso_l = Lasso().fit(X_train_l, y_train_l)

# Модель регрессии LogisticRegression
logreg_l = LogisticRegression().fit(X_train_l, y_train_l)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


### a. Настроим наилучшие параметры моделей для linnerud.

#### KNeighborsRegressor

In [87]:
for n_neighbors in range(1, 11):
    reg = KNeighborsRegressor(n_neighbors=n_neighbors)
    reg.fit(X_train_l, y_train_l)
    print("R^2 на обучающем при {} соседей наборе: {:.2f}".format(n_neighbors, reg.score(X_train_l, y_train_l)))
    print("R^2 на тестовом наборе: {:.2f}".format(reg.score(X_test_l, y_test_l)))
    print('\n')

R^2 на обучающем при 1 соседей наборе: 1.00
R^2 на тестовом наборе: -0.46


R^2 на обучающем при 2 соседей наборе: 0.58
R^2 на тестовом наборе: -1.43


R^2 на обучающем при 3 соседей наборе: 0.34
R^2 на тестовом наборе: -0.55


R^2 на обучающем при 4 соседей наборе: 0.23
R^2 на тестовом наборе: -0.45


R^2 на обучающем при 5 соседей наборе: 0.29
R^2 на тестовом наборе: -0.70


R^2 на обучающем при 6 соседей наборе: 0.25
R^2 на тестовом наборе: -0.84


R^2 на обучающем при 7 соседей наборе: 0.30
R^2 на тестовом наборе: -0.74


R^2 на обучающем при 8 соседей наборе: 0.17
R^2 на тестовом наборе: -0.74


R^2 на обучающем при 9 соседей наборе: 0.17
R^2 на тестовом наборе: -0.88


R^2 на обучающем при 10 соседей наборе: 0.14
R^2 на тестовом наборе: -1.45


Самый хороший по моему мнению это при количестве соседей равное 1, поэтому менять ничего не будем. Оставим Так что было в начале reg_l.

#### LinearRegression

In [91]:
print("Правильность на обучающем наборе: {:.2f}".format(lr_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(lr_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32


В лабораторной №5 ничего было написано про улучшения прогонки, поэтому так и оставил.

#### Ridge

In [92]:
print("Правильность на обучающем наборе: {:.2f}".format(ridge_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(ridge_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.30


Прогонка очень плохая. Поэтому попробуем поменять значение alpha.

In [101]:
for alpha in [0.0001, 0.001, 0.01, 0.1, 1, 10, 10]:
    ridge = Ridge(alpha=alpha).fit(X_train_l, y_train_l)
    print("Правильность при alpha={} на обучающем наборе: {:.2f}".format(alpha, ridge.score(X_train_l, y_train_l)))
    print("Правильность на тестовом наборе: {:.2f}".format(ridge.score(X_test_l, y_test_l)))
    print('\n')

Правильность при alpha=0.0001 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32


Правильность при alpha=0.001 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32


Правильность при alpha=0.01 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32


Правильность при alpha=0.1 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.31


Правильность при alpha=1 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.30


Правильность при alpha=10 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.15


Правильность при alpha=10 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.15


Здесь тоже все одинаковы, поэтому оставим alpha по умолчанию.

#### Lasso

In [102]:
print("Правильность на обучающем наборе: {:.2f}".format(lasso_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(lasso_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.20


In [104]:
for alpha in [0.0001, 0.001, 0.01, 1, 0.1, 10]:
    lasso = Lasso(alpha=alpha, max_iter=100000).fit(X_train_l, y_train_l)
    print("Правильность при alpha={} на обучающем наборе: {:.2f}".format(alpha, lasso.score(X_train_l, y_train_l)))
    print("Правильность на тестовом наборе: {:.2f}".format(lasso.score(X_test_l, y_test_l)))
    print("Количество использованных признаков: {}".format(np.sum(lasso.coef_ != 0)))
    print('\n')

Правильность при alpha=0.0001 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32
Количество использованных признаков: 3


Правильность при alpha=0.001 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32
Количество использованных признаков: 3


Правильность при alpha=0.01 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32
Количество использованных признаков: 3


Правильность при alpha=1 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.20
Количество использованных признаков: 3


Правильность при alpha=0.1 на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.30
Количество использованных признаков: 3


Правильность при alpha=10 на обучающем наборе: 0.41
Правильность на тестовом наборе: -1.42
Количество использованных признаков: 3


Здесь то же самое, поэтому оставим alpha по умолчанию. 

#### LogisticRegression

In [105]:
print("Правильность на обучающем наборе: {:.2f}".format(logreg_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.87
Правильность на тестовом наборе: 0.00


In [115]:
logreg_l100 = LogisticRegression(C=100).fit(X_train_l, y_train_l)
print("Правильность на обучающем наборе: {:.2f}".format(logreg_l100.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_l100.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.93
Правильность на тестовом наборе: 0.00


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


Здесь модель при C=100 показал хороший результат к обучающему набору, а правильность текстового набора остается 0 при изменении C различными значениями.

### b. Сравнение результатов linnerud.

In [121]:
# Прогонка при модели регрессии KNeighborsRegressor
print("Правильность на обучающем наборе: {:.2f}".format(reg_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(reg_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 1.00
Правильность на тестовом наборе: -0.46


In [122]:
# Прогонка при модели регрессии LinearRegression
print("Правильность на обучающем наборе: {:.2f}".format(lr_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(lr_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.32


In [123]:
# Прогонка при модели регрессии Ridge
print("Правильность на обучающем наборе: {:.2f}".format(ridge_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(ridge_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.30


In [124]:
# Прогонка при модели регрессии Lasso
print("Правильность на обучающем наборе: {:.2f}".format(lasso_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(lasso_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.44
Правильность на тестовом наборе: -2.20


In [125]:
# Прогонка при модели регрессии LogisticRegression
print("Правильность на обучающем наборе: {:.2f}".format(logreg_l.score(X_train_l, y_train_l)))
print("Правильность на тестовом наборе: {:.2f}".format(logreg_l.score(X_test_l, y_test_l)))

Правильность на обучающем наборе: 0.87
Правильность на тестовом наборе: 0.00


Модель регрессии LogisticRegression выдал хорошую оценку. А у других плохие оценки. Уходят даже в минус.

# 4. Выводы

Решая заданные задания по лабораторной работе №5, я научился как создавать модели регрессии (KNeighborsRegressor, LinearRegression, Ridge, Lasso, LogisticRegression). Начинаю понимать как оценивать модели, какой результат является хорошим и какой - плохим. 


#### Выводы по модели регрессии для датасета load_linnerud.
Почему-то модель регрессии выдавал очень плохие результаты. Правильность на тестовых наборах почему-то выдавал к моему удивлению отрицательные значения.
