In [20]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error,mean_squared_error

In [21]:
from sklearn.datasets import load_iris
iris = load_iris()
df= pd.DataFrame(data= np.c_[iris['data'], iris['target']],
                     columns= iris['feature_names'] + ['target'])

map_condition={
    1:1,
    0:0,
    2:1
}
df["target"] = df["target"].map(map_condition)
df["target"]

df.sample(5)

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target
39,5.1,3.4,1.5,0.2,0
118,7.7,2.6,6.9,2.3,1
62,6.0,2.2,4.0,1.0,1
71,6.1,2.8,4.0,1.3,1
127,6.1,3.0,4.9,1.8,1


In [22]:
df.target.unique()


array([0, 1], dtype=int64)

In [23]:
X=df.drop('target',axis=1)
y=df['target']
len(df)

150

In [24]:
df.corr()['target'].sort_values()

sepal width (cm)    -0.603348
sepal length (cm)    0.717416
petal width (cm)     0.887344
petal length (cm)    0.922765
target               1.000000
Name: target, dtype: float64

In [25]:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,random_state=42)

In [26]:
X_train.count()


sepal length (cm)    105
sepal width (cm)     105
petal length (cm)    105
petal width (cm)     105
dtype: int64

In [27]:
X_test.count()

sepal length (cm)    45
sepal width (cm)     45
petal length (cm)    45
petal width (cm)     45
dtype: int64

**Линейная регрессия**

In [28]:
model=LinearRegression()
model.fit(X_train,y_train)
test_predictions=model.predict(X_test)
MAE=mean_absolute_error(y_test,test_predictions)
MSE=mean_squared_error(y_test,test_predictions)
RMSE=np.sqrt(MSE)
print(f'MAE= {MAE}, MSE= {MSE}, RMSE ={RMSE}')
print(f"значение прогноза для первых пяти = {test_predictions[:6]}, значение прогноза для последних пяти = {test_predictions[40:]}")
print(f"Значение коэффициентов = {model.coef_}")


MAE= 0.1337324912761251, MSE= 0.025279672628756626, RMSE =0.15899582582180147
значение прогноза для первых пяти = [ 0.92969748 -0.05271046  1.43566312  0.88104464  0.91872597  0.04657845], значение прогноза для последних пяти = [ 1.10897511  0.73990211  0.82095934 -0.14458217 -0.05394539]
Значение коэффициентов = [-0.06445435 -0.29446839  0.21963211  0.06091663]


**Линейная регрессия с параметрами**

In [29]:
model=LinearRegression(fit_intercept=False)
model.fit(X_train,y_train)
test_predictions=model.predict(X_test)
MAE=mean_absolute_error(y_test,test_predictions)
MSE=mean_squared_error(y_test,test_predictions)
RMSE=np.sqrt(MSE)
print(f'MAE= {MAE}, MSE= {MSE}, RMSE ={RMSE}')
print(f"значение прогноза для первых пяти = {test_predictions[:6]}, значение прогноза для последних пяти = {test_predictions[40:]}")
print(f"Значение коэффициентов = {model.coef_}")



MAE= 0.11597305131848902, MSE= 0.023376037435091788, RMSE =0.1528922412521047
значение прогноза для первых пяти = [0.91770884 0.09426213 1.54286073 0.85745831 1.00339201 0.10984058], значение прогноза для последних пяти = [ 1.00192899  0.7616865   0.9187907  -0.02625476  0.04681545]
Значение коэффициентов = [ 0.0890179  -0.19582212  0.19092139  0.0213925 ]


**Ridge - регрессия**

In [30]:
from sklearn.linear_model import Ridge
ridge_model=Ridge(alpha=10)
ridge_model.fit(X_train,y_train)
test_predictions=ridge_model.predict(X_test)
MAE=mean_absolute_error(y_test,test_predictions)
MSE = mean_squared_error(y_test,test_predictions)
RMSE = np.sqrt(MSE)

In [31]:
print(f'MAE= {MAE}, MSE= {MSE}, RMSE ={RMSE}')
print(f"значение прогноза для первых пяти = {test_predictions[:6]}, значение прогноза для последних пяти = {test_predictions[40:]}")
print(f"Значение коэффициентов = {model.coef_}")

MAE= 0.12067480538397723, MSE= 0.021586065082535907, RMSE =0.1469219693665175
значение прогноза для первых пяти = [0.90523277 0.03808895 1.41087873 0.86882917 0.91009285 0.09486296], значение прогноза для последних пяти = [ 1.06935747  0.77725771  0.84132959 -0.04528392  0.02197221]
Значение коэффициентов = [ 0.0890179  -0.19582212  0.19092139  0.0213925 ]


**Ridge-регрессия с кросс-валидацией**

In [32]:
from sklearn.linear_model import RidgeCV
ridge_cv_model=RidgeCV(alphas=(0.1,1.0,10.0),scoring='neg_mean_absolute_error')
ridge_cv_model.fit(X_train,y_train)
test_predictions=ridge_cv_model.predict(X_test)
ridge_cv_model.alpha_


0.1

In [33]:
MAE=mean_absolute_error(y_test,test_predictions)
MSE = mean_squared_error(y_test,test_predictions)
RMSE = np.sqrt(MSE)

In [34]:
print(f'MAE= {MAE}, MSE= {MSE}, RMSE ={RMSE}')
print(f"значение прогноза для первых пяти = {test_predictions[:6]}, значение прогноза для последних пяти = {test_predictions[40:]}")
print(f"Значение коэффициентов = {model.coef_}")

MAE= 0.13342101014349952, MSE= 0.025184977558628675, RMSE =0.15869775536732925
значение прогноза для первых пяти = [ 0.92941844 -0.05152955  1.43515268  0.88090486  0.91841452  0.04705206], значение прогноза для последних пяти = [ 1.10854474  0.74062367  0.82115592 -0.14326456 -0.05294102]
Значение коэффициентов = [ 0.0890179  -0.19582212  0.19092139  0.0213925 ]


In [35]:
ridge_cv_model.best_score_

-0.11803713028801834

**LASSO-регрессия**

In [36]:
from sklearn.linear_model import LassoCV
lasso_cv_model = LassoCV(eps=0.1,n_alphas=100,cv=5)
lasso_cv_model.fit(X_train,y_train)
lasso_cv_model.alpha_

0.07103310657596373

In [37]:
test_predictions=lasso_cv_model.predict(X_test)
MAE=mean_absolute_error(y_test,test_predictions)
MSE = mean_squared_error(y_test,test_predictions)
RMSE = np.sqrt(MSE)

In [38]:
print(f'MAE= {MAE}, MSE= {MSE}, RMSE ={RMSE}')
print(f"значение прогноза для первых пяти = {test_predictions[:6]}, значение прогноза для последних пяти = {test_predictions[40:]}")
print(f"Значение коэффициентов = {model.coef_}")

MAE= 0.1584981623326545, MSE= 0.031185922760714017, RMSE =0.17659536449384514
значение прогноза для первых пяти = [0.88545741 0.2319662  1.3646843  0.84189133 0.90724045 0.18840012], значение прогноза для последних пяти = [0.97258957 0.84189133 0.88545741 0.14483403 0.18840012]
Значение коэффициентов = [ 0.0890179  -0.19582212  0.19092139  0.0213925 ]
