In [44]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [45]:
df = pd.read_csv("bodyfat.csv")

In [46]:
df.isnull().sum()

Density    1
BodyFat    1
Age        0
Weight     0
Height     0
Neck       1
Chest      3
Abdomen    2
Hip        1
Thigh      4
Knee       4
Ankle      1
Biceps     2
Forearm    1
Wrist      2
dtype: int64

In [47]:
df = df.dropna()
cols = ['Neck', 'Chest', 'Abdomen', 'Hip', 'Thigh', 'Knee', 'Biceps', 'Wrist']
X = df[cols]
X, y = X, df['Weight']

In [48]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge

In [49]:
X_train, X_test, y_train, y_test = train_test_split(X.values, y, test_size=0.2, random_state=42)


In [50]:
def rmse_score(y_true, y_pred):
    error = (y_true - y_pred) ** 2
    return np.sqrt(np.mean(error))

In [51]:
from sklearn.linear_model import Lasso, LassoCV

In [52]:
model = Lasso(random_state = 42)
model.fit(X_train, y_train)

y_pred_train = model.predict(X_train) # здесь будут предсказания на тренировочных данных
y_pred_test = model.predict(X_test) # здесь будут предсказания на тестовых данных

rmse_train = rmse_score(y_train, y_pred_train)
rmse_test = rmse_score(y_test, y_pred_test)

print('Качество на тренировочной выборке:', rmse_train)
print('Качество на тестовой выборке:', rmse_test)

Качество на тренировочной выборке: 6.5555549879348405
Качество на тестовой выборке: 5.368379816413866


In [53]:
new = [[42.4, 97.3, 100.0, 101.9, 63.2, 42.2, 32.2, 17.7]]
print('predict', model.predict(new))

predict [190.7858184]


In [54]:
model = LassoCV(cv = 3)
model.fit(X_train, y_train)

y_pred_train = model.predict(X_train) # здесь будут предсказания на тренировочных данных
y_pred_test = model.predict(X_test) # здесь будут предсказания на тестовых данных

rmse_train = rmse_score(y_train, y_pred_train)
rmse_test = rmse_score(y_test, y_pred_test)

print('Качество на тренировочной выборке:', rmse_train)
print('Качество на тестовой выборке:', rmse_test)

Качество на тренировочной выборке: 6.4282881417288715
Качество на тестовой выборке: 5.345176374860547


In [55]:
new = [[42.4, 97.3, 100.0, 101.9, 63.2, 42.2, 32.2, 17.7]]
print('predict', model.predict(new))

predict [190.04111965]
