День 2: сравнение LinearRegression и RandomForest
Сохранение модели и тестовый запуск API
Тест на 4 пред. днях в Jupyter

In [2]:
# 📦 Импорт библиотек
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error

# 📥 Загрузка данных
df = pd.read_csv('../data/price_data.csv', parse_dates=['date'])

# 🧪 Генерация признаков
df['day_of_week'] = df['date'].dt.dayofweek
df['rolling_mean_3'] = df['price'].rolling(window=3).mean()
df['rolling_std_3'] = df['price'].rolling(window=3).std()
df['price_diff'] = df['price'].diff()

# 🧹 Очистка от NaN
df = df.dropna().reset_index(drop=True)

# 🎯 Целевая переменная и признаки
X = df.drop(columns=['price', 'date'])  # признаки
y = df['price']                         # целевая переменная

# ✂️ Разделение на train/test
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# 🤖 Обучение модели
model = LinearRegression()
model.fit(X_train, y_train)

# 📊 Прогноз и оценка
y_pred = model.predict(X_test)

mae = mean_absolute_error(y_test, y_pred)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))

print(f"MAE: {mae:.2f}")
print(f"RMSE: {rmse:.2f}")


MAE: 0.32
RMSE: 0.34


In [3]:

from sklearn.ensemble import RandomForestRegressor

# 🔧 Создаём модель
rf_model = RandomForestRegressor(
    n_estimators=100,     # количество деревьев
    max_depth=5,          # максимальная глубина дерева
    random_state=42
)

# 🤖 Обучаем
rf_model.fit(X_train, y_train)

# 📊 Прогноз и метрики
y_pred_rf = rf_model.predict(X_test)

mae_rf = mean_absolute_error(y_test, y_pred_rf)
rmse_rf = np.sqrt(mean_squared_error(y_test, y_pred_rf))

print("Random Forest:")
print(f"MAE: {mae_rf:.2f}")
print(f"RMSE: {rmse_rf:.2f}")


Random Forest:
MAE: 1.64
RMSE: 2.53


In [4]:
import joblib

# Сохраняем модель в файл
joblib.dump(model, '../models/linear_regression_model.joblib')

print("Модель сохранена!")


Модель сохранена!


http://127.0.0.1:5000/predict-price?day_of_week=1&rolling_mean_3=105&rolling_std_3=1.5&price_diff=2
Для тестового запуска (python app.py в терминал)