In [1]:
import numpy as np
from ml_from_scratch.linear_regression import LinearRegression
from sklearn.linear_model import LinearRegression as SkLinearRegression
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error
from IPython.display import Image
import matplotlib.pyplot as plt
import base64
from sklearn.model_selection import train_test_split

In [2]:
np.random.seed(42)
n_samples = 100
X = np.random.rand(n_samples, 1) * 10
true_weight = 2.0
true_bias = 1.0
noise = np.random.randn(n_samples, 1) * 0.1
y = true_weight * X + true_bias + noise

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [3]:
# Моя модель (аналитический метод)
model_analytic = LinearRegression(method="analytic", verbose=True)
model_analytic.fit(X_train, y_train)

# Предсказания и метрики
y_pred_analytic = model_analytic.predict(X_test)
metrics_analytic = model_analytic.get_metrics()
print("Аналитические метрики:", metrics_analytic)

# Вывод графика loss
Image(base64.b64decode(metrics_analytic['loss_plot']))

# Установка тестовых данных для дополнительных метрик
model_analytic.X_test, model_analytic.y_test = X_test, y_test
metrics_analytic_full = model_analytic.get_metrics()
print("Полные метрики (с MAE, RMSE):", metrics_analytic_full)

Аналитическое решение: final loss = 0.004238
Аналитические метрики: {'final_loss': 0.004238394282104858, 'loss_history': [0.004238394282104858], 'coef_': [1.9959864731496109], 'intercept_': 1.014291331945831, 'weights': [1.014291331945831, 1.9959864731496109], 'loss_plot': 'iVBORw0KGgoAAAANSUhEUgAAAs0AAAHWCAYAAACMtrREAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjguMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8g+/7EAAAACXBIWXMAAA9hAAAPYQGoP6dpAAA2lUlEQVR4nO3de1xVVf7/8fdBBEQFKpGLopg54S1pJAmnwvnGhI1Nos0jZSqFeug41qSDZdl4ScshLRtvldlvGi9To1kNzTjqZJg9KklFxUlNs8lb2TloxiVLcDjr9wdfz7cT6CI6dDz4ej4ePOisvfbea+8P4JvFOjuHMcYIAAAAwFkF+XsAAAAAwPmO0AwAAABYEJoBAAAAC0IzAAAAYEFoBgAAACwIzQAAAIAFoRkAAACwIDQDAAAAFoRmAAAAwILQDAABLicnR4mJiY3a9+GHH5bD4fDtgACgGSI0A0ATcTgcDfrYuHGjv4fqFzk5OWrTpo2/hwEADeIwxhh/DwIAmqO//OUvXq+XLVum9evXa/ny5V7tP/vZzxQTE9Po85w+fVput1uhoaHfed///ve/+u9//6uwsLBGn7+xcnJy9PLLL+vLL7/8wc8NAN9VsL8HAADN1e233+71+r333tP69evrtH/bV199pfDw8Aafp2XLlo0anyQFBwcrOJh/CgDAhuUZAOBHAwYMUK9evbRt2zZdd911Cg8P10MPPSRJe

In [4]:
# Моя модель (градиентный спуск)
model_gradient = LinearRegression(method="gradient", learning_rate=0.01, max_iter=1000, verbose=True)
model_gradient.fit(X_train, y_train)

# Предсказания и метрики
y_pred_gradient = model_gradient.predict(X_test)
metrics_gradient = model_gradient.get_metrics()
print("Градиентные метрики:", metrics_gradient)

# Вывод графика loss
Image(base64.b64decode(metrics_gradient['loss_plot']))

# Установка тестовых данных
model_gradient.X_test, model_gradient.y_test = X_test, y_test
metrics_gradient_full = model_gradient.get_metrics()
print("Полные метрики (с MAE, RMSE):", metrics_gradient_full)

Epoch0: loss = 69.58934915709749:.6f
Epoch100: loss = 0.042686990921852595:.6f
Epoch200: loss = 0.026514072703444812:.6f
Сошлись в одну эпоху 237
итоговые потери за  237 эпох: 0.022441
Градиентные метрики: {'final_loss': 0.022440540761596316, 'loss_history': [69.58934915709749, 33.05234201156095, 15.71773256829847, 7.493406642056556, 3.5913157440795898, 1.7398438443590085, 0.8612576213339647, 0.44424305733366687, 0.246215068918276, 0.15208288579322898, 0.10724345527817045, 0.08579119279050215, 0.07543558650333752, 0.07034558665617494, 0.0677547360280559, 0.06635052626153931, 0.06551025272225326, 0.06493847757996267, 0.06449502973856405, 0.06411340204595595, 0.06376203610414904, 0.06342595444223387, 0.06309804618296395, 0.06277493266103422, 0.06245500592905957, 0.06213749815673149, 0.061822040121400676, 0.06150845174057271, 0.06119664269312193, 0.060886565270409185, 0.06057819200707455, 0.06027150506816581, 0.059966491213882735, 0.05966313941053401, 0.05936143969695136, 0.05906138264653

In [5]:
# Модель scikit-learn
sk_model = SkLinearRegression()
sk_model.fit(X_train, y_train)
y_pred_sk = sk_model.predict(X_test)

# Сравнение весов
print("Истинные веса: a=2.0, b=1.0")
print("Мои веса (аналитический):", model_analytic.weights.flatten())
print("Мои веса (градиентный):", model_gradient.weights.flatten())
print("Веса scikit-learn:", [sk_model.coef_[0], sk_model.intercept_[0]])

# Сравнение метрик
r2_sk = r2_score(y_test, y_pred_sk)
mae_sk = mean_absolute_error(y_test, y_pred_sk)
rmse_sk = np.sqrt(mean_squared_error(y_test, y_pred_sk))
print("\nМетрики scikit-learn:")
print(f"R²: {r2_sk:.4f}")
print(f"MAE: {mae_sk:.4f}")
print(f"RMSE: {rmse_sk:.4f}")

print("\nМетрики моей модели (аналитический):")
print(f"R²: {model_analytic.score(X_test, y_test):.4f}")
print(f"MAE: {metrics_analytic_full['mae']:.4f}")
print(f"RMSE: {metrics_analytic_full['rmse']:.4f}")

print("\nМетрики моей модели (градиентный):")
print(f"R²: {model_gradient.score(X_test, y_test):.4f}")
print(f"MAE: {metrics_gradient_full['mae']:.4f}")
print(f"RMSE: {metrics_gradient_full['rmse']:.4f}")

Истинные веса: a=2.0, b=1.0
Мои веса (аналитический): [1.01429133 1.99598647]
Мои веса (градиентный): [0.65314929 2.05211053]
Веса scikit-learn: [array([1.99598647]), 1.0142913319458557]

Метрики scikit-learn:
R²: 0.9998
MAE: 0.0591
RMSE: 0.0809

Метрики моей модели (аналитический):
R²: 0.9998
MAE: 0.0591
RMSE: 0.0224

Метрики моей модели (градиентный):
R²: 0.9986
MAE: 0.2054
RMSE: 0.1149
