In [25]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Загрузка данных
df = pd.read_csv("price_moscow_flat.csv", delimiter=";")   # Замените на ваш файл
X = df.iloc[:, :-1].values  # Все столбцы, кроме последнего, как признаки
y = df.iloc[:, -1].values   # Последний столбец — целевая переменная

# Разделение на обучающую и экзаменационную выборки (50/50)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)
# Построение множества моделей
models = []
errors = []
degrees = [1, 2, 3]  # Используем полиномы 1-й, 2-й и 3-й степени

for d in degrees:
    poly = PolynomialFeatures(degree=d)
    X_train_poly = poly.fit_transform(X_train)
    X_test_poly = poly.transform(X_test)

    model = LinearRegression()
    model.fit(X_train_poly, y_train)

    y_pred = model.predict(X_test_poly)
    error = mean_squared_error(y_test, y_pred)  # Ошибка модели
    models.append((model, poly))
    errors.append(error)

# Выбор оптимальной модели (по минимальному MSE)
best_model_index = np.argmin(errors)
best_model, best_poly = models[best_model_index]


print(f"Лучшая модель: полином {degrees[best_model_index]}-й степени")
print(f"Ошибка (MSE): {errors[best_model_index]}")

# Прогнозирование на новых данных
X_new = np.array([[5, 2, 3, 1, 4]])  # Замените на реальные данные
X_new = np.pad(X_new, ((0, 0), (0, X_train.shape[1] - X_new.shape[1])), 'constant')

X_new_poly = best_poly.transform(X_new)  # Применяем ту же трансформацию
y_pred_new = best_model.predict(X_new_poly)

print(f"Прогнозное значение: {y_pred_new[0]}")


Лучшая модель: полином 2-й степени
Ошибка (MSE): 4.092913747949077
Прогнозное значение: 4.362410526487801
