In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Загружаем данные
data = pd.read_csv("data.csv")

# Удаляем колонку с названиями регионов
data = data.drop(columns=["Region"])

# Выбираем входные и выходные переменные
X = data.iloc[:, :-1].values  # Входные переменные
y = data.iloc[:, -1].values   # Выходная переменная

# Разделяем на обучающую и экзаменационную выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)


models = {}
errors = {}

# Тестируем модели с различными степенями полинома (увеличено до 8)
for degree in range(1, 9):
    poly = PolynomialFeatures(degree=degree)
    X_train_poly = poly.fit_transform(X_train)
    X_test_poly = poly.transform(X_test)

    model = LinearRegression()
    model.fit(X_train_poly, y_train)
    
    # Оценка качества модели
    y_pred = model.predict(X_test_poly)
    error = mean_squared_error(y_test, y_pred)

    models[degree] = model
    errors[degree] = error
    print(f"Степень {degree}: Ошибка MSE = {error}")

    
    
# Отбираем модели с наименьшей ошибкой
sorted_errors = sorted(errors.items(), key=lambda x: x[1])
best_models = sorted_errors[:10]  # До 10 лучших моделей

print("Отобранные модели:")
for degree, error in best_models:
    print(f"Степень {degree}, Ошибка MSE = {error}")

    
best_degree = best_models[0][0]  # Берем модель с минимальной ошибкой
best_model = models[best_degree]

print(f"Оптимальная модель: степень {best_degree}")


# Прогнозируем будущее значение (замените на реальные входные данные)
X_future = np.array([[5000, 200000, 15000, 30000, 10000]])  # Введите свои данные

# Преобразуем для модели
X_future_poly = PolynomialFeatures(degree=best_degree).fit_transform(X_future)
y_future = best_model.predict(X_future_poly)

# Сохраняем результат в Excel
future_df = pd.DataFrame({"Feature1": X_future[:, 0], "Feature2": X_future[:, 1],
                          "Feature3": X_future[:, 2], "Feature4": X_future[:, 3],
                          "Feature5": X_future[:, 4], "Predicted": y_future})
future_df.to_excel("future_prediction.xlsx", index=False)

print(f"Прогнозное значение: {y_future[0]}")
print("Результаты сохранены в future_prediction.xlsx")



Степень 1: Ошибка MSE = 10991601374064.207
Степень 2: Ошибка MSE = 1.0813777616445794e+17
Степень 3: Ошибка MSE = 5.342726726351541e+20
Степень 4: Ошибка MSE = 1.3000108166565202e+25
Степень 5: Ошибка MSE = 1.7716133593030254e+29
Степень 6: Ошибка MSE = 1.7766217200577128e+33
Степень 7: Ошибка MSE = 1.3740763060551676e+35
Степень 8: Ошибка MSE = 1.6886223988537592e+31
Отобранные модели:
Степень 1, Ошибка MSE = 10991601374064.207
Степень 2, Ошибка MSE = 1.0813777616445794e+17
Степень 3, Ошибка MSE = 5.342726726351541e+20
Степень 4, Ошибка MSE = 1.3000108166565202e+25
Степень 5, Ошибка MSE = 1.7716133593030254e+29
Степень 8, Ошибка MSE = 1.6886223988537592e+31
Степень 6, Ошибка MSE = 1.7766217200577128e+33
Степень 7, Ошибка MSE = 1.3740763060551676e+35
Оптимальная модель: степень 1
Прогнозное значение: 78417.93389293322
Результаты сохранены в future_prediction.xlsx
