In [11]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Загрузка данных из CSV-файла
data = pd.read_csv('infl.csv') 
df = data.head()
print(df)
# Очистка данных: удаление символов '%' и преобразование в числа
for col in data.columns:
    if data[col].dtype == object:  # Проверяем, является ли столбец строковым
        data[col] = data[col].str.replace('%', '').astype(float)  # Удаляем '%' и преобразуем в float

# Проверяем размер данных
print(f'Количество строк в данных: {len(data)}')

# Разделение данных на обучающую и экзаменационную выборки
train_data = data[:25]  # Первые 25 строк для обучения
test_data = data[25:]   # Остальные строки для тестирования

# Проверяем, что данные не пустые
print("Пример данных для теста:")
print(test_data.head())  # Выводим первые несколько строк тестовых данных

# Определение целевой переменной (например, ВВП_квадрат)
y_train = train_data['ВВП'] ** 2  # ВВП_квадрат для обучения
y_test = test_data['ВВП'] ** 2    # ВВП_квадрат для тестирования

# Построение линейной модели
X_train = train_data[['ВВП', 'Инфляция', 'Безработица', 'Прогноз ВВП']]
X_test = test_data[['ВВП', 'Инфляция', 'Безработица', 'Прогноз ВВП']]

# Проверим размер X_test, чтобы убедиться, что это не пустая таблица
print(f"Размер X_test: {X_test.shape}")

model = LinearRegression()
model.fit(X_train, y_train)

# Прогнозирование на экзаменационной выборке
if X_test.shape[0] > 0:  # Проверяем, что в тестовых данных есть хотя бы 1 строка
    predictions = model.predict(X_test)

    # Оценка модели (среднеквадратичная ошибка)
    mse = mean_squared_error(y_test, predictions)
    print(f'MSE: {mse}')

    # Создание DataFrame с результатами прогнозирования
    results = pd.DataFrame({
        'Фактический ВВП': y_test,
        'Прогноз ВВП': predictions
    })

    # Сохранение результатов в xlsx-файл
    results.to_excel("prediction_results.xlsx", index=False)

    print("Результаты прогнозирования сохранены в файл 'prediction_results.xlsx'")
else:
    print("Ошибка: В тестовых данных нет записей.")


    Год  ВВП Инфляция Безработица  Прогноз ВВП Прогноз Инфляции
0  1970  3.2     5.7%        4.9%          3.3             5.5%
1  1971  3.3     4.4%        5.9%          3.4             4.3%
2  1972  5.3     3.2%        5.6%          5.2             3.3%
3  1973  5.6     6.2%        4.9%          5.5             6.0%
4  1974  0.5    11.0%        5.6%          0.7            10.8%
Количество строк в данных: 50
Пример данных для теста:
     Год  ВВП  Инфляция  Безработица  Прогноз ВВП  Прогноз Инфляции
25  1995  2.7       2.8          5.6          2.8               2.7
26  1996  3.8       3.0          5.4          3.7               3.1
27  1997  4.4       2.3          4.9          4.3               2.4
28  1998  4.5       1.6          4.5          4.4               1.7
29  1999  4.8       2.2          4.2          4.7               2.3
Размер X_test: (25, 4)
MSE: 32.615218468732145
Результаты прогнозирования сохранены в файл 'prediction_results.xlsx'
