In [547]:
# Блок 1: Импорт библиотек
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_absolute_percentage_error
from sklearn.preprocessing import StandardScaler, MinMaxScaler, RobustScaler


In [548]:
# Блок 2: Загрузка данных
data = pd.read_excel('yn.xlsx')
df = pd.DataFrame(data)

In [549]:
# Блок 3: Определение входных и выходных данных
X = df[['x1', 'x2', 'x3', 'x4', 'x5', 'x6', 'x7', 'x8', 'x9', 'x10']]
y = df['yn']

In [550]:
# Блок 4: Разделение данных на обучающую, тестовую и валидационную выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=73)

In [551]:
# Нормализация данных: приведение всех признаков к одному масштабу
scaler = StandardScaler()  # Создание объекта для нормализации
X_train_scaled = scaler.fit_transform(X_train)  # Обучение и преобразование обучающего набора данных
X_test_scaled = scaler.transform(X_test)  # Преобразование тестового набора данных

In [552]:
# Блок 5: Создание и обучение модели MLP
model = MLPRegressor(
    hidden_layer_sizes=(13,),  # Один скрытый слой с 8 нейронами
    activation='identity',    # Логистическая функция активации
    solver='sgd',           # Алгоритм BFGS
    max_iter=700,             # Максимальное количество итераций
    random_state=73,           # Для воспроизводимости
    learning_rate='constant',
    momentum=0.1
)

model.fit(X_train_scaled, y_train)  # Обучение модели

In [553]:
# Блок 6: Прогнозирование на тестовой выборке
y_pred_model1 = model.predict(X_test_scaled)

In [554]:
# Блок 7: Вычисление метрик MAPE и RMSE
from sklearn.metrics import mean_squared_error


mape_model1 = mean_absolute_percentage_error(y_test, y_pred_model1) * 100  # Приводим к процентам
rmse_model1 = np.sqrt(mean_squared_error(y_test, y_pred_model1))           # Корень из MSE для RMSE


print(f'MAPE test: {mape_model1}')
print(f'RMSE: {rmse_model1}')
# Метрики обучающей выборки
y_pred_train = model.predict(X_train_scaled)
mape_train = mean_absolute_percentage_error(y_train, y_pred_train) * 100
rmse_train = np.sqrt(mean_squared_error(y_train, y_pred_train))
print(f'MAPE train: {mape_train}')
print(f'RMSE train: {rmse_train}')

MAPE test: 10.329128212918736
RMSE: 3.2965031934571956
MAPE train: 9.009692064769395
RMSE train: 2.8723063141990064


In [555]:
# Блок 8: Создание DataFrame для тестовых значений
test_comparison_model1 = pd.DataFrame({"yn": y_test.values, "y_pred_py": y_pred_model1})

In [556]:
# Блок 9: Загрузка данных для второй модели
# Создаем DataFrame с метриками для первой модели
metrics_model1 = pd.DataFrame({"Метрика": ["MAPE", "RMSE"], "Значение": [mape_model1, rmse_model1]})

# Загрузка данных для второй модели
df_statistica = pd.read_excel('y_pred_statistica.xlsx')

In [557]:
# Блок 10: Вычисление метрик для второй модели
# Определяем выходные данные для второй модели
from sklearn.metrics import mean_squared_error


y_pred_statistica = df_statistica['y_pred_statistica'].values
y_actual_statistica = df_statistica['yn'].values

# Вычисляем MAPE и RMSE для второй модели
mape_model2 = mean_absolute_percentage_error(y_actual_statistica, y_pred_statistica) * 100
rmse_model2 = np.sqrt(mean_squared_error(y_actual_statistica, y_pred_statistica))

In [558]:
# Блок 11: Создание DataFrame для второй модели
# Создаем DataFrame для тестовых значений второй модели
test_comparison_model2 = pd.DataFrame({"yn": y_actual_statistica, "y_pred_statistica": y_pred_statistica})

# Создаем DataFrame с метриками для второй модели
metrics_model2 = pd.DataFrame({"Метрика": ["MAPE", "RMSE"], "Значение": [mape_model2, rmse_model2]})



In [559]:
# Блок 12: Сохраняем оба датафрейма в Excel
output_file = 'models_results.xlsx'
with pd.ExcelWriter(output_file) as writer:
    test_comparison_model1.to_excel(writer, sheet_name='Результаты модели 1', index=False)
    metrics_model1.to_excel(writer, sheet_name='Метрики модели 1', index=False)
    test_comparison_model2.to_excel(writer, sheet_name='Результаты модели 2', index=False)
    metrics_model2.to_excel(writer, sheet_name='Метрики модели 2', index=False)

In [560]:
# Выводим результат
print("Результаты и метрики первой модели:")
print(test_comparison_model1)
print(metrics_model1)

print("\nРезультаты и метрики второй модели:")
print(test_comparison_model2)
print(metrics_model2)

Результаты и метрики первой модели:
    yn  y_pred_py
0   29  26.978527
1   32  27.683024
2   28  30.103170
3   25  26.580704
4   34  26.116438
5   20  26.833790
6   27  25.907451
7   26  26.952984
8   22  23.145317
9   24  22.595149
10  25  25.826491
11  23  27.208701
12  26  23.955196
13  22  25.964867
14  25  26.477253
15  26  23.962733
16  26  26.860125
17  23  25.520234
  Метрика   Значение
0    MAPE  10.329128
1    RMSE   3.296503

Результаты и метрики второй модели:
      yn  y_pred_statistica
0   23.0          27.702175
1   26.0          30.755269
2   24.0          24.884095
3   26.0          26.942281
4   24.0          25.423945
5   32.0          27.054382
6   23.0          27.913878
7   23.0          22.882453
8   25.0          25.412519
9   23.0          26.491733
10  22.0          25.137818
11  27.0          24.919882
12  24.0          25.969596
13  24.0          25.460319
14  25.0          26.459716
15  22.0          24.134501
16  23.0          28.203583
17  32.0          