In [1]:
# # Установка XGBoost
# !pip install xgboost

# # Установка CatBoost
# !pip install catboost

# # Установка TensorFlow
# !pip install tensorflow

# # Установка Scikeras 
# !pip install scikeras

In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from lightgbm import LGBMRegressor
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error
import numpy as np 

In [3]:
# Чтение DataFrame
df_models = pd.read_csv("данные для моделей.csv")
print("DataFrame 'данные для моделей.csv' успешно загружен.")
  

DataFrame 'данные для моделей.csv' успешно загружен.


In [4]:
#Подготовка данных для IC50
# Целевая переменная для IC50
target_ic50 = 'log_IC50, mM'

# Признаки (X) и целевая переменная (y)
# Исключаем другие целевые переменные из признаков
X = df_models.drop(columns=['log_IC50, mM', 'log_CC50, mM', 'log_SI'])
y = df_models[target_ic50]

# Разделение на обучающую и тестовую выборки
# random_state для воспроизводимости
X_train_ic50, X_test_ic50, y_train_ic50, y_test_ic50 = train_test_split(
    X, y, test_size=0.2, random_state=42
)

print(f"\n--- Подготовка данных для IC50 ---")
print(f"Размер обучающей выборки (X_train_ic50): {X_train_ic50.shape}")
print(f"Размер тестовой выборки (X_test_ic50): {X_test_ic50.shape}")

# ----------------------------------------------------------------------
# 3. Настройка Pipeline и GridSearchCV
# ----------------------------------------------------------------------

# Метрики для GridSearchCV. 'neg_' означает, что GridSearchCV стремится максимизировать метрику,
# поэтому ошибки (MSE, MAE) инвертируются.
scoring_metrics = {
    'MSE': 'neg_mean_squared_error',
    'R2': 'r2',
    'MAE': 'neg_mean_absolute_error'
}

# --- Модель 1: Линейная Регрессия ---
print("\n===== Линейная Регрессия для IC50 =====")
pipeline_lr = Pipeline([
    ('scaler', StandardScaler()),
    ('regressor', LinearRegression())
])

param_grid_lr = {} # Для LinearRegression нет гиперпараметров для настройки в данном случае

grid_search_lr = GridSearchCV(
    pipeline_lr,
    param_grid_lr,
    cv=5, # 5-кратная кросс-валидация
    scoring=scoring_metrics,
    refit='R2', # Оптимизировать по R2
    n_jobs=-1, # Использовать все доступные ядра
    verbose=1 # Выводить прогресс
)

grid_search_lr.fit(X_train_ic50, y_train_ic50)

print("Лучшие параметры для Линейной Регрессии:", grid_search_lr.best_params_)
print("Лучший R2 на кросс-валидации:", grid_search_lr.best_score_)

# Оценка на тестовой выборке
y_pred_lr = grid_search_lr.predict(X_test_ic50)
mse_lr = mean_squared_error(y_test_ic50, y_pred_lr)
r2_lr = r2_score(y_test_ic50, y_pred_lr)
mae_lr = mean_absolute_error(y_test_ic50, y_pred_lr)

print("\nМетрики на тестовой выборке (Линейная Регрессия):")
print(f"MSE: {mse_lr:.4f}")
print(f"MAE: {mae_lr:.4f}")
print(f"R2: {r2_lr:.4f}")


# --- Модель 2: Random Forest Регрессор ---
print("\n===== Random Forest Регрессор для IC50 =====")
pipeline_rf = Pipeline([
    ('scaler', StandardScaler()),
    ('regressor', RandomForestRegressor(random_state=42))
])

# Гиперпараметры для настройки Random Forest
param_grid_rf = {
    'regressor__n_estimators': [50, 100, 200],
    'regressor__max_features': [0.6, 0.8, 1.0],
    'regressor__min_samples_leaf': [5, 10]
}

grid_search_rf = GridSearchCV(
    pipeline_rf,
    param_grid_rf,
    cv=5,
    scoring=scoring_metrics,
    refit='R2',
    n_jobs=-1,
    verbose=1
)

grid_search_rf.fit(X_train_ic50, y_train_ic50)

print("Лучшие параметры для Random Forest:", grid_search_rf.best_params_)
print("Лучший R2 на кросс-валидации:", grid_search_rf.best_score_)

# Оценка на тестовой выборке
y_pred_rf = grid_search_rf.predict(X_test_ic50)
mse_rf = mean_squared_error(y_test_ic50, y_pred_rf)
r2_rf = r2_score(y_test_ic50, y_pred_rf)
mae_rf = mean_absolute_error(y_test_ic50, y_pred_rf)

print("\nМетрики на тестовой выборке (Random Forest):")
print(f"MSE: {mse_rf:.4f}")
print(f"MAE: {mae_rf:.4f}")
print(f"R2: {r2_rf:.4f}")


# --- Модель 3: LightGBM Регрессор ---
print("\n===== LightGBM Регрессор для IC50 =====")
pipeline_lgbm = Pipeline([
    ('scaler', StandardScaler()),
    ('regressor', LGBMRegressor(random_state=42))
])

# Гиперпараметры для настройки LightGBM
param_grid_lgbm = {
    'regressor__n_estimators': [100, 200, 300],
    'regressor__learning_rate': [0.01, 0.05, 0.1],
    'regressor__num_leaves': [31, 63],
    'regressor__reg_alpha': [0.1, 0.5],
    'regressor__reg_lambda': [0.1, 0.5]
}

grid_search_lgbm = GridSearchCV(
    pipeline_lgbm,
    param_grid_lgbm,
    cv=5,
    scoring=scoring_metrics,
    refit='R2',
    n_jobs=-1,
    verbose=1
)

grid_search_lgbm.fit(X_train_ic50, y_train_ic50)

print("Лучшие параметры для LightGBM:", grid_search_lgbm.best_params_)
print("Лучший R2 на кросс-валидации:", grid_search_lgbm.best_score_)

# Оценка на тестовой выборке
y_pred_lgbm = grid_search_lgbm.predict(X_test_ic50)
mse_lgbm = mean_squared_error(y_test_ic50, y_pred_lgbm)
r2_lgbm = r2_score(y_test_ic50, y_pred_lgbm)
mae_lgbm = mean_absolute_error(y_test_ic50, y_pred_lgbm)

print("\nМетрики на тестовой выборке (LightGBM):")
print(f"MSE: {mse_lgbm:.4f}")
print(f"MAE: {mae_lgbm:.4f}")
print(f"R2: {r2_lgbm:.4f}")

# ----------------------------------------------------------------------
# Модель 4: XGBoost Regressor
# ----------------------------------------------------------------------
print("\n===== XGBoost Регрессор для IC50 =====")
from xgboost import XGBRegressor

pipeline_xgb = Pipeline([
    ('scaler', StandardScaler()),
    ('regressor', XGBRegressor(random_state=42, eval_metric='rmse')) # eval_metric для предотвращения предупреждений
])

# Гиперпараметры для настройки XGBoost
param_grid_xgb = {
    'regressor__n_estimators': [100, 200, 300],
    'regressor__learning_rate': [0.01, 0.05, 0.1],
    'regressor__max_depth': [3, 5, 7],
    'regressor__subsample': [0.7, 1.0], # Доля выборок для обучения деревьев
    'regressor__colsample_bytree': [0.7, 1.0] # Доля признаков для каждого дерева
}

grid_search_xgb = GridSearchCV(
    pipeline_xgb,
    param_grid_xgb,
    cv=5,
    scoring=scoring_metrics,
    refit='R2',
    n_jobs=-1,
    verbose=1
)

grid_search_xgb.fit(X_train_ic50, y_train_ic50)

print("Лучшие параметры для XGBoost:", grid_search_xgb.best_params_)
print("Лучший R2 на кросс-валидации:", grid_search_xgb.best_score_)

# Оценка на тестовой выборке
y_pred_xgb = grid_search_xgb.predict(X_test_ic50)
mse_xgb = mean_squared_error(y_test_ic50, y_pred_xgb)
r2_xgb = r2_score(y_test_ic50, y_pred_xgb)
mae_xgb = mean_absolute_error(y_test_ic50, y_pred_xgb)

print("\nМетрики на тестовой выборке (XGBoost):")
print(f"MSE: {mse_xgb:.4f}")
print(f"MAE: {mae_xgb:.4f}")
print(f"R2: {r2_xgb:.4f}")


# ----------------------------------------------------------------------
# Модель 5: CatBoost Regressor
# ----------------------------------------------------------------------
print("\n===== CatBoost Регрессор для IC50 =====")
from catboost import CatBoostRegressor

pipeline_cat = Pipeline([
    ('scaler', StandardScaler()), # CatBoost менее чувствителен к масштабированию, но для пайплайна оставляем
    ('regressor', CatBoostRegressor(random_state=42, verbose=0)) # verbose=0 отключает вывод логов CatBoost
])

# Гиперпараметры для настройки CatBoost
param_grid_cat = {
    'regressor__iterations': [100, 200, 300], # Количество итераций (деревьев)
    'regressor__learning_rate': [0.01, 0.05, 0.1],
    'regressor__depth': [4, 6, 8], # Глубина деревьев
    'regressor__l2_leaf_reg': [1, 3, 5] # L2 регуляризация
}

grid_search_cat = GridSearchCV(
    pipeline_cat,
    param_grid_cat,
    cv=5,
    scoring=scoring_metrics,
    refit='R2',
    n_jobs=-1,
    verbose=1
)

grid_search_cat.fit(X_train_ic50, y_train_ic50)

print("Лучшие параметры для CatBoost:", grid_search_cat.best_params_)
print("Лучший R2 на кросс-валидации:", grid_search_cat.best_score_)

# Оценка на тестовой выборке
y_pred_cat = grid_search_cat.predict(X_test_ic50)
mse_cat = mean_squared_error(y_test_ic50, y_pred_cat)
r2_cat = r2_score(y_test_ic50, y_pred_cat)
mae_cat = mean_absolute_error(y_test_ic50, y_pred_cat)

print("\nМетрики на тестовой выборке (CatBoost):")
print(f"MSE: {mse_cat:.4f}")
print(f"MAE: {mae_cat:.4f}")
print(f"R2: {r2_cat:.4f}")

# Модель 6: Простая Нейронная Сеть (Keras Sequential)
# ----------------------------------------------------------------------
print("\n===== Простая Нейронная Сеть для IC50 =====")

from tensorflow import keras
from tensorflow.keras import layers as L
from scikeras.wrappers import KerasRegressor

# Функция для создания Keras-модели
# Параметры, которые мы хотим тюнить через GridSearchCV, должны быть аргументами этой функции.
def build_nn_model(meta, hidden_layers=1, neurons=32, activation='relu',
                   optimizer='adam', learning_rate=0.001):
    n_features = meta["n_features_in_"]
    
    model = keras.Sequential()
    model.add(L.Input(shape=(n_features,)))
    
    for _ in range(hidden_layers):
        model.add(L.Dense(neurons, activation=activation))
        
    model.add(L.Dense(1)) # Выходной слой для регрессии (1 нейрон, без активации)
    
    # Создаем экземпляр оптимизатора с указанной скоростью обучения
    if optimizer == 'adam':
        opt = keras.optimizers.Adam(learning_rate=learning_rate)
    elif optimizer == 'rmsprop':
        opt = keras.optimizers.RMSprop(learning_rate=learning_rate)
    else:
        opt = keras.optimizers.Adam(learning_rate=learning_rate) # По умолчанию Adam

    model.compile(optimizer=opt, loss='mean_squared_error')
    return model

# Здесь мы правильно указываем KerasRegressor
pipeline_nn = Pipeline([
    ('scaler', StandardScaler()),
    ('regressor', KerasRegressor(
        model=build_nn_model,
        # Задаем дефолтные значения для KerasRegressor, они будут переопределяться GridSearchCV
        # Важно: эти параметры должны быть аргументами build_nn_model
        hidden_layers=1,
        neurons=32,
        activation='relu',
        optimizer='adam',
        learning_rate=0.001,
        batch_size=32, # batch_size и epochs - это параметры .fit(), а не .build_model()
        epochs=50,
        verbose=0,
        random_state=42
    ))
])

# Гиперпараметры для настройки Нейронной Сети
# Теперь параметры указываются с префиксом 'regressor__' для шага 'regressor' в пайплайне
# Эти параметры будут переданы в конструктор KerasRegressor, который затем передаст их в build_nn_model.
param_grid_nn = {
    'regressor__hidden_layers': [1, 2],
    'regressor__neurons': [32, 64],
    'regressor__activation': ['relu'],
    'regressor__optimizer': ['adam'],
    'regressor__learning_rate': [0.001, 0.01],
    'regressor__batch_size': [32, 64],
    'regressor__epochs': [50, 100]
}

grid_search_nn = GridSearchCV(
    pipeline_nn,
    param_grid_nn,
    cv=3,
    scoring=scoring_metrics,
    refit='R2',
    n_jobs=-1,
    verbose=1
)

grid_search_nn.fit(X_train_ic50, y_train_ic50)

print("Лучшие параметры для Нейронной Сети:", grid_search_nn.best_params_)
print("Лучший R2 на кросс-валидации:", grid_search_nn.best_score_)

# Оценка на тестовой выборке
y_pred_nn = grid_search_nn.predict(X_test_ic50)
mse_nn = mean_squared_error(y_test_ic50, y_pred_nn)
r2_nn = r2_score(y_test_ic50, y_pred_nn)
mae_nn = mean_absolute_error(y_test_ic50, y_pred_nn)

print("\nМетрики на тестовой выборке (Нейронная Сеть):")
print(f"MSE: {mse_nn:.4f}")
print(f"MAE: {mae_nn:.4f}")
print(f"R2: {r2_nn:.4f}")


--- Подготовка данных для IC50 ---
Размер обучающей выборки (X_train_ic50): (773, 68)
Размер тестовой выборки (X_test_ic50): (194, 68)

===== Линейная Регрессия для IC50 =====
Fitting 5 folds for each of 1 candidates, totalling 5 fits
Лучшие параметры для Линейной Регрессии: {}
Лучший R2 на кросс-валидации: 0.2813431323334865

Метрики на тестовой выборке (Линейная Регрессия):
MSE: 0.5935
MAE: 0.6009
R2: 0.2753

===== Random Forest Регрессор для IC50 =====
Fitting 5 folds for each of 18 candidates, totalling 90 fits
Лучшие параметры для Random Forest: {'regressor__max_features': 0.6, 'regressor__min_samples_leaf': 5, 'regressor__n_estimators': 200}
Лучший R2 на кросс-валидации: 0.4292621189253373

Метрики на тестовой выборке (Random Forest):
MSE: 0.4616
MAE: 0.5325
R2: 0.4364

===== LightGBM Регрессор для IC50 =====
Fitting 5 folds for each of 72 candidates, totalling 360 fits
[LightGBM] [Info] Auto-choosing col-wise multi-threading, the overhead of testing was 0.000734 seconds.
You ca



Лучшие параметры для Нейронной Сети: {'regressor__activation': 'relu', 'regressor__batch_size': 64, 'regressor__epochs': 50, 'regressor__hidden_layers': 2, 'regressor__learning_rate': 0.001, 'regressor__neurons': 32, 'regressor__optimizer': 'adam'}
Лучший R2 на кросс-валидации: 0.3641236628320949

Метрики на тестовой выборке (Нейронная Сеть):
MSE: 0.5917
MAE: 0.5947
R2: 0.2775


Анализ по каждой модели
1. Линейная Регрессия
R2 на кросс-валидации: 0.2813
R2 на тестовой выборке: 0.2753
MSE: 0.5935, MAE: 0.6009
Вывод: Линейная регрессия показала наихудшие результаты. Это говорит о том, что отношения между вашими химическими дескрипторами и IC50, вероятно, не являются чисто линейными. Модель не смогла уловить более сложные закономерности. Это подтверждает целесообразность использования более сложных, нелинейных моделей, таких как древовидные алгоритмы.

2. Random Forest Регрессор
Лучшие параметры: max_features=0.6, min_samples_leaf=5, n_estimators=200
R2 на кросс-валидации: 0.4293
R2 на тестовой выборке: 0.4364
MSE: 0.4616, MAE: 0.5325
Вывод: Random Forest показал значительно лучшие результаты, чем Линейная Регрессия, что подтверждает наличие нелинейных связей. R2 на тестовой выборке (0.4364) довольно близок к R2 на кросс-валидации, что указывает на хорошую обобщающую способность и отсутствие сильного переобучения. Это надёжная модель, которая неплохо справляется.

3. LightGBM Регрессор
Лучшие параметры: learning_rate=0.01, n_estimators=300, num_leaves=31, reg_alpha=0.5, reg_lambda=0.1
R2 на кросс-валидации: 0.4253
R2 на тестовой выборке: 0.3758
MSE: 0.5112, MAE: 0.5697
Вывод: Результаты LightGBM на кросс-валидации (0.4253) сопоставимы с Random Forest, но R2 на тестовой выборке (0.3758) заметно ниже, чем на CV и ниже, чем у Random Forest и XGBoost. Это может указывать на небольшое переобучение на обучающей выборке во время кросс-валидации или на то, что найденные параметры не так хорошо обобщаются на полностью новые данные, как в случае с Random Forest.

Предупреждения LightGBM: Многократные предупреждения [LightGBM] [Warning] No further splits with positive gain, best gain: -inf указывают на то, что модель не всегда могла найти выгодные расщепления для построения деревьев. Это может происходить, когда:
* Данные очень шумные или не содержат достаточно сильных сигналов.
* Параметры регуляризации слишком строгие.
* Либо модель быстро достигает минимума ошибки и дальнейшее добавление деревьев не дает значимого улучшения, либо ей не хватает данных для более точных расщеплений.

4. XGBoost Регрессор
Лучшие параметры: colsample_bytree=0.7, learning_rate=0.05, max_depth=3, n_estimators=200, subsample=0.7
R2 на кросс-валидации: 0.4438
R2 на тестовой выборке: 0.4559
MSE: 0.4456, MAE: 0.5267
Вывод: XGBoost является лучшей моделью по всем метрикам на тестовой выборке. Его R2 (0.4559) самый высокий, а MSE и MAE — самые низкие. Это подтверждает его репутацию мощного и универсального алгоритма. R2 на тестовой выборке даже немного выше, чем на кросс-валидации, что является хорошим знаком и говорит об отличной обобщающей способности.

5. CatBoost Регрессор
Лучшие параметры: depth=6, iterations=200, l2_leaf_reg=1, learning_rate=0.05
R2 на кросс-валидации: 0.4530
R2 на тестовой выборке: 0.4266
MSE: 0.4696, MAE: 0.5395
Вывод: CatBoost показал самый высокий R2 на кросс-валидации (0.4530), но на тестовой выборке немного уступил XGBoost (0.4266 против 0.4559). Это может указывать на небольшое переобучение во время кросс-валидации, где CatBoost смог найти чуть более точные параметры для обучающих фолдов, но они не так хорошо сработали на полностью новых данных. Тем не менее, это по-прежнему очень хорошая модель, вторая по результативности на тестовой выборке.

Ключевые выводы и рекомендации:
XGBoost — победитель: На основе предоставленных метрик, XGBoostRegressor показал лучшую производительность на тестовой выборке для предсказания IC50. Это сильный кандидат для вашей окончательной модели.
Древовидные модели превосходят линейные: Значительный отрыв R2 у Random Forest, LightGBM, XGBoost и CatBoost от Линейной Регрессии явно указывает на нелинейный характер зависимости между вашими химическими признаками и IC50.
LightGBM требует внимания: Его снижение R2 на тестовой выборке по сравнению с CV и конкурентами указывает на то, что, возможно, требуются дополнительная тонкая настройка параметров регуляризации (например, num_leaves или min_child_samples) или использование ранней остановки (early_stopping_rounds) при обучении, чтобы избежать переобучения. Также, эти предупреждения могут свидетельствовать о том, что для ваших данных LightGBM, возможно, не идеален, или что вы слишком сильно его регуляризуете.
Количество признаков (68): Ваши 68 отобранных признаков оказались вполне адекватными для построения моделей. Вам не потребовалось дополнительное снижение размерности с помощью PCA, что сохранило интерпретируемость ваших признаков. Это очень ценно в химии.
Следующие шаги:
Окончательный выбор модели: Я бы сосредоточился на XGBoost как на вашей основной модели.
Изучение важности признаков: Для XGBoost (или Random Forest) вы можете извлечь важность признаков. Это позволит вам увидеть, какие из 68 химических дескрипторов оказывают наибольшее влияние на предсказание IC50. Это будет очень ценно для химической интерпретации.
Анализ остатков: Проверьте остатки вашей лучшей модели (XGBoost):
Распределение остатков: Должно быть близко к нормальному и центрировано около нуля.
График остатков против предсказанных значений: Не должно быть никаких видимых паттернов (например, формы веера), что указывает на гомоскедастичность.
Дополнительная оптимизация гиперпараметров: Хотя GridSearchCV уже проделал большую работу, иногда можно добиться небольшого улучшения, используя Bayesian Optimization (например, с optuna или hyperopt) для более эффективного исследования пространства параметров, особенно для LightGBM и CatBoost.
Попробовать ансамбли: Иногда объединение предсказаний нескольких лучших моделей (например, XGBoost и CatBoost) может дать небольшое, но стабильное улучшение.

Анализ результатов Простой Нейронной Сети для IC50
Лучшие параметры: 'activation': 'relu', 'batch_size': 64, 'epochs': 50, 'hidden_layers': 2, 'learning_rate': 0.001, 'neurons': 32, 'optimizer': 'adam'
Лучший R2 на кросс-валидации: 0.3641
Метрики на тестовой выборке:
MSE: 0.5917
MAE: 0.5947
R2: 0.2775
Выводы и сравнение:
Производительность на тестовой выборке:

R2 Нейронной Сети на тестовой выборке (0.2775) оказался самым низким среди всех моделей, за исключением Линейной Регрессии (которая была 0.2753). По сути, она показала результат, сопоставимый с простой линейной моделью.
Это значительно ниже, чем у Random Forest (0.4364), XGBoost (0.4559) и CatBoost (0.4266).
Разрыв между CV и тестовой выборкой:

R2 на кросс-валидации (0.3641) заметно выше, чем R2 на тестовой выборке (0.2775). Это указывает на некоторое переобучение нейронной сети на тренировочных данных. Она смогла хорошо подстроиться под паттерны в обучающих фолдах, но не так хорошо обобщилась на абсолютно новые данные.
Предупреждение UserWarning: A worker stopped...:

Это предупреждение joblib (который используется GridSearchCV) часто указывает на проблемы с памятью или слишком короткий таймаут для воркеров. Нейронные сети, особенно при переборе гиперпараметров, могут потреблять значительные ресурсы, что подтверждает ваши предыдущие наблюдения о CatBoost. Возможно, некоторым комбинациям параметров не хватило памяти, и процессы-воркеры завершались.
Почему НН может не показывать лучшую производительность?
Несмотря на то, что нейронные сети очень мощные, они не всегда являются "серебряной пулей" для табличных данных, особенно если:

Размер данных: Ваш набор данных (773 обучающих примера, 68 признаков) относительно небольшой для того, чтобы НН раскрыла весь свой потенциал. НН часто требуют очень больших объемов данных для эффективного обучения и предотвращения переобучения.
Архитектура и гиперпараметры: "Простая" нейронная сеть с 2 скрытыми слоями и 32 нейронами, возможно, недостаточно сложна или, наоборот, слишком сложна для вашего набора данных и задачи. Поиск оптимальной архитектуры (количество слоев, нейронов), а также гиперпараметров (learning rate, активационные функции, регуляризация, dropouts) для НН — это сложный итеративный процесс.
Регуляризация: В отличие от градиентного бустинга, НН требуют более явного и тщательного применения методов регуляризации (dropout, L1/L2 регуляризация, ранняя остановка), чтобы справиться с переобучением, особенно на небольших данных. В ваших лучших параметрах нет явных регуляризаторов, кроме epochs=50 и batch_size=64.
Сравнение с бустингом: Для табличных данных, градиентные бустинговые деревья (XGBoost, CatBoost, LightGBM) часто превосходят простые нейронные сети "из коробки" или требуют значительно меньше усилий по тонкой настройке для достижения хороших результатов. Их ансамблевая природа и последовательное обучение делают их очень эффективными.
Рекомендации:
Приоритет моделей: Основываясь на текущих результатах, XGBoost по-прежнему является вашей лучшей моделью. Random Forest и CatBoost также показали очень хорошие результаты. Нейронная сеть пока отстает.
Стоит ли продолжать с НН?:
Если у вас есть много времени и вычислительных ресурсов, и вы заинтересованы в глубоком изучении НН, вы можете попробовать более тонкую настройку (больше комбинаций параметров для GridSearchCV, добавление Dropout, изменение архитектуры).
Однако, если цель — получить лучшую модель как можно быстрее и эффективнее, сосредоточьтесь на XGBoost. Учитывая, что вы уже столкнулись с проблемами ресурсов, вкладывать больше усилий в НН на этом этапе может быть неоптимально.
В случае необходимости НН:
Рассмотрите использование ранней остановки (callbacks=[EarlyStopping(...)]) при обучении, чтобы избежать переобучения.
Попробуйте Dropout-слои для регуляризации.
Используйте более широкий диапазон значений для learning_rate и epochs.
Возможно, увеличение neurons или hidden_layers может помочь, но также увеличит риск переобучения и потребление ресурсов.
Ваши результаты четко показывают, что для вашей задачи и данных, градиентные бустинговые модели (особенно XGBoost) справляются значительно лучше, чем выбранная конфигурация простой нейронной сети.