---------------------------------------------------------------------------------------------------------------------------

## 3. MOP

### 3.1. Librerías

In [1]:
# =============================================================================
# 3. MOP - Modelo de Optimización y Prognosis
# =============================================================================

# Librerías necesarias
import os
import re  # Import the regular expression module

import pandas as pd
import numpy as np
import math
from math import ceil

import matplotlib
matplotlib.use('TKAgg')
import matplotlib.pyplot as plt
from matplotlib.ticker import ScalarFormatter
import seaborn as sns

import warnings

# Preprocesamiento y modelado
from sklearn.preprocessing import LabelEncoder, OneHotEncoder, StandardScaler, MinMaxScaler, RobustScaler
from sklearn.multioutput import MultiOutputRegressor
from sklearn.model_selection import train_test_split, cross_val_score, GridSearchCV
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error

from sklearn.cross_decomposition import PLSRegression
from sklearn.linear_model import LinearRegression
from sklearn.gaussian_process import GaussianProcessRegressor
from sklearn.gaussian_process.kernels import RBF, WhiteKernel, ConstantKernel as C
from sklearn.impute import SimpleImputer, KNNImputer
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR

from sklearn.inspection import permutation_importance
from sklearn.exceptions import ConvergenceWarning

from skopt import BayesSearchCV
from skopt.space import Real

### 3.2. Cargar y convertir los datos preprocesados en matrices X, M y P

In [2]:
# Definir las rutas base y de las carpetas
base_path = os.getcwd()  # Se asume que el notebook se ejecuta desde la carpeta 'MOP'
db_path = os.path.join(base_path, "DB_MOP")
fig_path = os.path.join(base_path, "Figuras_MOP")
model_path = os.path.join(base_path, "Modelos_MOP")

# Ruta al archivo de la base de datos
data_file = os.path.join(db_path, "design_DB_preprocessed_200_Optimizado.csv")
print(data_file)

# Ruta al archivo de las figuras
figure_path = os.path.join(fig_path, "200_MOT_Optimizado")
print(figure_path)

# Ruta al archivo de los modelos
modelo_path = os.path.join(model_path, "200_MOT_Optimizado")
print(modelo_path)

C:\Users\s00244\Documents\GitHub\MotorDesignDataDriven\Notebooks\3.MOP\DB_MOP\design_DB_preprocessed_200_Optimizado.csv
C:\Users\s00244\Documents\GitHub\MotorDesignDataDriven\Notebooks\3.MOP\Figuras_MOP\200_MOT_Optimizado
C:\Users\s00244\Documents\GitHub\MotorDesignDataDriven\Notebooks\3.MOP\Modelos_MOP\200_MOT_Optimizado


In [3]:
# Lectura del archivo CSV
try:
    df = pd.read_csv(data_file)
    print("Archivo cargado exitosamente.")
except FileNotFoundError:
    print("Error: Archivo no encontrado. Revisa la ruta del archivo.")
except pd.errors.ParserError:
    print("Error: Problema al analizar el archivo CSV. Revisa el formato del archivo.")
except Exception as e:
    print(f"Ocurrió un error inesperado: {e}")

# Función para limpiar nombres de archivo inválidos
def clean_filename(name):
    return re.sub(r'[\\/*?:"<>|]', "_", name)

Archivo cargado exitosamente.


In [4]:
# Separa las columnas en matrices X, M y P
X_cols = [col for col in df.columns if col.startswith('x')]
M_cols = [col for col in df.columns if col.startswith('m')]
P_cols = [col for col in df.columns if col.startswith('p')]

X = df[X_cols].copy()
M = df[M_cols].copy()
P = df[P_cols].copy()

# Transforma todos los datos de X, M y P a numéricos
for col in X.columns:
    X[col] = pd.to_numeric(X[col], errors='coerce')

for col in M.columns:
    M[col] = pd.to_numeric(M[col], errors='coerce')

for col in P.columns:
    P[col] = pd.to_numeric(P[col], errors='coerce')

### 3.3. Entrenamiento para cada modelo.

In [5]:
# Las variables de salida se toman de la matriz P. Se eliminan 'p2::Tnom' y 'p3::nnom'
outputs = [col for col in P.columns]
if 'p2::Tnom' in outputs: outputs.remove('p2::Tnom')
if 'p3::nnom' in outputs: outputs.remove('p3::nnom')

# Concatena las matrices X y M
X_M = pd.concat([X, M], axis=1)

# Las entradas serán el resto de las columnas (tanto X como M)
features = [col for col in X_M.columns]

print("Variables de entrada:", features)
print("Variables de salida:", outputs)

X = df[features]
Y = df[outputs]    

Variables de entrada: ['x1::OSD', 'x2::Dint', 'x3::L', 'x4::tm', 'x5::hs2', 'x6::wt', 'x7::Nt', 'x8::Nh', 'm1::Drot', 'm2::Dsh', 'm3::he', 'm4::Rmag', 'm5::Rs', 'm6::GFF']
Variables de salida: ['p1::W', 'p4::GFF', 'p5::BSP_T', 'p6::BSP_n', 'p7::BSP_Mu', 'p8::MSP_n', 'p9::UWP_Mu']


In [6]:
# Escalado de datos
# Se utiliza StandardScaler para normalizar los datos (importante para algunos modelos)
scaler_X = StandardScaler()
X_scaled = scaler_X.fit_transform(X)  # Datos de entrada escalados

scaler_Y = StandardScaler()
Y_scaled = scaler_Y.fit_transform(Y)  # Datos de salida escalados


In [7]:
# =============================================================================
# Separamos los conjuntos de datos en entrenamiento y test.
# =============================================================================
# Separar conjuntos de entrenamiento y prueba (80% / 20%)
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=42)

# Para asegurar que los DataFrames tengan índices consecutivos, se reinician
X_train = X_train.reset_index(drop=True)
X_test  = X_test.reset_index(drop=True)
Y_train = Y_train.reset_index(drop=True)
Y_test  = Y_test.reset_index(drop=True)

# También, para los datos escalados (se convierten a DataFrame para conservar nombres de columnas)
X_train_scaled = pd.DataFrame(scaler_X.transform(X_train), columns=X_train.columns)
X_test_scaled  = pd.DataFrame(scaler_X.transform(X_test), columns=X_test.columns)

Y_train_scaled = pd.DataFrame(scaler_Y.transform(Y_train), columns=Y_train.columns)
Y_test_scaled  = pd.DataFrame(scaler_Y.transform(Y_test), columns=Y_test.columns)

# Crear DataFrames para el conjunto completo escalado (usado en reentrenamiento final)
X_scaled_df = pd.DataFrame(scaler_X.transform(X), columns=X.columns, index=X.index)
Y_scaled_df = pd.DataFrame(scaler_Y.transform(Y), columns=Y.columns, index=Y.index)

### 3.4. Funciones de Cálculo (Algoritmos y Componentes)

In [8]:
# =============================================================================
# Funciones de cálculo
# =============================================================================
def compute_CoP(y_true, y_pred):
    """
    Calcula el Coefficient of Prognosis (CoP) usando la fórmula:
      CoP = (Pearson_corr(y_true, y_pred))^2
    Se convierte y_true y y_pred a arrays NumPy para evitar ambigüedades.
    Si la desviación estándar de alguno es 0, retorna NaN.
    """
    y_true_arr = np.array(y_true)
    y_pred_arr = np.array(y_pred)
    if np.std(y_true_arr, axis=0) == 0 or np.std(y_pred_arr, axis=0) == 0:
        return np.nan
    r = np.corrcoef(y_true_arr, y_pred_arr)[0, 1]
    return r ** 2

def compute_standardized_coefficients(model, X, y):
    """
    Para modelos lineales (con atributo coef_), calcula los coeficientes
    estandarizados según:
      coef_std = coef * (std(X) / std(y))
    """
    coef = model.coef_.ravel()
    std_X = X.std().values
    std_y = y.std()
    return coef * std_X / std_y

def compute_pij(model, X):
    """
    Calcula el parámetro p_ij para un modelo entrenado.
    Para cada variable de entrada (columna en X), calcula la correlación de Pearson entre
    las predicciones del modelo (ŷ) y esa variable.
    
    Se utiliza la fórmula:
      p_ij = (1/(N-1)) * Σ((ŷ(k) - μ_ŷ)(x_j(k) - μ_xj)) / (σ_ŷ σ_xj)
    
    Si la variable es constante (σ=0), se asigna NaN.
    Si X no es un DataFrame, se convierte a DataFrame.
    """
    # Asegurarse de que X sea un DataFrame
    if not isinstance(X, pd.DataFrame):
        n_features = X.shape[1]
        X = pd.DataFrame(X, columns=[f"feature_{i}" for i in range(n_features)])
    
    # Obtener las predicciones del modelo y aplanarlas
    y_pred = model.predict(X)
    if y_pred.ndim > 1:
        y_pred = y_pred.ravel()
    
    pij = []
    for col in X.columns:
        x_j = X[col]
        if x_j.std() == 0:
            pij.append(np.nan)
        else:
            corr = np.corrcoef(y_pred, x_j)[0, 1]
            pij.append(corr)
    return np.array(pij)

def compute_permutation_importance(model, X, y):
    """
    Para modelos complejos, calcula la importancia de cada variable mediante
    permutación. Devuelve la media de la importancia en n_repeats.
    """
    result = permutation_importance(model, X, y, scoring="r2", n_repeats=10, random_state=0)
    return result.importances_mean

def plot_heatmap(matrix, col_labels, row_labels, title, ax=None):
    """
    Dibuja un mapa de calor de la matriz usando seaborn.
    'col_labels' son las etiquetas de las columnas y 'row_labels' las de las filas.
    Si se especifica 'ax', se dibuja en ese subplot; de lo contrario, crea uno nuevo.
    """
    if ax is None:
        fig, ax = plt.subplots()
    sns.heatmap(matrix, annot=True, fmt=".2f", xticklabels=col_labels,
                yticklabels=row_labels, cmap="viridis", ax=ax)
    ax.set_title(title)
    return ax

### 3.5. Definir y Entrenar los Modelos Subrogados

In [9]:
# =============================================================================
# Preparamos el modelo PLS calculando sus componentes óptimos
# =============================================================================

n_features = X_train_scaled.shape[1]

# Para PLS, se determina el número óptimo de componentes mediante validación cruzada
mse_pls = []
componentes = np.arange(1, min(len(X.columns), 20))
for n in componentes:
    pls_temp = PLSRegression(n_components=n)
    scores = cross_val_score(pls_temp, X_train_scaled, Y_train_scaled, cv=5, scoring='neg_mean_squared_error')
    mse_pls.append(-scores.mean())
n_componentes_optimos = componentes[np.argmin(mse_pls)]
print(f'El número óptimo de componentes para modelar PLS es: {n_componentes_optimos}')

El número óptimo de componentes para modelar PLS es: 9


In [10]:
'''
# =============================================================================
# Hacemos un estudio preliminar (Script completo) para determinar los 
# hiperparámetros que del modelo Kriging que mejor se adaptan a estos datos.
# =============================================================================

X = df[features]
y = df[outputs]

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
y_scaled  = scaler.fit_transform(y)

# Dividir los datos y escalar X (GPR es sensible a la escala)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_scaled, test_size=0.2, random_state=42)

# Instanciar el modelo GPR sin reinicios en el optimizador ya que BayesSearchCV se encargará de buscar
kernel = RBF(length_scale=1.0, length_scale_bounds=(1e-2, 1e3)) + \
         WhiteKernel(noise_level=1e-3, noise_level_bounds=(1e-8, 1e+2))
gpr = GaussianProcessRegressor(kernel=kernel, random_state=42, n_restarts_optimizer=0)

'''
'''
# Usamos los parámetros obtenidos en un primer entrenamiento:
kernel = RBF(length_scale=1.12, length_scale_bounds=(1e-2, 1e3)) + \
         WhiteKernel(noise_level=0.035, noise_level_bounds=(1e-8, 1e+7))
gpr = GaussianProcessRegressor(kernel=kernel, random_state=42, n_restarts_optimizer=10)
'''
'''
# Definir el espacio de búsqueda para los hiperparámetros del kernel.
# La notación "kernel__k1__length_scale" y "kernel__k2__noise_level" es la que usa scikit-learn
# para acceder a los parámetros del kernel compuesto (k1 corresponde a RBF y k2 a WhiteKernel).
param_space = {
    "kernel__k1__length_scale": Real(1e-2, 1e3, prior="log-uniform"),
    "kernel__k2__noise_level": Real(1e-8, 1e+2, prior="log-uniform")
}
# Configurar la optimización bayesiana con BayesSearchCV
opt = BayesSearchCV(
    estimator=gpr,
    search_spaces=param_space,
    n_iter=50,           # número de iteraciones de búsqueda
    cv=3,                # validación cruzada de 3 pliegues
    scoring="neg_mean_squared_error",
    random_state=42,
    n_jobs=-1
)

# Ejecutar la búsqueda sobre los datos escalados
opt.fit(X_train, y_train)

# Mostrar los mejores hiperparámetros encontrados
print("Mejores hiperparámetros encontrados:")
print(opt.best_params_)
print("Mejor score (neg MSE):", opt.best_score_)

# Evaluar el modelo optimizado en el conjunto de test
y_pred = opt.predict(X_test)
from sklearn.metrics import mean_squared_error, r2_score
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"MSE en test: {mse:.3e}")
print(f"R² en test: {r2:.3f}")

# Puedes también imprimir el kernel final ajustado:
print("Kernel final optimizado:")
print(opt.best_estimator_.kernel_)
'''

'\n# Definir el espacio de búsqueda para los hiperparámetros del kernel.\n# La notación "kernel__k1__length_scale" y "kernel__k2__noise_level" es la que usa scikit-learn\n# para acceder a los parámetros del kernel compuesto (k1 corresponde a RBF y k2 a WhiteKernel).\nparam_space = {\n    "kernel__k1__length_scale": Real(1e-2, 1e3, prior="log-uniform"),\n    "kernel__k2__noise_level": Real(1e-8, 1e+2, prior="log-uniform")\n}\n# Configurar la optimización bayesiana con BayesSearchCV\nopt = BayesSearchCV(\n    estimator=gpr,\n    search_spaces=param_space,\n    n_iter=50,           # número de iteraciones de búsqueda\n    cv=3,                # validación cruzada de 3 pliegues\n    scoring="neg_mean_squared_error",\n    random_state=42,\n    n_jobs=-1\n)\n\n# Ejecutar la búsqueda sobre los datos escalados\nopt.fit(X_train, y_train)\n\n# Mostrar los mejores hiperparámetros encontrados\nprint("Mejores hiperparámetros encontrados:")\nprint(opt.best_params_)\nprint("Mejor score (neg MSE):", o

In [11]:
#==============================================================================
# Kriging
# Usamos como kernel inicial los hiperparámetros del script anterior:
# - RBF(length_scale) con límites en escala logarítmica
# - WhiteKernel(noise_level) con límites amplios
#==============================================================================
kernel = RBF(length_scale=3.74, length_scale_bounds=(1e-2, 1e3)) + \
               WhiteKernel(noise_level=0.00211, noise_level_bounds=(1e-8, 100))

In [12]:
#==============================================================================
# Se definen los modelos a utilizar:
# - PLSRegression: Modelo de componentes latentes para regresión.
# - LinearRegression: Regresión lineal clásica.
# - GaussianProcessRegressor (GPR): Modelo de proceso gaussiano (Kriging), que utiliza un kernel (aquí RBF + WhiteKernel).
# - SVR: Support Vector Regression, envuelto en MultiOutputRegressor para manejar salidas unidimensionales.
# - RandomForestRegressor (RF): Modelo de ensamble basado en árboles (opcional).
#==============================================================================
models = {
    "PLS": lambda: PLSRegression(n_components=n_componentes_optimos),
    "LR": lambda: LinearRegression(),
    "GPR": lambda: GaussianProcessRegressor(kernel=kernel, random_state=42, n_restarts_optimizer=10),
    "SVR": lambda: MultiOutputRegressor(SVR(kernel='rbf')),
    "RF": lambda: RandomForestRegressor(n_estimators=100, random_state=42)
}

In [13]:
# Crear diccionarios para almacenar resultados (CoP, p_ij y predicciones)
cop_results = {output: {} for output in outputs}      # CoP para cada modelo y salida
pij_results = {output: {} for output in outputs}       # Parámetros p_ij para cada modelo y salida
predictions = {output: {} for output in outputs}        # Predicciones en test para cada modelo y salida 

In [14]:
#==============================================================================
# Se entrenan los modelos por separado.
#==============================================================================
# --- PLS (componentes optimizados) ---
model_PLS = PLSRegression(n_components = n_componentes_optimos)
model_PLS.fit(X_train_scaled, Y_train_scaled)
predicciones_test_pls = model_PLS.predict(X_test_scaled)

# --- Regresión lineal (LR) ---
model_LR = LinearRegression()
model_LR.fit(X_train_scaled, Y_train_scaled)
predicciones_test_lr = model_LR.predict(X_test_scaled)

# --- KRIGING (GPR) ---
kernel = RBF(length_scale=3.74, length_scale_bounds=(1e-2, 1e3)) + \
               WhiteKernel(noise_level=0.00211, noise_level_bounds=(1e-8, 100))
model_kriging = GaussianProcessRegressor(kernel=kernel, random_state=42, n_restarts_optimizer=10)
model_kriging.fit(X_train_scaled, Y_train_scaled)
predicciones_test_kriging = model_kriging.predict(X_test_scaled)

# --- Modelo Support Vector Regression (SVR) --- 
model_svr = MultiOutputRegressor(SVR(kernel='rbf', C=1.0, epsilon=0.1))
model_svr.fit(X_train_scaled, Y_train_scaled)
predicciones_test_svr = model_svr.predict(X_test_scaled)

# --- Modelo Random Forest (RF)---
model_rf = RandomForestRegressor(n_estimators=100, random_state=42)
model_rf.fit(X_train_scaled, Y_train_scaled)
predicciones_test_rf = model_rf.predict(X_test_scaled)


In [15]:
# =============================================================================
# Definir modelos subrogados
# =============================================================================
# Entrenar cada modelo para cada variable de salida
# Se usa X_train_scaled y Y_train_scaled para entrenar modelos sensibles a la escala.
# Entrenamiento de modelos para cada variable de salida
for output in outputs:
    # Extraer la salida (asegurarse de trabajar con datos escalados)
    y_train_output = Y_train_scaled[output]
    y_test_output  = Y_test_scaled[output]
    
    # Si la variable de salida es constante, se salta
    if float(y_train_output.std()) == 0:
        print(f"Skipping output {output} because it is constant.")
        continue
    
    for model_name, model_constructor in models.items():
        model = model_constructor()
        try:
            # Para SVR (envuelto en MultiOutputRegressor), la salida se redimensiona a 2D
            if model_name == "SVR":
                model.fit(X_train_scaled, y_train_output.values.reshape(-1, 1))
            else:
                model.fit(X_train_scaled, y_train_output)
        except Exception as e:
            print(f"Error training {model_name} for {output}: {e}")
            cop_results[output][model_name] = np.nan
            pij_results[output][model_name] = np.full(X_train_scaled.shape[1], np.nan)
            continue

        try:
            # Predicción en el conjunto de prueba (X_test_scaled ya es DataFrame)
            y_pred_test = model.predict(X_test_scaled)
            y_pred_test = np.array(y_pred_test).ravel()
            cop = compute_CoP(y_test_output, y_pred_test)
        except Exception as e:
            print(f"Error computing CoP for {model_name} on {output}: {e}")
            cop = np.nan
        cop_results[output][model_name] = cop
        predictions[output][model_name] = y_pred_test

        try:
            # Asegurarse de usar un DataFrame para calcular p_ij
            # X_train_scaled se creó como DataFrame; pero se refuerza la verificación:
            if not isinstance(X_train_scaled, pd.DataFrame):
                X_train_df = pd.DataFrame(X_train_scaled, columns=X_train.columns)
            else:
                X_train_df = X_train_scaled.copy()
            pij = compute_pij(model, X_train_df)
        except Exception as e:
            print(f"Error computing p_ij for {model_name} on {output}: {e}")
            pij = np.full(X_train_scaled.shape[1], np.nan)
        pij_results[output][model_name] = pij

ABNORMAL: .

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
  _check_optimize_result("lbfgs", opt_res)
ABNORMAL: .

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
  _check_optimize_result("lbfgs", opt_res)
ABNORMAL: .

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
  _check_optimize_result("lbfgs", opt_res)


### 3.6. Seleccionar el Mejor Modelo para Cada Salida

In [16]:
# =============================================================================
# Comparar CoP y elegir el mejor modelo para cada variable de salida
# =============================================================================
best_models = {}
for output in outputs:
    cop_dict = cop_results[output]
    if len(cop_dict) == 0:
        continue
    best_model = max(cop_dict, key=lambda m: cop_dict[m] if not np.isnan(cop_dict[m]) else -np.inf)
    best_models[output] = best_model

print("\nMejores modelos por variable de salida:")
for output in outputs:
    best_model = best_models.get(output)
    if best_model is None:
        print(f"  {output}: No se evaluó ningún modelo (posiblemente la variable es constante o hubo error)")
    else:
        print(f"  {output}: {best_model} (CoP = {cop_results[output][best_model]:.3f})")



Mejores modelos por variable de salida:
  p1::W: GPR (CoP = 0.999)
  p4::GFF: GPR (CoP = 0.999)
  p5::BSP_T: GPR (CoP = 0.986)
  p6::BSP_n: GPR (CoP = 0.940)
  p7::BSP_Mu: GPR (CoP = 0.935)
  p8::MSP_n: GPR (CoP = 0.890)
  p9::UWP_Mu: GPR (CoP = 0.841)


### 3.7. Visualización de Resultados: CoP y Mapas de Calor de p_ij

In [17]:
# =============================================================================
# Representar gráficamente los CoP de cada modelo para cada salida en subplots
# =============================================================================
n_out = len(outputs)
ncols = 3
nrows = ceil(n_out / ncols)
fig1, axes1 = plt.subplots(nrows, ncols, figsize=(12, 6*nrows))
if n_out == 1:
    axes1 = [axes1]
else:
    axes1 = axes1.flatten()
for i, output in enumerate(outputs):
    model_names = list(cop_results[output].keys())
    cop_vals = [cop_results[output][m] for m in model_names]
    ax = axes1[i]
    ax.bar(model_names, cop_vals, color="steelblue")
    ax.set_title(f"CoP for {output}", fontsize=14)
    ax.set_ylabel("CoP", fontsize=12)
    ax.set_ylim(0, 1)
    ax.grid(True, linestyle="--", alpha=0.5)
plt.tight_layout()
# Guardar la figura en la carpeta 'Figuras_MOP/(La carpeta que corresponda)'
figure_file = os.path.join(figure_path, 'CoP para cada modelo.png')
plt.savefig(figure_file, dpi =1080)
plt.close()
# plt.show()

In [18]:
# =============================================================================
# Representar los p_ij en mapas de calor: filas = features, columnas = salidas
# Se genera un heatmap para cada modelo evaluado
# =============================================================================
for model_name in models.keys():
    # Construir una matriz de p_ij: filas = features, columnas = outputs
    pij_matrix = []
    valid_outputs = []
    for output in outputs:
        if model_name in pij_results[output]:
            pij_matrix.append(pij_results[output][model_name])
            valid_outputs.append(output)
    if len(pij_matrix) == 0:
        continue
    pij_matrix = np.array(pij_matrix).T  # dimensiones: (n_features, n_outputs)
    fig, ax = plt.subplots(figsize=(10, 8))
    plot_heatmap(pij_matrix, col_labels=valid_outputs, row_labels=features,
                 title=f"Mapa de calor de p_ij para {model_name}", ax=ax)
    plt.tight_layout()
    # Guardar la figura en la carpeta 'Figuras_MOP/(La carpeta que corresponda)'
    figure_file = os.path.join(figure_path, f"Mapa de calor de p_ij para {model_name}.png")
    plt.savefig(figure_file, dpi =1080)
    plt.close()
    # plt.show()

In [19]:
# =============================================================================
# Representar el mapa de calor de la matriz de correlación de Pearson (entradas vs salidas)
# =============================================================================
pearson_matrix = np.zeros((len(features), len(outputs)))
for i, feat in enumerate(features):
    for j, out in enumerate(outputs):
        if df[feat].std() == 0 or df[out].std() == 0:
            pearson_matrix[i, j] = np.nan
        else:
            pearson_matrix[i, j] = np.corrcoef(df[feat], df[out])[0, 1]
fig, ax = plt.subplots(figsize=(10, 8))
plot_heatmap(pearson_matrix, col_labels=outputs, row_labels=features,
             title="Matriz de correlación de Pearson (entradas vs salidas)", ax=ax)
plt.tight_layout()
# Guardar la figura en la carpeta 'Figuras_MOP/(La carpeta que corresponda)'
figure_file = os.path.join(figure_path, 'Mapa de calor Pearson.png')
plt.savefig(figure_file, dpi =1080)
plt.close()
# plt.show()

### 3.8. Reentrenar con Todo el Dataset y Generar Predicciones Óptimas

In [20]:
n_out = len(outputs)
ncols = 3
nrows = ceil(n_out / ncols)
fig, axes = plt.subplots(nrows, ncols, figsize=(12, 6 * nrows))
if n_out == 1:
    axes = [axes]
else:
    axes = axes.flatten()

for i, output in enumerate(outputs):
    best_model_name = best_models.get(output, None)
    if best_model_name is None:
        print(f"Sin modelo para {output}")
        continue

    # Recupera las predicciones en escala para el mejor modelo en el test set
    y_pred_scaled = predictions[output][best_model_name]
    
    # Desescalar las predicciones usando los parámetros del scaler_Y para esa salida
    col_idx = Y.columns.get_loc(output)
    y_pred_unscaled = y_pred_scaled * 1
    
    # Valores reales sin escalar en el test set
    y_true_unscaled = Y_test[output].values
    
    # Filtrar valores válidos (sin NaN)
    mask = ~np.isnan(y_true_unscaled) & ~np.isnan(y_pred_unscaled)
    if mask.sum() == 0:
        continue
    y_true_valid = y_true_unscaled[mask]
    y_pred_valid = y_pred_unscaled[mask]
    
    # Calcular métricas en la escala original
    r2 = r2_score(y_true_valid, y_pred_valid)
    mse = mean_squared_error(y_true_valid, y_pred_valid)
    cop = compute_CoP(y_true_valid, y_pred_valid)
    
    ax = axes[i]
    ax.scatter(y_true_valid, y_pred_valid, alpha=0.6, edgecolor="k")
    ax.plot([min(y_true_valid), max(y_true_valid)],
            [min(y_true_valid), max(y_true_valid)], 'r--', lw=2)
    ax.set_xlabel("FEA Simulation", fontsize=12)
    ax.set_ylabel("Surrogate Prediction", fontsize=12)
    ax.set_title(f"{output}\nR²={r2:.3f}, CoP={cop:.3f}, MSE={mse:.3e}", fontsize=14)
    ax.grid(True, linestyle="--", alpha=0.5)

plt.tight_layout()
plt.show()

In [21]:
'''
for i, output in enumerate(outputs):
    best_model_name = best_models.get(output, None)
    if best_model_name is None:
        print(f"Sin modelo para {output}")
        continue

    # Recupera las predicciones en escala para el mejor modelo en el test set
    y_pred_scaled = predictions[output][best_model_name]
    
    # Desescalar las predicciones usando los parámetros del scaler_Y para esa salida
    col_idx = Y.columns.get_loc(output)
    y_pred_unscaled = y_pred_scaled * scaler_Y.scale_[col_idx] + scaler_Y.mean_[col_idx]
    
    # Valores reales sin escalar en el test set
    y_true_unscaled = Y_test[output].values
    
    # Filtrar valores válidos (sin NaN)
    mask = ~np.isnan(y_true_unscaled) & ~np.isnan(y_pred_unscaled)
    if mask.sum() == 0:
        continue
    y_true_valid = y_true_unscaled[mask]
    y_pred_valid = y_pred_unscaled[mask]

    # Guardamos la predicción final (ya desescalada)
    optimal_predictions[output] = y_pred_valid
    print()

# Creamos un DataFrame con las predicciones óptimas (ya en la escala original)
df_optimal = X.copy()
for output in outputs:
    if output in optimal_predictions:
        df_optimal[f"{output}_pred"] = optimal_predictions[output]
    else:
        df_optimal[f"{output}_pred"] = np.nan
'''

NameError: name 'optimal_predictions' is not defined

In [None]:
'''
# Escalamos la totalidad de X e Y
X_full_scaled = scaler_X.transform(X)  # array numpy
Y_full_scaled = scaler_Y.transform(Y)  # array numpy

# Para comodidad, los convertimos en DataFrames con nombres de columnas
X_full_scaled_df = pd.DataFrame(X_full_scaled, columns=X.columns)
Y_full_scaled_df = pd.DataFrame(Y_full_scaled, columns=Y.columns)

# =============================================================================
# Con el mejor modelo para cada salida, reentrenar con todo el dataset y generar predicciones óptimas
# =============================================================================
optimal_predictions = {}
for output in outputs:
    if output not in best_models:
        continue
    model_name = best_models[output]
    model = models[model_name]() # creamos una nueva instancia

    # Tomamos la columna correspondiente (escalada) para entrenar
    y_full_scaled = Y_full_scaled_df[output].values

    '''
    # Entrenamos con X_full_scaled_df y la columna Y escalada
    if model_name == "SVR":
        # SVR (dentro de MultiOutputRegressor) pide shape 2D para la Y
        model.fit(X_full_scaled_df, y_full_scaled.reshape(-1, 1))
        y_pred_scaled = model.predict(X_full_scaled_df).ravel()
    else:
        model.fit(X_full_scaled_df, y_full_scaled)
        y_pred_scaled = model.predict(X_full_scaled_df)
    '''

    y_pred_scaled = Y_full_scaled_df[output].values
    
    # Desescalar las predicciones
    # Ojo: scaler_Y.inverse_transform pide 2D; luego hacemos .ravel() si necesitamos 1D
    # Desescalar las predicciones manualmente para la salida actual
    col_idx = Y.columns.get_loc(output)
    y_pred_full = y_pred_scaled * scaler_Y.scale_[col_idx] + scaler_Y.mean_[col_idx]
    
    # Guardamos la predicción final (ya desescalada)
    optimal_predictions[output] = y_pred_full

# Creamos un DataFrame con las predicciones óptimas (ya en la escala original)
df_optimal = X.copy()
for output in outputs:
    if output in optimal_predictions:
        df_optimal[f"{output}_pred"] = optimal_predictions[output]
    else:
        df_optimal[f"{output}_pred"] = np.nan
'''

### 3.9. Visualización Final: Comparación entre Valores FEA y Predicciones

In [None]:
# =============================================================================
# Subplots para comparar, para cada salida, los valores FEA vs. las predicciones óptimas.
# Se filtran filas con NaN antes de calcular las métricas.
# =============================================================================
fig2, axes2 = plt.subplots(nrows=nrows, ncols=ncols, figsize=(12, 6*nrows))
if n_out == 1:
    axes2 = [axes2]
else:
    axes2 = axes2.flatten()
for i, output in enumerate(outputs):
    y_true = df[output].values # valores originales
    y_pred = df_optimal[f"{output}_pred"].values
    
    mask = ~np.isnan(y_true) & ~np.isnan(y_pred)
    if mask.sum() == 0:
        print(f"No valid data for metrics evaluation of {output}.")
        continue
        
    y_true_valid = y_true[mask]
    y_pred_valid = y_pred[mask]
    
    r2 = r2_score(y_true_valid, y_pred_valid)
    mse = mean_squared_error(y_true_valid, y_pred_valid)

    # CoP lo calculamos si lo tienes definido (asumiendo tu compute_CoP)
    cop_full = compute_CoP(y_true_valid, y_pred_valid)
    
    ax = axes2[i]
    ax.scatter(y_true_valid, y_pred_valid, alpha=0.6, edgecolor="k")
    ax.plot([y_true_valid.min(), y_true_valid.max()],
            [y_true_valid.min(), y_true_valid.max()], 'r--', lw=2)
    ax.set_xlabel("FEA Simulation", fontsize=12)
    ax.set_ylabel("Surrogate Prediction", fontsize=12)
    ax.set_title(
        f"{output}\nR²={r2:.3f}, CoP={cop_full:.3f}, MSE={mse:.3e}",
        fontsize=14
    )
    ax.grid(True, linestyle="--", alpha=0.5)
    
plt.tight_layout()
# Guardar la figura en la carpeta 'Figuras_MOP/(La carpeta que corresponda)'
figure_file = os.path.join(figure_path, 'los valores FEA vs. las predicciones óptimas.png')
plt.savefig(figure_file, dpi =1080)
plt.close()
# plt.show()

### 3.10. Guardar el Nuevo Dataset con Predicciones Óptimas

In [None]:
# Guardar el nuevo dataset
model_file = os.path.join(modelo_path, "trained_database_optimal.csv")
df_optimal.to_csv(model_file, index=False)
print("\nNuevo dataset generado: 'trained_database_optimal.csv'")