<div align="center" style="border: 2px solid #E57373; border-radius: 10px; padding: 20px; background-color: #FFCDD2;">
    <h1 style="font-size: 28px; color: #D32F2F;">Predicción Inteligente de Inventarios y Ventas con Aprendizaje Automático</h1>
    <p style="font-size: 18px; color: #EF6C00;">"Aprovechando el Poder del Aprendizaje Automático para Optimizar Inventarios y Potenciar la Rentabilidad Empresarial"</p>
    <img src="./images/logo.jpg" alt="Imagen de ejemplo" style="border-radius: 5px; box-shadow: 5px 5px 10px rgba(0, 0, 0, 0.2); max-width: 80%; margin-top: 20px;">
</div>


## <a><font size="6"><div style="border-radius:5px;color:#2F4F4F;background-color:#BFBF00;"> 🏋️‍♀️ Librerias</div></font></a>


In [None]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn import metrics
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
%matplotlib inline

## <a><font size="6"><div style="border-radius:5px;color:#2F4F4F;background-color:#BFBF00;"> 🏋️‍♀️ Lectura del conjunto de datos</div></font></a>


In [None]:
# Leer el archivo Excel con los datos
df_inventory = pd.read_excel("../Data/Melsol-test.xlsx")

# Mostrar las primeras 5 filas del DataFrame para verificar los datos
df_inventory.head(5)


In [None]:
df_inventory.info()

## <a><font size="6"><div style="border-radius:5px;color:#2F4F4F;background-color:#BFBF00;"> 🏋️‍♀️ Acerca del Conjunto de Datos</div></font></a>


In [None]:
# Verificar el número de filas y columnas
num_filas, num_columnas = df_inventory.shape
print(f"Número de filas: {num_filas}")
print(f"Número de columnas: {num_columnas}")

In [None]:
# Tipos de datos de cada columna
print(df_inventory.dtypes)

<style>
    table {
        border-collapse: collapse;
        width: 100%;
        border: 2px solid #008CBA;
        margin-bottom: 20px;
    }

    th, td {
        border: 1px solid #008CBA;
        padding: 10px;
        text-align: left;
    }

    th {
        background-color: #008CBA;
        color: white;
    }

    h2 {
        color: #008CBA;
    }
</style>

#### <span style="color:#008CBA;">Descripción de las Columnas del DataFrame `df_inventory`:</span>

<table>
    <tr>
        <th>Variable</th>
        <th>Descripción</th>
    </tr>
    <tr>
        <td>MES</td>
        <td>Número del mes correspondiente al registro (1 a 12).</td>
    </tr>
    <tr>
        <td>PRODUCTOS_ALMACENADOS</td>
        <td>Cantidad de productos almacenados en el inventario durante el mes.</td>
    </tr>
    <tr>
        <td>GASTO_DE_MARKETING</td>
        <td>Monto de dinero gastado en marketing durante el mes.</td>
    </tr>
    <tr>
        <td>GASTO_DE_ALMACENAMIENTO</td>
        <td>Monto de dinero gastado en almacenamiento de productos durante el mes.</td>
    </tr>
    <tr>
        <td>DEMANDA_DEL_PRODUCTO</td>
        <td>Nivel de demanda del producto en el mercado durante el mes.</td>
    </tr>
    <tr>
        <td>FESTIVIDAD</td>
        <td>Indicador binario que señala si hubo una festividad durante el mes (0: No, 1: Sí).</td>
    </tr>
    <tr>
        <td>PRECIO_DE_VENTA</td>
        <td>Precio de venta del producto durante el mes.</td>
    </tr>
    <tr>
        <td>PRODUCTOS_VENDIDOS</td>
        <td>Cantidad de productos vendidos durante el mes.</td>
    </tr>
</table>


In [None]:
# Resumen estadístico de las variables numericas
df_inventory.describe()

## **EDA (Analisis Exploratorio de datos)**

In [None]:
df_inventory.describe()

In [None]:
from dash import Dash, html, dcc, callback, Output, Input
import pandas as pd
import plotly.express as px

# Inicializar la aplicación
app = Dash(__name__)

# Excluir la columna 'MES'
excluded_columns = ["MES"]
columns_for_dropdown = [
    col for col in df_inventory.columns if col not in excluded_columns
]

# Diseño de la aplicación
app.layout = html.Div(
    style={"textAlign": "center", "padding": "20px"},
    children=[
        html.H1("Gráfico de Correlación con MES", style={"color": "#2E86C1"}),
        html.Hr(),
        dcc.Dropdown(
            id="dropdown-column",
            options=[{"label": col, "value": col} for col in columns_for_dropdown],
            value="PRODUCTOS_ALMACENADOS",
            multi=False,
            style={"width": "50%", "margin": "auto"},
        ),
        dcc.Graph(id="correlation-plot", style={"margin-top": "20px"}),
    ],
)

# Definir la función de devolución de llamada
@callback(
    Output(component_id="correlation-plot", component_property="figure"),
    Input(component_id="dropdown-column", component_property="value"),
)
def update_correlation_plot(selected_column):
    corr_data = df_inventory[["MES", selected_column]]
    fig = px.scatter(
        corr_data,
        x="MES",
        y=selected_column,
        title=f"Correlación entre MES y {selected_column}",
    )
    fig.update_layout(
        plot_bgcolor="#F9F9F9",  # Color de fondo del gráfico
        paper_bgcolor="#F9F9F9",  # Color de fondo del área de trazado
        font_color="#333333",  # Color de fuente
    )
    return fig

# Ejecutar la aplicación
if __name__ == '__main__':
    app.run_server(debug=True)

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Visualización de la distribución de variables
sns.set(style="whitegrid")
plt.figure(figsize=(12, 8))

for i, column in enumerate(df_inventory.columns):
    plt.subplot(3, 3, i + 1)
    sns.histplot(df_inventory[column], kde=True)
    plt.title(f'Distribution of {column}')

plt.tight_layout()
plt.show()


## **VERIFICAR DATOS ATIPICOS**

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Configurar el estilo de los gráficos
sns.set(style="whitegrid")

# Seleccionar las columnas numéricas
numeric_columns = df_inventory.select_dtypes(include=['int64', 'float64']).columns

# Crear gráficos de caja para identificar valores atípicos
plt.figure(figsize=(15, 10))
for i, column in enumerate(numeric_columns):
    plt.subplot(3, 3, i + 1)
    sns.boxplot(x=df_inventory[column])
    plt.title(f'Boxplot of {column}')

plt.tight_layout()
plt.show()


**Observaciones**
* Columna PRODUCTOS ALMACENADOS
* Columna DEMNADA DEL PRODUCTO
* Columna PRODUCTOS VENDIDOS


In [None]:
def handle_outliers(column, cap_value=None):
    # Calcula el rango intercuartílico (IQR)
    Q1 = column.quantile(0.25)
    Q3 = column.quantile(0.75)
    IQR = Q3 - Q1
    
    # Define los límites superior e inferior para identificar los valores atípicos
    lower_limit = Q1 - 1.5 * IQR
    upper_limit = Q3 + 1.5 * IQR
    
    # Acotar los valores atípicos
    if cap_value is not None:
        column = column.clip(lower=lower_limit, upper=cap_value)
    else:
        column = column.clip(lower=lower_limit, upper=upper_limit)
    
    return column

# Aplicar la función a las columnas con valores atípicos
df_inventory['PRODUCTOS ALMACENADOS'] = handle_outliers(df_inventory['PRODUCTOS ALMACENADOS'])
df_inventory['DEMANDA DEL PRODUCTO'] = handle_outliers(df_inventory['DEMANDA DEL PRODUCTO'])
df_inventory['PRODUCTOS VENDIDOS'] = handle_outliers(df_inventory['PRODUCTOS VENDIDOS'])
df_inventory['PRECIO DE VENTA'] = handle_outliers(df_inventory['PRECIO DE VENTA'])

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Configurar el estilo de los gráficos
sns.set(style="whitegrid")

# Seleccionar las columnas numéricas
numeric_columns = df_inventory.select_dtypes(include=['int64', 'float64']).columns

# Crear gráficos de caja para identificar valores atípicos
plt.figure(figsize=(15, 10))
for i, column in enumerate(numeric_columns):
    plt.subplot(3, 3, i + 1)
    sns.boxplot(x=df_inventory[column])
    plt.title(f'Boxplot of {column}')

plt.tight_layout()
plt.show()

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Calcular la matriz de correlación
correlation_matrix = df_inventory.corr()

# Crear una máscara para la parte triangular inferior
mask = np.triu(np.ones_like(correlation_matrix, dtype=bool))

# Configurar el estilo de los gráficos
sns.set(style="white")

# Crear la figura y el eje (axis)
plt.figure(figsize=(10, 8))

# Crear el mapa de calor con la matriz de correlación
sns.heatmap(correlation_matrix, mask=mask, annot=True, cmap='coolwarm', fmt=".2f")

# Configurar el título
plt.title('Correlation Matrix - Upper Triangle Only')

# Mostrar el gráfico
plt.show()


In [None]:
correlation_matrix

**OBSERVACIONES** 
*CORRELACION FUERTE POSITIVA*
* PRODUCTOS ALMACENADOS y DEMANDA DEL PRODUCTO: 0.851178	
* PRODUCTOS ALMACENADOS y PRODUCTOS VENDIDOS: 0.83
* DEMANDA DEL PRODUCTO y PRODUCTOS VENDIDOS: 0.978426
* Correlación Fuerte Negativa:

*CORRELACION FUERTE NEGATIVA*

* FESTIVIDAD y PRODUCTOS VENDIDOS: -0.237186

In [None]:
import matplotlib.pyplot as plt

# Seleccionar solo la columna de correlaciones con "PRODUCTOS VENDIDOS"
correlations_with_target = correlation_matrix['PRODUCTOS VENDIDOS'].drop('PRODUCTOS VENDIDOS')

# Crear un gráfico de barras para visualizar las correlaciones
plt.figure(figsize=(10, 6))
correlations_with_target.sort_values().plot(kind='barh', color='skyblue')
plt.title('Correlación con "PRODUCTOS VENDIDOS"')
plt.xlabel('Correlación')
plt.ylabel('Variable')
plt.show()


## **PREPROCESAMIENTO**

In [None]:
# Mostrar el número de valores únicos de cada columna
for column in df_inventory.columns:
    num_unique_values = df_inventory[column].nunique()
    print(f'Columna: {column}, Número de Valores Únicos: {num_unique_values}')

In [None]:
import pandas as pd

def analizar_y_eliminar_ruido(df):
    """
    Analiza el número de valores únicos en cada columna y decide si eliminar la columna si la cantidad de valores únicos es igual a 1.

    Parámetros:
    - df: DataFrame de pandas

    Retorna:
    - DataFrame modificado sin las columnas identificadas como ruido.
    """

    # Inicializar una lista para almacenar las columnas a eliminar
    columnas_a_eliminar = []

    # Iterar sobre cada columna del DataFrame
    for columna in df.columns:
        # Verificar si la cantidad de valores únicos es igual a 1
        if df[columna].nunique() == 1:
            columnas_a_eliminar.append(columna)
            print(f'Columna "{columna}" tiene un solo valor único. Se considera ruido.')

    # Eliminar las columnas identificadas como ruido
    df_sin_ruido = df.drop(columnas_a_eliminar, axis=1)

    print(f'\nColumnas eliminadas: {columnas_a_eliminar}')

    return df_sin_ruido

# Ejemplo de uso
df_sin_ruido = analizar_y_eliminar_ruido(df_inventory)


In [None]:
df_sin_ruido.columns

In [None]:
df_sin_ruido.describe()

In [None]:
df_sin_ruido.shape    

In [None]:
from sklearn.preprocessing import StandardScaler, MinMaxScaler

# Seleccionar solo las columnas numéricas
columnas_numericas = df_sin_ruido.columns

# Inicializar el objeto StandardScaler
scaler = StandardScaler()

# Normalizar y estandarizar los datos
df_sin_ruido_norm_est = scaler.fit_transform(df_sin_ruido[columnas_numericas])

# Crear un nuevo DataFrame con los datos normalizados y estandarizados
df_sin_ruido_norm_est = pd.DataFrame(df_sin_ruido_norm_est, columns=columnas_numericas)

# Mostrar las estadísticas descriptivas del nuevo DataFrame
print(df_sin_ruido_norm_est.describe())

In [None]:
df_sin_ruido_norm_est.describe()

In [None]:
# Definir las características (X) y la variable objetivo (y)
X = df_sin_ruido_norm_est.drop('PRODUCTOS VENDIDOS', axis=1)
y = df_sin_ruido_norm_est['PRODUCTOS VENDIDOS']

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42)

# Imprimir las formas de los conjuntos resultantes
print("Forma de X_train:", X_train.shape)
print("Forma de X_test:", X_test.shape)
print("Forma de y_train:", y_train.shape)
print("Forma de y_test:", y_test.shape)

In [None]:
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# Crear el modelo de Random Forest Regression
bosque = RandomForestRegressor(n_estimators=100,
                                criterion="squared_error",
                                max_features="sqrt",
                                bootstrap=True,
                                oob_score=True,
                                random_state=42)

# Entrenar el modelo
bosque.fit(X_train.values, y_train.values)

# Predecir en un nuevo conjunto de datos
nuevos_datos = [[1, 10, 0.4, 5.0, 1]]  # Ajusta estos valores según tus datos
prediccion = bosque.predict(nuevos_datos)
print("Predicción:", prediccion)

# Evaluar el modelo en el conjunto de prueba
predicciones_test = bosque.predict(X_test.values)
mse = mean_squared_error(y_test.values, predicciones_test)
print("Error cuadrático medio en el conjunto de prueba:", mse)

# Imprimir la puntuación R^2 en el conjunto de entrenamiento
print("Puntuación R^2 en el conjunto de entrenamiento:", bosque.score(X_train.values, y_train.values))

# Imprimir la puntuación R^2 en el conjunto de prueba
print("Puntuación R^2 en el conjunto de prueba:", bosque.score(X_test.values, y_test.values))

# Imprimir la puntuación "out-of-bag" (OOB)
print("Puntuación OOB:", bosque.oob_score_)

In [None]:
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import cross_val_score, KFold
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score,make_scorer

# Crear el modelo de Random Forest Regression
bosque = RandomForestRegressor(n_estimators=100,
                                criterion="squared_error",  # Utilizar "squared_error" en lugar de "mse"
                                max_features="sqrt",
                                bootstrap=True,
                                oob_score=True,
                                random_state=42)

# Definir la métrica a utilizar (en este caso, negativo del Error Cuadrático Medio para que sea coherente con la validación cruzada)
metrica = make_scorer(mean_squared_error, greater_is_better=False)

# Realizar validación cruzada
kf = KFold(n_splits=5, shuffle=True, random_state=42)  # Puedes ajustar el número de divisiones (folds)
resultados_cross_val = cross_val_score(bosque, X.values, y.values, cv=kf, scoring=metrica)

# Imprimir los resultados de la validación cruzada
print("Resultados de la validación cruzada:")
print("MSE por fold:", resultados_cross_val)
print("Promedio MSE:", resultados_cross_val.mean())

# Entrenar el modelo en todo el conjunto de datos
bosque.fit(X.values, y.values)

# Predecir en un nuevo conjunto de datos
# Predecir en un nuevo conjunto de datos
nuevos_datos = X_test  # Usar X_test en lugar de una instancia individual
predicciones = bosque.predict(nuevos_datos)
print("Predicciones:", predicciones)

# Calcular las métricas de evaluación
mae_rf = mean_absolute_error(y_test, predicciones)
mse_rf = mean_squared_error(y_test, predicciones)
rmse_rf = np.sqrt(mse_rf)
r2_rf = r2_score(y_test, predicciones)


In [None]:
import matplotlib.pyplot as plt
from sklearn import tree

# Suponiendo que bosque es tu modelo entrenado
for i, arbol in enumerate(bosque.estimators_[:3]):  # Limitar a los primeros tres árboles
    plt.figure(figsize=(10, 7))
    tree.plot_tree(arbol, feature_names=X.columns.tolist(), filled=True, rounded=True)
    plt.title(f"Árbol {i+1}")
    plt.show()


In [None]:
# Realizar predicciones en el conjunto de prueba
y_pred = bosque.predict(X_test)
# Gráfico de dispersión de datos predichos vs. datos reales
plt.figure(figsize=(10, 6))
plt.scatter(y_test, y_pred, color='blue', label='Predicciones')
plt.plot([min(y_test), max(y_test)], [min(y_test), max(y_test)], color='red', linestyle='--', label='Línea de Regresión Ideal')
plt.title('Gráfico de Dispersión: Predicciones vs. Datos Reales')
plt.xlabel('Datos Reales')
plt.ylabel('Predicciones')
plt.legend()
plt.grid(True)
plt.show()

In [None]:
# Realizar predicciones en el conjunto de entrenamiento
y_train_pred = bosque.predict(X_train)

# Gráfico de dispersión de datos predichos vs. datos reales (entrenamiento)
plt.figure(figsize=(10, 6))
plt.scatter(y_train, y_train_pred, color='blue', label='Predicciones')
plt.plot([min(y_train), max(y_train)], [min(y_train), max(y_train)], color='red', linestyle='--', label='Línea de Regresión Ideal')
plt.title('Gráfico de Dispersión: Predicciones vs. Datos Reales (Conjunto de Entrenamiento)')
plt.xlabel('Datos Reales (Entrenamiento)')
plt.ylabel('Predicciones (Entrenamiento)')
plt.legend()
plt.grid(True)
plt.show()

In [None]:
def evaluar_modelo(modelo, X_train, y_train, X_test, y_test):
    # Entrenar el modelo
    modelo.fit(X_train, y_train)
    
    # Predecir en el conjunto de prueba
    predicciones = modelo.predict(X_test)
    
    # Calcular las métricas de evaluación
    mae = metrics.mean_absolute_error(y_test, predicciones)
    mse = metrics.mean_squared_error(y_test, predicciones)
    rmse = np.sqrt(mse)
    r2 = metrics.r2_score(y_test, predicciones)
    
    return mae, mse, rmse, r2


In [None]:
from sklearn.linear_model import LinearRegression

modelo_lr = LinearRegression()
mae_lr, mse_lr, rmse_lr, r2_lr = evaluar_modelo(modelo_lr, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.linear_model import Lasso

modelo_lasso = Lasso()
mae_lasso, mse_lasso, rmse_lasso, r2_lasso = evaluar_modelo(modelo_lasso, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.svm import SVR

modelo_svr = SVR()
mae_svr, mse_svr, rmse_svr, r2_svr = evaluar_modelo(modelo_svr, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.ensemble import GradientBoostingRegressor

modelo_gb = GradientBoostingRegressor(random_state=42)
mae_gb, mse_gb, rmse_gb, r2_gb = evaluar_modelo(modelo_gb, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.svm import SVR

modelo_svm = SVR()
mae_svm, mse_svm, rmse_svm, r2_svm = evaluar_modelo(modelo_svm, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.neighbors import KNeighborsRegressor

modelo_knn = KNeighborsRegressor()
mae_knn, mse_knn, rmse_knn, r2_knn = evaluar_modelo(modelo_knn, X_train, y_train, X_test, y_test)


In [None]:
from xgboost import XGBRegressor

modelo_xgb = XGBRegressor(random_state=42)
mae_xgb, mse_xgb, rmse_xgb, r2_xgb = evaluar_modelo(modelo_xgb, X_train, y_train, X_test, y_test)


In [None]:
# Multiple Linear Regression ya fue implementado en la regresión lineal
mae_mlr, mse_mlr, rmse_mlr, r2_mlr = mae_lr, mse_lr, rmse_lr, r2_lr


In [None]:
from sklearn.linear_model import Ridge

modelo_ridge = Ridge()
mae_ridge, mse_ridge, rmse_ridge, r2_ridge = evaluar_modelo(modelo_ridge, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.linear_model import ElasticNet

modelo_enr = ElasticNet()
mae_enr, mse_enr, rmse_enr, r2_enr = evaluar_modelo(modelo_enr, X_train, y_train, X_test, y_test)


In [None]:
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline

modelo_pnr = make_pipeline(PolynomialFeatures(degree=2), LinearRegression())
mae_pnr, mse_pnr, rmse_pnr, r2_pnr = evaluar_modelo(modelo_pnr, X_train, y_train, X_test, y_test)


In [None]:
# Crear un DataFrame con las métricas de los modelos
resultados = pd.DataFrame({
    'Modelo': ['Regresión Lineal', 'Lasso Regression', 'Support Vector Regression', 'Gradient Boosting', 'SVM', 'KNN', 'XGBoost', 'Ridge Linear Regression', 'Elastic-Net Regression', 'Polynomial Regression'],
    'MAE': [mae_lr, mae_lasso, mae_svr, mae_gb, mae_svm, mae_knn, mae_xgb, mae_ridge, mae_enr, mae_pnr],
    'MSE': [mse_lr, mse_lasso, mse_svr, mse_gb, mse_svm, mse_knn, mse_xgb, mse_ridge, mse_enr, mse_pnr],
    'RMSE': [rmse_lr, rmse_lasso, rmse_svr, rmse_gb, rmse_svm, rmse_knn, rmse_xgb, rmse_ridge, rmse_enr, rmse_pnr],
    'R²': [r2_lr, r2_lasso, r2_svr, r2_gb, r2_svm, r2_knn, r2_xgb, r2_ridge, r2_enr, r2_pnr],
})

# Agregar las métricas del modelo de Random Forest a la tabla de resultados
resultados.loc[len(resultados)] = ['Random Forest Regression', mae_rf, mse_rf, rmse_rf, r2_rf]

# Mostrar el DataFrame con las métricas
print(resultados)



In [None]:
from sklearn.model_selection import GridSearchCV

# Definir los parámetros para la búsqueda de hiperparámetros
parametros = {
    'n_estimators': [100, 200, 300],
    'learning_rate': [0.01, 0.1, 0.2],
    'max_depth': [3, 5, 7]
}

modelo_xgb_grid = XGBRegressor(random_state=42)
busqueda = GridSearchCV(estimator=modelo_xgb_grid, param_grid=parametros, cv=3, scoring='neg_mean_squared_error', verbose=1, n_jobs=-1)

# Entrenar el modelo con la búsqueda de hiperparámetros
busqueda.fit(X_train, y_train)
mejores_params = busqueda.best_params_

# Evaluar el mejor modelo encontrado
mejor_modelo_xgb = busqueda.best_estimator_
mae_xgb_ht, mse_xgb_ht, rmse_xgb_ht, r2_xgb_ht = evaluar_modelo(mejor_modelo_xgb, X_train, y_train, X_test, y_test)

# Añadir el modelo hypertuned a la tabla de resultados
resultados.loc[len(resultados)] = ['Hypertuned XGBoost', mae_xgb_ht, mse_xgb_ht, rmse_xgb_ht, r2_xgb_ht]

# Mostrar el DataFrame actualizado con las métricas
print(resultados)


<div style="background-color: #f5f5f5; border: 1px solid #ddd; padding: 15px; border-radius: 10px;color: black">
    <p style="font-size: 18px; color: #2E86C1;">Análisis de los Resultados de los Modelos</p>
    <p>El análisis de los resultados de los modelos proporciona una visión completa del rendimiento de cada modelo:</p>    
    <ul>
        <li>Mejor Modelo:</li>
        <ul>
            <li>Random Forest Regression: Este modelo tiene el rendimiento más sólido con un MAE bajo de aproximadamente 0.19, un MSE de alrededor de 0.06, un RMSE de aproximadamente 0.24 y un R² de alrededor de 0.74. Indica un bajo error y una buena capacidad para explicar la variabilidad de los datos.</li>
        </ul>
        <li>Segundos Mejores Modelos:</li>
        <ul>
            <li>Regresión Lineal: Aunque ligeramente superado por Random Forest, muestra un rendimiento sólido con un MAE de aproximadamente 0.21, un MSE de alrededor de 0.07, un RMSE de aproximadamente 0.27 y un R² de alrededor de 0.68.</li>
            <li>Polynomial Regression: Con un MAE de aproximadamente 0.25, un MSE de alrededor de 0.07, un RMSE de aproximadamente 0.26 y un R² de alrededor de 0.69, es otra opción sólida.</li>
        </ul>
        <li>Peores Modelos:</li>
        <ul>
            <li>XGBoost: Muestra un rendimiento deficiente con un MAE de aproximadamente 0.76, un MSE de alrededor de 1.27, un RMSE de aproximadamente 1.13 y un R² negativo de alrededor de -4.79.</li>
            <li>Hypertuned XGBoost: Similar al XGBoost regular, muestra un rendimiento muy pobre con un MAE de aproximadamente 0.75, un MSE de alrededor de 1.32, un RMSE de aproximadamente 1.15 y un R² negativo de alrededor de -5.03.</li>
        </ul>
    </ul>
    <p>En resumen, Random Forest Regression destaca como el mejor modelo, seguido de cerca por la Regresión Lineal y Polynomial Regression. XGBoost y su versión Hypertuned XGBoost muestran un rendimiento deficiente y deben ser evitados.</p>
</div>
