# Evaluacion de los modelos de predicción.

<a id="0"></a> <br>
### Índice:
1. [Introdución](#1)  
2. [Evaluación de modelo de regresion lineal pólinomica](#2)  
3. [Evaluación de modelo de arbol de decisión](#3)  

<a id="1"></a> <br>
## Introducción

Aquí vamos a evaluar los errores que podemos tener en este problema de regresion.  
Para ello vamos a evaluar estas caracteristicas:

-   MAE (Mean Absolute Error): El MAE es la media del valor absoluto de las diferencias entre las predicciones y los valores reales. Cuanto menor   sea el MAE, mejor será el modelo en términos de precisión.

-   MAPE (Mean Absolute Percentage Error): El MAPE es la media del porcentaje absoluto de las diferencias entre las predicciones y los valores reales, en relación con los valores reales. Es una medida relativa que proporciona una idea del error porcentual promedio. Al igual que el MAE, cuanto menor sea el MAPE, mejor será el modelo.

-   MSE (Mean Squared Error): El MSE es la media de los errores al cuadrado entre las predicciones y los valores reales. El MSE asigna un mayor peso a los errores más grandes, lo que implica que los valores extremos tienen un impacto más significativo en la métrica. Cuanto menor sea el MSE, mejor será el modelo en términos de precisión.

-   RMSE (Root Mean Squared Error): El RMSE es la raíz cuadrada del MSE. Se utiliza para tener una medida del error en la misma unidad que la variable objetivo, lo que lo hace más fácil de interpretar. Al igual que el MSE, un valor de RMSE más bajo indica un modelo más preciso.

-   R2 score (R-squared): El R2 score, también conocido como coeficiente de determinación, indica qué tan bien se ajustan los valores predichos por el modelo a los valores reales. Varía entre 0 y 1, donde 1 indica un ajuste perfecto del modelo. Un R2 score más alto sugiere una mejor capacidad de predicción del modelo.

<a id="2"></a> <br>
### 1. Evaluación del modelo de regresión lineal con polinomio.

In [1]:
# Cargamos librerias
import pickle
import pandas as pd
from sklearn.metrics import mean_absolute_error, mean_absolute_percentage_error, mean_squared_error, r2_score
from sklearn.preprocessing import PolynomialFeatures
import time 
import yaml

In [2]:

# Llamamos al modelo concreto de ML que estamos utilizando

def load_model(model_path):
    with open(model_path, 'rb') as f:
        model = pickle.load(f)
    return model

# Cargamos el modelo entrenado y sus caracteristicas para arreglar con conversion polinómica.

with open('../models/modelo_lineal/model_config.yaml', 'r') as file:
    model_config = yaml.safe_load(file)

model_path = '../models/modelo_lineal/trained_pol_3.pkl'

loaded_model = load_model(model_path)

# Cargamos data test

df_test = pd.read_csv('../data/test/test.csv')
df_train = pd.read_csv('../data/train/train.csv')

# Obtener las características (X_test) y las etiquetas (y_test)

X_test = df_test.drop('Rating Average', axis=1)
y_test = df_test['Rating Average']

X_train = df_train.drop('Rating Average', axis=1)
y_train = df_train['Rating Average']

# Conversión a polinomica

poly_feats = PolynomialFeatures(degree = model_config['degree'])
poly_feats.fit(X_train)
X_test_poly = poly_feats.transform(X_test)

# Realizar las predicciones

predictions = loaded_model.predict(X_test_poly)

# Calcular las métricas de evaluación

mae = mean_absolute_error(y_test, predictions)
mape = mean_absolute_percentage_error(y_test, predictions)
mse = mean_squared_error(y_test, predictions)
rmse = mean_squared_error(y_test, predictions, squared=False)
r2 = r2_score(y_test, predictions)

# Imprimir las métricas

print("Mean Absolute Error (MAE):", round(mae,4))
print("Mean Absolute Percentage Error (MAPE):", round(mape,4))
print("Mean Squared Error (MSE):", round(mse,4))
print("Root Mean Squared Error (RMSE):", round(rmse,4))
print("R-squared (R2) Score:", round(r2,4))

time.sleep(5)


Mean Absolute Error (MAE): 0.356
Mean Absolute Percentage Error (MAPE): 0.0564
Mean Squared Error (MSE): 0.2356
Root Mean Squared Error (RMSE): 0.4854
R-squared (R2) Score: 0.7304
