### Funcion: eval_model

Esta función debe recibir un target, unas predicciones para ese target, un argumento que determine si el problema es de regresión o clasificación y una lista de métricas:
* Si el argumento dice que el problema es de regresión, la lista de métricas debe admitir las siguientes etiquetas RMSE, MAE, MAPE, GRAPH.
* Si el argumento dice que el problema es de clasificación, la lista de métrica debe admitir, ACCURACY, PRECISION, RECALL, CLASS_REPORT, MATRIX, MATRIX_RECALL, MATRIX_PRED, PRECISION_X, RECALL_X. En el caso de las _X, X debe ser una etiqueta de alguna de las clases admitidas en el target.

Funcionamiento:
* Para cada etiqueta en la lista de métricas:
- RMSE, debe printar por pantalla y devolver el RMSE de la predicción contra el target.
- MAE, debe pintar por pantalla y devolver el MAE de la predicción contra el target. 
- MAPE, debe pintar por pantalla y devolver el MAPE de la predcción contra el target. Si el MAPE no se pudiera calcular la función debe avisar lanzando un error con un mensaje aclaratorio
- GRAPH, la función debe pintar una gráfica comparativa (scatter plot) del target con la predicción
- ACCURACY, pintará el accuracy del modelo contra target y lo retornará.
- PRECISION, pintará la precision media contra target y la retornará.
- RECALL, pintará la recall media contra target y la retornará.
- CLASS_REPORT, mostrará el classification report por pantalla.
- MATRIX, mostrará la matriz de confusión con los valores absolutos por casilla.
- MATRIX_RECALL, mostrará la matriz de confusión con los valores normalizados según el recall de cada fila (si usas ConfussionMatrixDisplay esto se consigue con normalize = "true")
- MATRIX_PRED, mostrará la matriz de confusión con los valores normalizados según las predicciones por columna (si usas ConfussionMatrixDisplay esto se consigue con normalize = "pred")
- PRECISION_X, mostrará la precisión para la clase etiquetada con el valor que sustituya a X (ej. PRECISION_0, mostrará la precisión de la clase 0)
- RECALL_X, mostrará el recall para la clase etiquetada co nel valor que sustituya a X (ej. RECALL_red, mostrará el recall de la clase etiquetada como "red")

NOTA1: Como puede que la función devuelva varias métricas, debe hacerlo en una tupla en el orden de aparición de la métrica en la lista que se le pasa como argumento. Ejemplo si la lista de entrada es ["GRAPH","RMSE","MAE"], la fución pintará la comparativa, imprimirá el RMSE y el MAE (da igual que lo haga antes de dibujar la gráfica) y devolverá una tupla con el (RMSE,MAE) por ese orden.
NOTA2: Una lista para clasificación puede contener varias PRECISION_X y RECALL_X, pej ["PRECISION_red","PRECISION_white","RECALL_red"] es una lista válida, tendrá que devolver la precisión de "red", la de "white" y el recall de "red". Si algunas de las etiquetas no existe debe arrojar ese error y detener el funcionamiento.

### Definición de la función de evaluación de modelo

In [25]:
from sklearn.metrics import mean_squared_error, mean_absolute_error, accuracy_score, precision_score, recall_score, classification_report, confusion_matrix
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

def eval_model(target, predictions, problem_type, metrics):

    """
    Evalúa modelos de preducción según las métricas especificadas en función de si son problemas de regresión o clasificación.

    Argumentos:
    - df (DataFrame): DataFrame de entrada.
    - target (array): Columna objetivo del test (y_test).
    - predictions (array): Predicciones de la columna objetivo resultado de la ejecución del modelo.
    - problem_type (str): Indica si se trata de un problema de regresión o clasificación.
    - metrics (list): Lista de métricas según la tipología de problema.

    Retorna:
    - una tupla con los resultados de las métricas deseadas (metrics) por orden.

    """

# Creamos una lista vacía donde se irán guardando los resultados de las métricas por su orden en metrics.
    results = []

# Creamos un primer condicional según la tipología de problema y para cada metrica de metrics haremos la función deseada además de registrar el valor correspondiente en la lusta results.   
# Alternativa de tipología de regresión.
    if problem_type == "regression":
        print("Problema de regresión")
# Recorremos la lista de metrics para analizarla y guardar sus resultados por orden en la lista results.
        for metric in metrics:
# Si la métrica es RMSE, se calcula, se muestra por pantalla y se añade a la lista results.
            if metric == "RMSE":
                rmse = mean_squared_error(target, predictions, squared=False)
                print(f"RMSE: {rmse}")
                results.append(rmse)
# Si la métrica es MAE, se calcula, se muestra por pantalla y se añade a la lista results.            
            if metric == "MAE":
                mae = mean_absolute_error(target, predictions)
                print(f"MAE: {mae}")
                results.append(mae)
# Si la métrica es MAPE, se calcula, se muestra por pantalla y se añade a la lista results. Si no se puede calcular, se imprime un mensaje indicándolo.           
            if metric == "MAPE":
                try:
                    mape = mean_absolute_percentage_error(target, predictions)
                    print(f"MAPE: {mape}")
                    results.append(mape)
                except Exception as e:
                    print("Error al calcular MAPE:", e)
                    results.append(None)
# Si la métrica es GRAPH, se muestra por pantalla el scatter plot.            
            if metric == "GRAPH":
                plt.figure(figsize=(8, 6))
                plt.scatter(target, predictions, alpha=0.5)
                plt.xlabel("Target")
                plt.ylabel("Predictions")
                plt.title("Scatter Plot of Target vs Predictions")
                plt.show()
# Alternativa de tipología de clasificación.    
    elif problem_type == "classification":
        print("Problema de clasificación")
        for metric in metrics:
# Si la métrica es Accuaracy, se calcula, se muestra por pantalla y se añade a la lista results.
            if metric == "ACCURACY":
                accuracy = accuracy_score(target, predictions)
                print(f"Accuracy: {accuracy}")
                results.append(accuracy)
# Si la métrica es Precision, se calcula, se muestra por pantalla y se añade a la lista results.            
            if metric == "PRECISION":
                precision = precision_score(target, predictions, average='macro')
                print(f"Precision: {precision}")
                results.append(precision)
# Si la métrica es Recall, se calcula, se muestra por pantalla y se añade a la lista results.            
            if metric == "RECALL":
                recall = recall_score(target, predictions, average='macro')
                print(f"Recall: {recall}")
                results.append(recall)
# Si la métrica es Classification report, se muestra por pantalla.            
            if metric == "CLASS_REPORT":
                class_report = classification_report(target, predictions)
                print("Classification Report:")
                print(class_report)
# Si la métrica es Matrix, se muestra por pantalla la matriz de confusión con valores absolutos.            
            if metric == "MATRIX":
                matrix = confusion_matrix(target, predictions)
                print("Confusion Matrix:")
                print(matrix)
# Si la métrica es Matrix recall, se muestra por pantalla la matriz de confusión con valores relativos por fila.            
            if metric == "MATRIX_RECALL":
                matrix_recall = confusion_matrix(target, predictions, normalize='true')
                print("Confusion Matrix (Normalized by Recall):")
                print(matrix_recall)
# Si la métrica es Matrix prediction, se muestra por pantalla la matriz de confusión con valores relativos por columna.            
            if metric == "MATRIX_PRED":
                matrix_pred = confusion_matrix(target, predictions, normalize='pred')
                print("Confusion Matrix (Normalized by Predictions):")
                print(matrix_pred)
# Si la métrica demanda la precisión contra una variable concreta se calcula, se muestra por pantalla y se añade a la lista results. Si la variable no es ninguna de las columnas del dataframe se informa del error.
# Pendietne de revisar!                        
            if metric.startswith("PRECISION_"):
                label = metric.split("_")[1]
                precision_x = precision_score(target, predictions, labels=[label])
                print(f"Precision for {label}: {precision_x}")
                results.append(precision_x)
# Si la métrica demanda el recall contra una variable concreta se calcula, se muestra por pantalla y se añade a la lista results. Si la variable no es ninguna de las columnas del dataframe se informa del error.            
# Pendietne de revisar!               
            if metric.startswith("RECALL_"):
                label = metric.split("_")[1]
                recall_x = recall_score(target, predictions, labels=[label])
                print(f"Recall for {label}: {recall_x}")
                results.append(recall_x)
    else:
        print("Corrige la tipología de problema: regression o classification.")

# Retornamos una tupla con la lista de los resultados de cada métrica deseada por orden.    
    return tuple(results)

### Comprobación evaluación modelo de clasificación

In [4]:
df=pd.read_csv("./data/titanic.csv")

In [5]:
df.head()

Unnamed: 0,sex,age,sibsp,parch,fare,class,who,adult_male,embark_town,alive,alone
0,male,22.0,1,0,7.25,Third,man,True,Southampton,no,False
1,female,38.0,1,0,71.2833,First,woman,False,Cherbourg,yes,False
2,female,26.0,0,0,7.925,Third,woman,False,Southampton,yes,True
3,female,35.0,1,0,53.1,First,woman,False,Southampton,yes,False
4,male,35.0,0,0,8.05,Third,man,True,Southampton,no,True


In [6]:
features = ['sex',
  'age',
  'sibSp',
  'fare',
  'embark_town']
target = "alive"

In [7]:
from sklearn.model_selection import train_test_split
train_set, test_set = train_test_split(df, test_size= 0.2, random_state= 42)

In [8]:
X_train = train_set.drop(target, axis = 1)
X_test = test_set.drop(target, axis = 1)
y_train = train_set[target]
y_test = test_set[target]

In [9]:
X_train_scal = pd.get_dummies(X_train)
X_test_scal = pd.get_dummies(X_test)

In [12]:
from catboost import CatBoostClassifier

modelo_cb = CatBoostClassifier(iterations=100, random_state=42)
modelo_cb.fit(X_train_scal, y_train, cat_features=None)

# Predecir sobre el conjunto de prueba
predicciones_cb = modelo_cb.predict(X_test_scal)

Learning rate set to 0.073611
0:	learn: 0.6636243	total: 1.29ms	remaining: 128ms
1:	learn: 0.6403321	total: 2.49ms	remaining: 122ms
2:	learn: 0.6174038	total: 3.65ms	remaining: 118ms
3:	learn: 0.5971421	total: 5.08ms	remaining: 122ms
4:	learn: 0.5789508	total: 15.6ms	remaining: 297ms
5:	learn: 0.5630033	total: 17.7ms	remaining: 277ms
6:	learn: 0.5490139	total: 18.7ms	remaining: 248ms
7:	learn: 0.5363719	total: 19.8ms	remaining: 227ms
8:	learn: 0.5238149	total: 20.9ms	remaining: 211ms
9:	learn: 0.5122729	total: 22.1ms	remaining: 199ms
10:	learn: 0.5042010	total: 22.6ms	remaining: 183ms
11:	learn: 0.4951858	total: 24.2ms	remaining: 178ms
12:	learn: 0.4864746	total: 25.4ms	remaining: 170ms
13:	learn: 0.4787811	total: 27ms	remaining: 166ms
14:	learn: 0.4720348	total: 27.4ms	remaining: 155ms
15:	learn: 0.4653409	total: 28.4ms	remaining: 149ms
16:	learn: 0.4603952	total: 29.4ms	remaining: 143ms
17:	learn: 0.4550179	total: 30.4ms	remaining: 139ms
18:	learn: 0.4506999	total: 31.5ms	remaining: 

In [42]:
# Comprobamos funcionamiento de la función:
eval_model(target=y_test,predictions=predicciones_cb,problem_type="classification",metrics=["ACCURACY","MATRIX","PRECISION","RECALL","CLASS_REPORT","MATRIX_RECALL","MATRIX_PRED"])

Problema de clasificación
Accuracy: 0.8100558659217877
Confusion Matrix:
[[92 13]
 [21 53]]
Precision: 0.8085947975328507
Recall: 0.7962033462033462
Classification Report:
              precision    recall  f1-score   support

          no       0.81      0.88      0.84       105
         yes       0.80      0.72      0.76        74

    accuracy                           0.81       179
   macro avg       0.81      0.80      0.80       179
weighted avg       0.81      0.81      0.81       179

Confusion Matrix (Normalized by Recall):
[[0.87619048 0.12380952]
 [0.28378378 0.71621622]]
Confusion Matrix (Normalized by Predictions):
[[0.81415929 0.1969697 ]
 [0.18584071 0.8030303 ]]


(0.8100558659217877, 0.8085947975328507, 0.7962033462033462)

### Comprobación evaluación modelo de regresión

In [35]:
features3 = pd.read_csv('data/temps.csv')
features3.head()

Unnamed: 0,year,month,day,week,temp_2,temp_1,average,actual,forecast_noaa,forecast_acc,forecast_under,friend
0,2016,1,1,Fri,45,45,45.6,45,43,50,44,29
1,2016,1,2,Sat,44,45,45.7,44,41,50,44,61
2,2016,1,3,Sun,45,44,45.8,41,43,46,47,56
3,2016,1,4,Mon,44,41,45.9,40,44,48,46,53
4,2016,1,5,Tues,41,40,46.0,44,46,46,46,41


In [36]:
features4 = pd.get_dummies(features3).drop(columns=['year'])
features4.head()

Unnamed: 0,month,day,temp_2,temp_1,average,actual,forecast_noaa,forecast_acc,forecast_under,friend,week_Fri,week_Mon,week_Sat,week_Sun,week_Thurs,week_Tues,week_Wed
0,1,1,45,45,45.6,45,43,50,44,29,True,False,False,False,False,False,False
1,1,2,44,45,45.7,44,41,50,44,61,False,False,True,False,False,False,False
2,1,3,45,44,45.8,41,43,46,47,56,False,False,False,True,False,False,False
3,1,4,44,41,45.9,40,44,48,46,53,False,True,False,False,False,False,False
4,1,5,41,40,46.0,44,46,46,46,41,False,False,False,False,False,True,False


In [37]:
y = features4['actual']
X = features4.drop('actual', axis=1)

X_train4, X_test4, y_train4, y_test4 = train_test_split(X,y,test_size=0.25,random_state=42)

In [38]:
from sklearn.tree import DecisionTreeRegressor

dtr = DecisionTreeRegressor()
dtr.fit(X_train4,y_train4)

In [40]:
pred = dtr.predict(X_test4)

In [44]:
# Comprobamos funcionamiento de la función:
eval_model(target=y_test4,predictions=pred,problem_type="regression",metrics=["MAE"])

Problema de regresión
MAE: 5.689655172413793


(5.689655172413793,)