# 13. Evaluación de Clasificación

## 13.1 Matriz de Confisión

La **matriz de confusión** es una herramienta que se utiliza para evaluar el desempeño de un modelo de clasificación en problemas de Aprendizaje Supervisado. A diferencia de métricas como el Accuracy, que pueden ser engañosas si el conjunto de datos está desbalanceado, la metriz de confisión proporciona una visión más detallada de los errores cometidos por el modelo.


### Estructura de la Matriz de Confusión

En una matriz de confusión, los valores reales se organizan en filas y los valores predichos en columnas. La matriz tiene la siguiente estructura básica en un problema de clasificación binaria:

|          | **Predicción Positiva** | **Predicción Negativa** |
|--------------|--------------|--------------|
| **Clase Positiva (1)** | Verdaderos Positivos (TP) | Falsos Negativos (FN) |
| **Clase Negativa (0)** | Falsos Positivos (FP) | Verdaderos Negativos (TN) |


* **TP (True Positive):** la clase predicha es positiva y corresponde a la clase real positiva.

* **TN (True Negative):** la clase predicha es negativa y corresponde a la clase real negativa.

* **FP (False Postive):** la clase predicha es positiva pero en realidad es negativa (Error Tipo I).

* **FN (False Negative):** la clase predicha es negativa pero en realidad es positiva (Error Tipo II).


### Cálculo de la Matriz de Confusión

Para calcular una matriz de confusión se requiere un conjunto de datos de prueba. Se predicen las etiquetas de todas las observaciones y se comparan con los valores reales. Cada predicción se clasifica en una de las cuatro categorías mencionadas (TP, TN, FP, FN) y estos valores se colocan en la matriz.


### Métricas Derivadas de la Matriz de Confusión.

A Partir de la matriz de confusión, se pueden derivar varias métricas para evaluar el desempeño de un modelo de clasificación:

* **Accuracy:** mide el porcentaje de predicciones correctas sobre el total de predicciones. 

        Accuracy = (TP+TN)/(TP+TN+FP+FN)

* **Precision:** indica cuántas de las predicciones positivas realizadas son realmente positivas. 

        Precision = TP/(TP + FP)  

* **Sensibilidad (Recall):** aka tasa de verdaderos positivos, mide la capacidad del modelo para identificar correctamente las instancias positivas.

        
        Recall = TP/(TP + FN)

* **Especificidad:** aka tasa de Verdaderos Negetivos, evalúa la capacidad del modelo para identificar correctamente las instancias negativas. 

        Specifiicity = TN/(TN + FP)

* **F1 Score:** es la media armónica entre la precisión y la sensibilidad. Es útil cuando se busca un balance entre ambas métricas.

        F1= 2(Precision x Recall)/(Precision + Recall)



### Utilidad en la Evaluación de Modelos

La matriz de confusión es particularmente útil para identificar que tipo de errores está cometiendo un modelo y cómo mejorar su rendimiento. Permite detectar problemas como falsos positivos y falsos negativos, lo que crucial en aplicaciones donde ciertos tipos de errores tienen más impacto que otros (por ejemplo, en la detección de fraudes o enfermedades).


## Descripción Paso a Paso: Cómo Calcaular la Matriz de Confusión con un Dataset de Prueba

### Paso 1: Preparar el Dataset de Prueba

Para calcular una matriz de confusión se necesita un dataset de prueba o validación que contenga los valores reales de la variable objetivo (es decir, la categoría verdadera de cada observación). Este dataset debe estar separado del dataset de entrenamiento para evitar resultados sesgados y obtener una evaluación objetiva del modelo.


### Paso 2: Realiza Predicciones

Una vez que el modelo de clasificación ha sido entrenado, el siguiente paso es realizar predicciones sobre cada instancia del dataset de prueba. Esto implica aplicar el modelo a las características de cada fila del dataset para generar una predicción (ya sea positiva o negativa en el caso de un problema binario).


### Paso 3: Comparar las Predicciones con los Valores Reales

Para cada instancia en el dataset de prueba, se compara el valor predicho con el valor real. Esta comparación es clave para clasificar las predicciones en las siguientes categorias:

* **Verdaderos Positivos (TP):** predicciones que son positivas y corresponde a valores reales positivos.

* **Falsos Positivos (FP):** predicciones que son positivas pero en realidad son falsas (Error Tipo I).

* **Verdaderos Negativos (TN):** predicciones que son negativas y corresponden con los valores reales negativos.

* **Falsos Negativos (FN):** predicciones que son negativas pero el valor real es positivo (Error Tipo II).


### 4: Crear la Matriz de Confusión

Una vez que se han clasificado todas las predicciones, estos valores se organizan en una tabla o metriz de la siguiente manera:

|          | **Predicción Positiva** | **Predicción Negativa** |
|--------------|--------------|--------------|
| **Clase Positiva (1)** | Verdaderos Positivos (TP) | Falsos Negativos (FN) |
| **Clase Negativa (0)** | Falsos Positivos (FP) | Verdaderos Negativos (TN) |

Cada celda de la matriz representa el número de instancias que caen en cada categoría (TP, TN, FP, FN).



### Paso 5: Interpretar los Resultados

La matriz de confisión ofrece una representación clara del desempeño del modelo. Aquí es donde se puede observar cuántas instancias fueron clasificadas correctamente (TP y TN) y cuántas fueron clasificadas incorrectamente (FP y FN). Dependiendo de la aplicación, diferentes tipos de errores pueden tener más o menos relevancia.

Por ejemplo:

* Un alto número de **Falsos Positivos** puede ser problemático en un modelo de detección de fraude si muchas transacciones legítimas se etiquetan erróneamente como fraudulentas.

* Un alto número de **Falsos Negativos (FN)** podría ser grave en un modelo de diagnóstico médico, donde una enfermedad no es detectada cuando realmente está presente.



### Conslusión

El cálculo de la matriz de confusión es un paso esencial para evaluar el desempeño de modelos de clasificación. No solo permite visualizar qué tan bien el modelo está realizando las predicciones, sino que también proporciona una base para el cálculo de métricas adicionales que ofrecen una mejor comprensión de sus fortalezas y debilidades.



## 13.2 Análisis y Métricas

### Métricas Derivadas

**Explicación de Métricas Clave**


### Precision

La *precision* es una métrica utilizada para evalluar la calidad de las predicciones positivas realizadas por un modelo de clasificación. Indica qué proporción de las predicciones que el modelo ha clasificado como positivas son realmente verdaderas. En terminos simples mide cuántos de los verdaderos positivos sobre el total de predicciones positivas (verdaderos y falsos positivos) han sido identificados correctamente.

La fórmula de la *precision* es la siguiente:

            Precision = TP / (TP + FP)

donde:
* **TP (True Positive):** verdaderos positivos, es decir, predicciones correctas de la clase positiva.

* **FP (False Positive):** falsos positivos, predicciones incorrectas donde el modelo clasificó erróneamente una instancia negativa como positiva.

Una *alta precision* significa que el modelo comote pocos falsos positivos. Es especialmente importante en aplicaciones donde los *Falsos Positivos* tienen un alto costo, como en la detección de fraudes o en diagnóstico médico.


### Recall

También llamada *Sensibilidad* o *Tasa de Verdaderos Positivos*, el recall mide la capacidad del modelo para identificar correctamente todas las instancias positivas. En otras palabraas, indica qué proporción de las verdaderas instancias positivas fueron correctamente clasificacdas como positivas por el modelo.

La fórmula del recall es:

        Recall = TP / (TP + FN)

donde:
* TP: Verdaderoos positivos
* FN: falsos negativos, es decir, instancias que el modelo clasificó incorrectamente como negativas cuando en realidad son positivas.

Una *alta sensibilidad* es crucial en situaciones donde es importante detectar todas las instancias positivas, como en pruebas de diagnóstico de enfermedades graves. En estos casos, los *falsos negativos* pueden tener consecuencias graves, por lo que se prioriza identificar la mayor cantidad posible de verdaderos positivos.



### Tasa de Error

La *tasa de error* o *Error rate* mide la proporción de predicciones incorrectas sobre el total de predicciones. Es una métrica global que indica el rendimiento general del modelo, reflejando tanto *falsos positivos* como *falsos negativos*.

La fórmula de la tasa de error es:

        Tasa de Error = FP + FN / (TP + TN + FP + FN)

La tasa de error proporciona una visión general de cuántas predicciones totales fueron incorrectas. Cuanto *menor sea la tasa de error*, mejor será el desempeño del modelo. Sin embargo, no siempre es suficiente evaluar un modelo solo por esta métrica, ya que en detasets desbalanceados (con muchas más instancial de una clase que de otra), la tasa de error puede ser baja pero las métricas como la precision o el recall pueden revelar deficiencias importantes.


### Comparación y Contexto

* **Precision** se enfoca en la calidad de las predicciones positivas, minimizando los falsos positivos.

* **Sensibilidad** se concentra en identificar la mayor cantidad posible de verdaderos positivos, minimizando los falsos negativos.

* **Tasa de Error es una métrica más general que mide el rendimiento global del modelo, considerando tanto los falsos positivos como los falsos negativos.


### Conclusión

Estas métricas clave son esenciales para evaluar adecuadamente el desempeño de los modelos de clasificación. Según el problema a resolver, algunas métricas serán más relevantes que otras. Por ejemplo, en un situación donde los falsos positivos sean críticos (como en detección de fraudes), la precisión será la métrica más importante, mientras que en casos donde es crucial no perder ningún positivo (como en detección de enfermedades), la sensibilidad será la métrica prioritaria.