# Overfitting y Underfitting

![overffiting.png](attachment:6f5535cb-cfda-4155-9c3d-62440ddf665d.png)


# Overfitting
Si el conjunto de datos tiene muchas caracteristicas, es posible que la función de hipótesis generada por el algoritmo
se adapte muy bien al conjunto de datos de entrenamiento pero falle al generalizar con nuevos ejemplos, es lo que se conoce como overfitting

Significa que el algoritmo despues de ser entrenado y puesto a producción, al enfrentar datos que no conoce falla.

El sobreajuste y el subajuste son dos de las principales razones por las que los algoritmos y modelos de aprendizaje automático no obtienen buenos resultados. Comprender por qué surgen en primer lugar y tomar medidas para evitarlos puede mejorar el rendimiento de su modelo en muchos niveles. Exploremos mejor la diferencia entre sobreajuste y subajuste a través de un ejemplo hipotético.

Supongamos que dos niños deben realizar un examen de matemáticas. Debido a las limitaciones de tiempo, el primer niño solo aprendió a sumar y no pudo aprender a restar, multiplicar ni dividir. El segundo niño tenía una memoria fenomenal, pero no era muy bueno en matemáticas, por lo que, en lugar de eso, memorizó todos los problemas del libro de problemas. Durante el examen, el primer niño resolvió solo problemas matemáticos relacionados con la suma y no pudo abordar problemas matemáticos que involucraran las otras tres operaciones aritméticas básicas. Por otro lado, el segundo niño solo fue capaz de resolver problemas que memorizó del libro de problemas de matemáticas y no pudo responder ninguna otra pregunta. En este caso, si las preguntas del examen de matemáticas fueran de otro libro de texto e incluyeran preguntas relacionadas con todo tipo de operaciones aritméticas básicas, ambos niños no lograrían aprobarlo.

Los algoritmos de aprendizaje automático a veces muestran un comportamiento similar al de estos dos niños. Hay veces en las que aprenden solo de una pequeña parte del conjunto de datos de entrenamiento (similar al niño que solo aprendió a sumar). En esos casos, el modelo no se ajusta lo suficiente. En otros casos, los modelos de aprendizaje automático memorizan todo el conjunto de datos de entrenamiento (como el segundo niño) y funcionan de manera excelente en instancias conocidas, pero fallan en datos no vistos. En situaciones como esta, el modelo se ajusta demasiado. El ajuste excesivo y insuficiente son dos conceptos esenciales en el aprendizaje automático y ambos pueden conducir a un rendimiento deficiente del modelo.


## ¿Qué es la generalización?
En el aprendizaje supervisado , el objetivo principal es utilizar los datos de entrenamiento para crear un modelo que pueda hacer predicciones precisas basadas en datos nuevos e inéditos, que tengan las mismas características que el conjunto de entrenamiento inicial. Esto se conoce como generalización. La generalización se relaciona con la eficacia con la que los conceptos aprendidos por un modelo de aprendizaje automático se aplican a ejemplos particulares que no se utilizaron durante el entrenamiento. Se desea crear un modelo que pueda generalizar con la mayor precisión posible. Sin embargo, en el mundo real, este es un problema complicado.

Error de generalización
Como ya sabes, para entrenar un modelo de aprendizaje automático, divides el conjunto de datos en tres conjuntos: entrenamiento, validación y prueba. Como indican estos nombres, entrenas tus modelos usando los datos de entrenamiento, luego los comparas y los ajustas usando los resultados de la evaluación en el conjunto de validación y, por último, evalúas el rendimiento de tu mejor modelo en el conjunto de prueba. La tasa de error en los casos nuevos se denomina error de generalización (o error fuera de la muestra) y, al evaluar tus modelos en el conjunto de validación, obtienes una estimación de este error. Este valor te indica qué tan bien funcionan tus modelos en instancias en las que nunca se han iterado.

El error de generalización de un modelo (también conocido como error de predicción) se puede expresar como la suma de tres errores muy diferentes: error de sesgo, error de varianza y error irreducible.

Nota: El error irreducible se produce debido al ruido de los datos en sí. La única forma de reducir esta parte del error es limpiar los datos (por ejemplo, reparar las fuentes de datos, como sensores dañados, o detectar y eliminar valores atípicos).

## El concepto de sesgo: Error de sesgo

Este tipo de error es el resultado de suposiciones incorrectas, como pensar que los datos son lineales cuando en realidad son cuadráticos. El sesgo se define como un error sistemático que ocurre en el modelo de aprendizaje automático como resultado de suposiciones erróneas de ML. El sesgo también es la diferencia cuadrática promedio entre las predicciones del modelo y los datos reales. Los modelos con un mayor porcentaje de sesgo no coincidirán con los datos de entrenamiento. Por otro lado, los modelos con tasas de sesgo más bajas coincidirán con el conjunto de datos de entrenamiento. Las características de un modelo con alto sesgo incluyen:

No se logra capturar tendencias de datos adecuadas
Potencial de subadaptación
Más generalizado/demasiado simplificado
Alta tasa de error

## El concepto de varianza: Error de varianza

La varianza, como error de generalización, se produce debido a la excesiva sensibilidad del modelo a pequeñas variaciones en los datos de entrenamiento. En el aprendizaje supervisado, el modelo aprende de los datos de entrenamiento. Por lo tanto, si cambia los datos de entrenamiento, el modelo también se verá afectado. La varianza muestra la cantidad en la que se verá afectado el rendimiento del modelo predictivo al evaluar en función de los datos de validación. Si su modelo puede generalizar bien, no debería cambiar demasiado de una división a otra. Por ejemplo, es probable que un modelo con muchos grados de libertad (como un modelo polinomial de alto grado) tenga una varianza alta, mientras que los modelos lineales probablemente tengan una varianza menor. Un modelo de alta varianza normalmente tiene las siguientes cualidades:

Ruido en el conjunto de datos
Potencial de sobreajuste
Modelos complejos
Intentando poner todos los puntos de datos lo más cerca posible

## Compensación entre sesgo y varianza
El sesgo/varianza en el aprendizaje automático se relaciona con el problema de minimizar simultáneamente dos fuentes de error (error de sesgo y error de varianza).

![compenscion.png](attachment:ee2e4a8e-15b2-48a6-b557-22891568abdd.png)



# Detección del overfitting

## 📈 ¿Cómo se detecta el overfitting?
Se puede detectar usando curvas de aprendizaje que muestran cómo evoluciona el error durante el entrenamiento.

Si el error en los datos de entrenamiento disminuye, pero el error en los datos de validación aumenta, es probable que haya overfitting.
![overfittingComplegidad.png](attachment:fb92af84-4bb6-4ca4-a34a-d7a4909dca73.png)

## 🛠️ ¿Cómo prevenir el overfitting?

### Aumentar la cantidad de datos de entrenamiento.
Un mayor volumen de datos ayuda al modelo a aprender patrones más generales.

### Usar regularización.
La regularización agrega una penalización a los pesos grandes del modelo, lo que evita que se ajuste demasiado a los datos de entrenamiento.

1. L1 Regularization (Lasso): Penaliza la suma de los valores absolutos de los pesos.
2. L2 Regularization (Ridge): Penaliza la suma de los cuadrados de los pesos.
4. Reducir la complejidad del modelo.
   Por ejemplo, usar menos capas en una red neuronal o menos profundidad en un árbol de decisión.

5. Aplicar técnicas de Early Stopping.
   Detener el entrenamiento cuando el rendimiento en los datos de validación deja de mejorar.

6. Utilizar Cross-Validation.
   La validación cruzada evalúa el modelo en diferentes subconjuntos del conjunto de datos para garantizar que generaliza bien.

7. Dropout (en redes neuronales).
   Durante el entrenamiento, aleatoriamente se apagan algunas neuronas para evitar que el modelo dependa demasiado de ciertas conexiones.

8. Eliminar características irrelevantes.
   Utilizar técnicas de selección de características para evitar que el modelo aprenda patrones inútiles.

# Regularización.
- La regularización agrega una penalización en los diferentes parámetros del modelo para reducir la libertad del modelo. Por tanto es menos probable    que el modelo se ajuste al ruido de los datos de entrenamiento y mejorara las capacidades de generalización de dicho modelo.
  
## Ejemplo de regularización

Imagina que un modelo de regresión lineal intenta predecir el precio de una casa usando las siguientes variables:

🛋️ Cantidad de habitaciones
📅 Año de construcción
🎨 Color de las paredes interiores
🎶 Vecino escucha música clásica (dato irrelevante)

![regulaProblem.png](attachment:56e263ec-dd71-4e82-9602-86587754a7e7.png)
### ➡️ Problema:
El modelo le asigna un peso alto a variables irrelevantes, como el color de las paredes y si el vecino escucha música. Esto significa que el modelo está ajustándose al ruido de los datos, en lugar de enfocarse en patrones importantes.

![result1.png](attachment:739bc1d9-a83f-4e0a-91d0-f5b75ff5daa4.png)


### ➡️ Resultado:
Las variables importantes, como el área y la cantidad de habitaciones, siguen teniendo pesos significativos. Sin embargo, las variables irrelevantes tienen pesos mucho menores o cercanos a 0, lo que reduce la influencia del ruido en el modelo.

### Como podemos observar la regularización no elimina caracteristicas, pero si reduce el valor de esta, castigando fuertemente a una caracteristica entre mas irrelevante sea.

#### ¡ Se sacrifica un tanto el ajuste a los datos (Admite un poco de error, no se busca error cero), a cambio de tener una mejor generalización !

a la funcion de error se le asigna un hiperparametro que obliga al algoritmo buscar algo de error  j(theta) + lamda

## Ejemplo
### Qué es la regresión Ridge?
La regresión Ridge es una técnica de regularización estadística. Corrige el sobreajuste de los datos de entrenamiento en los modelos de machine learning.

La regresión, también conocida como regularización L2, es uno de los varios tipos de regularización para los modelos de regresión lineal . La regularización es un método estadístico para reducir los errores causados por el sobreajuste de los datos de entrenamiento. La regresión corrige específicamente la multicolinealidad en el análisis de regresión. Esto resulta útil cuando se desarrollan modelos de machine learning que tienen un gran número de parámetros, sobre todo si esos parámetros también tienen pesos elevados. Si bien este artículo se centra en la regularización de los modelos de regresión lineal, tenga en cuenta que la regresión Ridge también se puede aplicar a la regresión logística.

La regresión Ridge modifica OLS calculando coeficientes que tienen en cuenta predictores potencialmente correlacionados. En concreto, la regresión Ridge corrige los coeficientes de alto valor introduciendo un término de regularización (a menudo denominado término de penalización) en la función RSS. Este término de penalización es la suma de los cuadrados de los coeficientes del modelo.5  Se representa en la formulación:

Bi = los coeficientes de la funcion del modelo

![ridge.png](attachment:5e0f0235-aae1-49b4-8675-cff166844b7f.png)

el parametro lambda controla la flexibilidad o rigidez del modelo.
#### un lambda = 0 quita la regularizacion
#### un lambda  muy grande hara que el algoritmo minimice tanto los parametros que llegara a ser un modelo sin capacidad de generalizar.
### Se debe buscar un lamda optimo que permita tener un modelo que generalice.

![formulasRegularizacion.png](attachment:e312ab78-f50c-449c-b725-8c7b6dc94fa0.png)

# Evaluacion de la hipotesis
Como poder evaluar un modelo con muchas caracteristicas y poder determinar si se está provocando overfitting ??

Una forma muy comun es la de dividir el conjunto de datos del modelo en: datos de entrenamiento y datos de prueba y un subconjunto adicional llamado datos de validación (Para evitar o detectar si estamos metiendo overfitting al conjunto de datos).

# 1️⃣ Evaluar el Modelo Usando la Pérdida en Datos de Entrenamiento y Prueba
Una de las formas más comunes de evaluar si un modelo está sobreajustando es comparando el error en los datos de entrenamiento con el error en los datos de prueba.

# 🔍 Indicadores de overfitting:

Error en entrenamiento: Muy bajo.
Error en prueba/validación: Muy alto.
 asi que separamos en forma de proporciones los datos por ejemplo:
- 70% para entrenar.
- 30% para probar.

  

# Seleccion del modelo

Seleccionar el modelo adecuado para un problema específico no es un proceso aleatorio. Requiere aplicar metodologías estructuradas y técnicas basadas en la naturaleza del problema, los datos disponibles y los objetivos. Aquí te explico paso a paso cómo seleccionar un modelo, qué métodos y criterios usar, y te doy ejemplos prácticos.

## 📚 1️⃣ Metodología CRISP-DM (Cross Industry Standard Process for Data Mining)

La metodología CRISP-DM es una de las más utilizadas para proyectos de machine learning. Consta de seis etapas que ayudan a seleccionar un modelo adecuado:
![selmodelo.png](attachment:93c52517-a828-4c8e-a3ef-31547797195c.png)

![tecnicas.png](attachment:af7cf1d5-58ff-4d13-9bf1-4b9e11a14b49.png)


# ✅ Problemas al Entrenar Varios Modelos y Razones para Separar los Datos en Entrenamiento, Prueba y Validación

Cuando seleccionamos un modelo de machine learning, el proceso de entrenamiento y evaluación debe ser riguroso para evitar errores como overfitting o selección de un modelo poco generalizable. Aquí te explico los problemas más comunes al entrenar varios modelos y por qué es fundamental dividir los datos en tres grupos: entrenamiento, prueba y validación.

## 📉 Problemas que Surgen al Entrenar Varios Modelos
### 🧪 1️⃣ Overfitting (Sobreajuste)
Si entrenas varios modelos y los evalúas siempre en los mismos datos, es probable que el modelo se ajuste demasiado a esos datos específicos. Esto provoca que el modelo memorice los patrones del conjunto de prueba en lugar de generalizar a nuevos datos.

### 🔍 Ejemplo:
Supón que entrenas un modelo de clasificación para predecir si un cliente comprará un producto. Si evalúas el modelo usando los mismos datos que utilizaste para entrenarlo, obtendrás una precisión muy alta, pero cuando uses datos nuevos, el rendimiento puede caer drásticamente.

#### ➡️ Solución: Separar los datos en entrenamiento y prueba.

## 🧪 2️⃣ Optimización Sesgada hacia el Conjunto de Prueba
Si ajustas los hiperparámetros del modelo basándote únicamente en los datos de prueba, estarás optimizando el modelo para ese conjunto específico en lugar de enfocarte en la capacidad de generalización.

### 🔍 Ejemplo:
Un modelo de regresión puede mostrar un error bajo en el conjunto de prueba porque los hiperparámetros fueron ajustados para esos datos, pero en datos nuevos el error puede ser mucho mayor.

## ➡️ Solución: Usar un conjunto de validación para ajustar hiperparámetros y evitar sesgo hacia el conjunto de prueba.

## 🧪 3️⃣ Comparación Injusta entre Modelos
Si evalúas varios modelos en el conjunto de prueba sin usar un conjunto de validación, corres el riesgo de elegir el modelo que mejor se adapta al conjunto de prueba por azar, en lugar de elegir el modelo que mejor generaliza.

### 🔍 Ejemplo:
Comparas un SVM y un Random Forest en el conjunto de prueba y seleccionas el modelo con mejor rendimiento. Pero ese rendimiento puede ser un resultado afortunado o específico de ese conjunto.

### ➡️ Solución: Separar los datos en tres conjuntos (entrenamiento, validación, y prueba) para evaluar de manera justa.


# 📊 ¿Por Qué Dividir los Datos en Tres Grupos?

## 📁 1. Datos de Entrenamiento (Training Set)
Este conjunto se usa para entrenar el modelo. Aquí es donde el modelo aprende los patrones y ajusta sus parámetros internos.

### ➡️ Objetivo:
Que el modelo aprenda las relaciones entre las características y la variable objetivo.

## 📁 2. Datos de Validación (Validation Set)
Este conjunto se usa para ajustar los hiperparámetros del modelo y seleccionar el modelo final. No se usa para entrenar, sino para evaluar cómo generaliza el modelo después del entrenamiento.

### ➡️ Objetivo:
Evitar el sesgo hacia el conjunto de prueba al ajustar los hiperparámetros. Se usa para comparar modelos y seleccionar el mejor.

## 🔧 Hiperparámetros que se ajustan usando el conjunto de validación:

## En un SVM: el parámetro 
𝐶
C y el tipo de kernel.
En un Random Forest: el número de árboles y la profundidad máxima.
En una red neuronal: la tasa de aprendizaje y el número de neuronas.

## 📁 3. Datos de Prueba (Test Set)
Este conjunto se usa solo una vez al final del proceso, para evaluar el rendimiento del modelo final. Es importante que el modelo nunca haya visto estos datos durante el entrenamiento o la validación.

### ➡️ Objetivo:
Obtener una estimación realista del rendimiento del modelo en datos nuevos.

### 🧪 ¿Qué Se Busca al Separar los Datos en Tres Conjuntos?
Evitar Overfitting:
Al usar datos de validación y prueba, aseguras que el modelo no se sobreajuste al conjunto de entrenamiento.

### Evaluar la Generalización:
Separar los datos permite evaluar cómo el modelo generaliza a datos nuevos.

### Comparar Modelos de Manera Justa:
El conjunto de validación permite una comparación justa entre diferentes modelos y configuraciones.

### Ajustar Hiperparámetros sin Sesgo:
El conjunto de validación permite ajustar los hiperparámetros sin sesgarse hacia el conjunto de prueba.



# ✅ ¿Cuál es la Condición Final para Elegir un Algoritmo u Otro?
Una vez que has dividido los datos en entrenamiento, prueba y validación, el paso final para seleccionar el mejor algoritmo es evaluar su rendimiento en el conjunto de validación y prueba y asegurarte de que generaliza bien a nuevos datos.

## 🔑 Condición Final para Elegir un Modelo:
El modelo que seleccionas debe cumplir las siguientes condiciones:

- 1️⃣ Buen rendimiento en el conjunto de validación.
- 2️⃣ Consistencia en el conjunto de prueba.
- 3️⃣ Generalización: Evitar overfitting y underfitting.
- 4️⃣ Simplicidad y explicabilidad (cuando sea necesario).
- 5️⃣ Cumplimiento de los objetivos del negocio o del problema.
 
![seleccuno.png](attachment:bc3363a6-33fe-4a19-9ea7-429e2170c522.png)

# Procedimiento general 
- Dividir el conjunto de datos en entrenamiento, validación y pruebas.
- Se calcula función de hipótesis con el subconjunto de entrenamieno (Se calculan los parámetros Theta minimizando el error J(theta).
- Se calcula el número de caracteristicas óptimo mediante la evaluación de las hipótesis anteriores con el subconjunto de validación.
- Se evalua la función de hipótesis resultante mediante el subconjunto de pruebas calculando su error.

  

# Matriz de Confusión.
![MCONF.png](attachment:1272b087-a208-424a-aa30-5a44eddb4c2c.png)

## Qué es la matriz de confución ?
Es una herramienta fundamental en el análisis de modelos de clasificación, especialmente en aprendizaje automático. Es una tabla que se utiliza para evaluar el rendimiento de un modelo de clasificación al comparar las predicciones del modelo con los valores reales.

## Pero que es ?
Una matriz de confusión es una tabla de contingencia de tamao 2X2 (Para clasificacion binaria) o n X n (Para clasificación multiclase), que resume los resultados de las predicciones de un modelo de clasificación en términos de:
- Predicciones correctas: El modelo predijo correctamente la clase.
- Predicciones incorrectas: El modelo predijo correctamente la clase.
  ![matriz.png](attachment:7119a04f-53ae-4e86-b041-540022f49fc2.png)

- TP (Verdaderos positivos): Son los casos en los que el modelo predijo correctamente que una observación pertenece a la clase positiva.
- FN (Falsos negativos) : Son los casos en los que el modelo predijo incorrectamente que una observación pertenece a la clase negativa.
- FP (Falsos positivos) : Son los casos en los que el modelo predijo incorrectamente la clase positiva.
- TN (Verdaderos negativos) : Son los casos en los que el modelo predijo correctamente la clase negativa.

# Problema que resuelve la matriz de confusión.

La matriz de confusión ayuda a entender no solo la precisión global del modelo, sino también qué tipos de herrores está cometiendo. Mientras que las métricas comunes como la precisión (accuracy) puede dar una idea general de como se desempeña el modelo, la matriz de confusión proporciona un análisis más detallado sobre los tipos de errores cometidos.

Esto es útil especialmente en escenarios desbalanceados, donde el modelo puede predecir bien la clase mayoritaria (por ejemplo los negativos), pero fallar al predecir correctamente la clase minoritaria (Los positivos).
La matriz de confusión nos ayuda a identificar esos casos y a mejorar el modelo.

# Formulas y  cálculos
1. Acuracy(Acc) : Se habla de una precision muy general.

   La precisión es una metrica que nos indica la proporción de predicciones correctas sobre el total de predicciones realizadas. Es una medida general del rendimiento del modelo.


   ![presicion.png](attachment:dfe0c02a-2f8e-42e4-bdb7-5fb8bea6e9ed.png)


   La presición nos es útil cuando no nos importa el tipo de error(Falsos positivos, o falsos negativos), sino que simplemente queremos saber cuantas predicciones fueron correctas en general. Sin embargo la precisión no es ideal con clases desbalanceadas, ya que podría ser alta debido a un rendimiento muy bueno en la clase mayoritaria, pero péismo en la clase minoritaria.

# Ejemplo
Imaginemos que estamos clasificando si un correo electrónico es spam o no spam. Supongamos que el 95% de los correos no es spam y que el modelo tiene una precisión alta, la recall sería baja, lo cual podría ser un problema si el costo de no detectar un correo espam es alto.

## Ejemplo numérico

![spam.png](attachment:14fe1014-68fe-4cb2-b7e3-7208e8b9e1a0.png)

# 2. Precision (P): Tambien se habla exactitud en predicciones positivas.
La precisión en predicciones positivas, mide cuantas de las instancias preichas como positivas son realmente positivas. En otras palabras, de todas las veces que el modelo predijo que una instancia pertenece a la clase pisitiva, ¿Cuántas veces tuvo razon?

![TP.png](attachment:2726641b-4211-4b1d-b7c7-15bb7448ee9e.png)

## Contexto e importancia
La precision es crucial cuando el costo de un falso positivo es alto. Por ejemplo si un modelo está prediciendo enfermedades y se equivoca al clasificar a un paciente sano como enfermo, el costo puede ser tratar a un paciente innecesariamente, lo que podría implicar pruebas adicionales o tratamientos innecesarios. Es decir, es importante evitar las falsas alarmas.

## Ejemplo.
En un sistema de diagnostico médico, si un modelo clasifica erróneamente a pacientes snos como enfermos, esto podría generar efectos negativos como pruebas innecesarias y ansiedad para los pacientes. Por tanto, la precisión sería mas relevante que la acuracy en este caso.


![pp.png](attachment:f374ab73-9dd1-4960-9abf-1dd0857da49b.png)


# 3. Recall (sensibilidad o Exhaustividad)
## ¿Que hace ?

el recall mide cuantas de las instancias positivas reales fueron correctamente identificadas por el modelo. Es decir, de todas las instancias que realmente son positivas, ¿cuántas fueron detectadas correctamente?.

![recall1.png](attachment:567e2029-00bd-438f-953f-26417ffdc399.png)

## Contexto e importancia
Recall es fundamental cuando el costo de un falso negativo es alto, es decir, cuando perder una instancia positiva (no detectarla) es mucho mas costoso que un falso positivo. Por ejemplo, en un diagnóstico médico, perder un caso de cáncer (No detectar un paciente enfermo) Puede ser mucho más grave, que etiquetar una persona sana como enferma.

# Ejemplo
En la deteccion de fraude en tarjétas de crédito, es crusial no pasar por alto ningun fraude. Aunque algunos fraudes sean etiquetados incorrectamente como transacciones legítimas (Falsos negativos), es mas importante que el sistema detecte todos los posibles fraudes.

![fraude.png](attachment:7ed8295e-31e5-4ff4-bbcb-d338424d58c6.png)

# Recall = 100/(100 +50) = 0.67

en este caso el recall es 0.67, lo que significa que el modelo detectó el 67% de los fraudes. Puede que este porcentaje sea aún muy alto.

# 4. F1-Score.

# ¿Que hace ?
El F!-Score es una métrica combinada que toma tanto la precisión como el recall en cuenta. Es la media armonica entre ambos, y se utiliza cuando se busca eun equilibrio entre precisión y recall, Es útil particularmente cuando las clases están desbalanceadas y no queremos que un modelo favorezca excesivamente una de las métricas.

## ![TP.png](attachment:2726641b-4211-4b1d-b7c7-15bb7448ee9e.png)

## ![recall1.png](attachment:567e2029-00bd-438f-953f-26417ffdc399.png)

![F2Recall.png](attachment:b22105f4-9645-4e80-a66b-aaa9d4b42280.png)

## Sistema de deteccion de enfermedades
En un sistema de detección de enfermedades, el objetivo podría ser encontrar todas las personas enfermas sin hacer predicciones falsas. Si el modelo tiene una alta precisión pero una baja sensibilidad (recall), el F1-scrore ayudará a identificar que el modelo está perdiendo demasiados casos positivos (Está dejando morir la gente).

![ejemploRecall.png](attachment:3ff8a31a-2533-424e-a689-31bbbff7e619.png)



              

# 5. Especificidad
## ¿Que hace ?
La especificidad mide la capacidad del modelo para identificar correctamente las instancias negativas. Es decir, de todas las instancias negativas reales, ¿Cuántas fueron clasificadas como negativas ?
![especificidad.png](attachment:eb3b4a5f-0bd8-4b1c-8117-5924e05b8392.png)

![final.png](attachment:7442e530-4543-4d52-b5c5-b90f2114707d.png)
