# Detección y Mitigación de Sesgos en Modelos de ML
Los modelos de aprendizaje automático se utilizan cada vez más para tomar decisiones que impactan sobre la vida de las personas.

Es crucial garantizar que estos modelos sean justos y no discriminen en base a características como etnia, género, edad, etc. Haciendo aumentar la confianza en la fiabilidad y transparencia de estos modelos.

#### Detección y Mitigación de Sesgos en Modelos de Aprendizaje Automático

Mitigar el sesgo en modelos de aprendizaje automático es un desafío socio-técnico que requiere un enfoque integral que incluya técnicas y consideraciones sociales. 

**Fairness en Modelos de Predicción**
- Garantizar que los modelos de aprendizaje automático sean justos y no discriminen en base a características como edad, género, etc.
    
Ejemplo:
    
    Un modelo predice la probabilidad de repago de préstamos y puede influir en la aprobación del préstamo.
    Se evalúa la equidad comparando las predicciones para grupos con características sensibles (ej. edad).

**Métricas de Evaluación**
- Tasa de selección (proporción de predicciones positivas para cada grupo).
- Rendimiento predictivo (ej. exactitud, precisión, recuerdo) para subgrupos basados en características sensibles.

**Disparidad en las Métricas**
- Indica un posible sesgo en el modelo.
    
Ejemplo:
    
    El modelo podría predecir correctamente el repago de préstamos para el 83% de las personas mayores de 25 años, pero solo para el 50% de las personas menores de 25 años.

**Causas de disparidad**
- Desequilibrio en los datos de entrenamiento.
- Correlaciones ocultas entre características.
- Sesgos subconscientes en el proceso de modelado.

**Mitigación del Sesgo**
- Equilibrar datos de entrenamiento y validación.
- Selección y análisis cuidadoso de características.
- Evaluar modelos para detectar disparidad.
- Considerar el balance entre rendimiento general y disparidad entre grupos.

**Herramientas**
Paquetes de Python como `fairlearn` para evaluar y mitigar sesgos.

#### Paquete Fairlearn para Modelos Justos

Fairlearn es una herramienta valiosa para mitigar el sesgo en modelos de aprendizaje automático y promover la equidad en las predicciones.

Evalúa la disparidad en predicciones y rendimiento para características sensibles (ej. edad).

**Funcionamiento**
- Calcula métricas grupales basadas en métricas estándar (ej. precisión, exactitud).
- Ofrece funciones para comparar métricas entre grupos sensibles.

Ejemplo

- Modelo de clasificación binaria predice la adjudicacion de préstamos (aprobado/rechazado).
- Edad es la característica sensible con dos grupos: menor o igual a 25 y mayor a 25.
- Se puede comparar la tasa de selección (aprobados) por grupo usando `selection_rate`.
- Se pueden usar métricas estándar de `scikit-learn` (ej. precisión) para evaluar el rendimiento general del modelo.
- `metric_frame` crea un marco de datos con métricas por grupo.
- El widget interactivo permite visualizar las métricas y la disparidad entre grupos.


Fairlearn permite ejecutar experimentos en Azure ML para subir métricas al espacio de trabajo.

#### Uso y Mitigación de Sesgos con Fairlearn

Además de analizar la disparidad, Fairlearn ayuda a mitigar el sesgo en modelos de aprendizaje automático.

Utiliza algoritmos para crear modelos alternativos que cumplan restricciones de paridad entre grupos con características sensibles.

**Técnicas de Mitigación**
- **Gradiente exponencial**: minimiza la disparidad mediante un enfoque de costo-beneficio.
- **Búsqueda en cuadrícula**: similar al gradiente exponencial, pero más eficiente para pocas restricciones.
- **Optimizador de umbral**: técnica post-procesamiento que aplica restricciones a un clasificador existente.

**Restricciones de Paridad**

Dependen de la técnica usada y del criterio de equidad deseado (todas aplican a clasificación binaria y regresión, excepto Optimizador de Umbral que solo funciona con clasificación binaria).
- **Paridad Demográfica**: asegura la misma tasa de selección positiva en cada grupo sensible (ej. préstamos aprobados).
- **Paridad en Tasa de Positivos Verdaderos**: asegura una razón comparable de predicciones positivas verdaderas entre grupos.
- **Paridad en Tasa de Falsos Positivos**: asegura una razón comparable de predicciones positivas falsas entre grupos.
- **Paridad de Oportunidades Igualadas**: minimiza la disparidad en la tasa de verdaderos positivos y falsos positivos combinados entre grupos.
- **Paridad en Tasa de Error**: asegura que el error en cada grupo no se desvíe del error general por más de un valor especificado.
- **Pérdida Limitada por Grupo**: restringe la pérdida para cada grupo sensible en un modelo de regresión.

Selección del Modelo Mitigado
- Se entrenan varios modelos con distintas restricciones y luego se comparan sus métricas para elegir el óptimo.
- Suele implicar un balance entre rendimiento predictivo y equidad según su definición de equidad para un escenario dado.

Visualización y Registro de Modelos
- Fairlearn permite visualizar los modelos mitigados mediante un panel.
- Puede registrar todos los modelos entrenados y subir las métricas del panel a Azure Machine Learning.

[Documentacion fairlearn](https://github.com/fairlearn/fairlearn)