# Sesgos Algorítmicos: El uso de Compas en el Sistemas de Justicia de EEUU

```{admonition} Pregunta para reflexionar
<div align="justify"><strong>¿Puede una máquina ser racista? ¿Puede un algoritmo ser injusto?</strong></div><br>
```

## Introducción

<div align="justify">Los algoritmos de Inteligencia Artificial aprenden de datos creados por humanos. Si esos datos contienen sesgos históricos, sociales o culturales, la IA los aprenderá y los replicará, a veces amplificándolos {cite}`oneil2016weapons`. Un <strong>sesgo algorítmico</strong> ocurre cuando un sistema de IA produce resultados sistemáticamente injustos o discriminatorios hacia ciertos grupos de personas.</div>

## Tipos de Sesgos:

1. **Sesgo en los datos de entrenamiento**
   - Datos históricos que reflejan discriminación pasada
   - Falta de representación de ciertos grupos

2. **Sesgo en el diseño del algoritmo**
   - Decisiones de programación que favorecen ciertos resultados
   - Métricas de éxito mal definidas

3. **Sesgo en la interpretación**
   - Cómo se usan y se interpretan los resultados de la IA

## Caso Histórico: COMPAS y el Sistema de Justicia en EE.UU.

### ¿Qué es COMPAS?

<div align="justify">
<strong>COMPAS</strong> (Correctional Offender Management Profiling for Alternative Sanctions) es un algoritmo usado en varios estados de EE.UU. para predecir si un acusado volverá a cometer un crimen (reincidencia).
</div><br>

**Lo usa para**:

- Decidir fianzas
- Determinar sentencias
- Evaluar libertad condicional

### El Problema Descubierto

En **2016**, una investigación de **ProPublica** reveló que COMPAS era **racialmente sesgado** {cite}`angwin2016machine`:

**Hallazgos claves**:

- Personas afroamericanas tenían **casi el doble** de probabilidad de ser incorrectamente clasificadas como "alto riesgo" de reincidencia
- Personas blancas tenían más probabilidad de ser clasificadas como "bajo riesgo" incluso cuando sí reincidían
- La precisión general era solo del **61%** (similar a lanzar una moneda)

```{figure} COMPAS.jpg
---
name: fig-compas-accuracy
width: 70%
alt: Precisión del algoritmo COMPAS
---
Precisión del algoritmo COMPAS en la predicción de reincidencia: aproximadamente 60-70% de aciertos, similar a lanzar una moneda. Fuente: {cite:t}`duke2017compas`.
```

Como se observa en la {numref}`fig-compas-accuracy`, la precisión del algoritmo COMPAS es sorprendentemente baja.

### Datos Concretos:

```{table} Tasas de error de COMPAS por grupo étnico
:name: tabla-compas-errores

| Grupo | Falsamente clasificados como "Alto Riesgo" | Falsamente clasificados como "Bajo Riesgo" |
|:-------:|:---------------------------------------------:|:---------------------------------------------:|
| Afroamericanos | **45%** | 23% |
| Blancos | 23% | **48%** |
```

Los datos de la {numref}`tabla-compas-errores` muestran claramente el sesgo racial del algoritmo {cite}`angwin2016machine`.

### ¿Por qué ocurrió esto?

<div align="justify">El algoritmo fue entrenado con datos históricos del sistema de justicia de EE.UU., que tiene <strong>sesgos documentados</strong> {cite}`oneil2016weapons`:</div>

1. **Arrestos desproporcionados** de minorías
2. **Sentencias más duras** para personas afroamericanas
3. **Mayor vigilancia** en vecindarios de bajos recursos

**La IA aprendió estos patrones y los perpetuó.**

## Otros Ejemplos de Sesgos Algorítmicos

### 1. Reconocimiento Facial

**Problema**: Sistemas de reconocimiento facial son menos precisos con personas de piel oscura y mujeres {cite}`buolamwini2018gender`.

**Estudio del MIT (2018)**:
- Error del **0.8%** para hombres de piel clara
- Error del **34.7%** para mujeres de piel oscura

### 2. Sistemas de Contratación

**Caso Amazon (2018)** {cite}`dastin2018amazon`:
- Amazon desarrolló un sistema de IA para filtrar CVs
- El sistema aprendió a **discriminar contra mujeres**
- Penalizaba CVs con la palabra "women" (ej: "women's chess club")
- Fue descontinuado

### 3. Predicción de Rendimiento Académico

**Problema**: Algoritmos que predicen deserción escolar pueden estar sesgados contra:
- Estudiantes de bajos recursos
- Estudiantes de zonas rurales
- Minorías étnicas

In [None]:
# Ejemplo: Simulación simple de sesgo en datos
import random

def evaluar_candidato(nombre, universidad):
    """Algoritmo sesgado que favorece ciertas universidades"""
    universidades_elite = ['Harvard', 'MIT', 'Stanford']
    
    puntaje_base = random.randint(50, 70)
    
    # SESGO: +30 puntos si viene de universidad "elite"
    if universidad in universidades_elite:
        puntaje_base += 30
    
    return puntaje_base

# Ejemplos
print(f"Juan (U. Chile): {evaluar_candidato('Juan', 'U. Chile')}")
print(f"María (Harvard): {evaluar_candidato('María', 'Harvard')}")
print(f"Pedro (U. Concepción): {evaluar_candidato('Pedro', 'U. Concepción')}")
print(f"Ana (MIT): {evaluar_candidato('Ana', 'MIT')}")

print("\n¿Notas el sesgo?")

### Análisis del Código:

**El sesgo está en la línea**:
```python
if universidad in universidades_elite:
    puntaje_base += 30
```

**Problemas**:
1. Asume que estudiantes de ciertas universidades son mejores
2. No considera mérito individual
3. Perpetúa desigualdades de acceso a educación "elite"
4. Discrimina contra talento de universidades regionales

## Cómo Combatir los Sesgos Algorítmicos

### 1. Datos Diversos y Representativos:

Asegurarse de que los datos de entrenamiento incluyan:
- Múltiples grupos demográficos
- Contextos históricos diversos
- Corrección de sesgos históricos

### 2. Auditorías Independientes

- Revisión externa de algoritmos
- Transparencia en cómo funcionan
- Publicación de tasas de error por grupo

### 3. Equipos Diversos

- Desarrolladores de diferentes orígenes
- Perspectivas variadas en el diseño
- Ética en el centro del desarrollo

### 4. Regulación y Leyes

- Leyes que exijan transparencia algorítmica
- Derecho a explicación de decisiones automatizadas
- Responsabilidad por daños causados por IA

## Marco Legal Actual

### Unión Europea: AI Act

La Unión Europea ha aprobado regulaciones estrictas sobre IA {cite}`euaiact2024`:

- Prohíbe ciertos usos de IA en justicia
- Exige transparencia en sistemas de alto riesgo
- Multas por incumplimiento

```{figure} ReglamentoEUR.jpeg
---
name: fig-eu-ai-act
width: 80%
alt: Reglamento de la Unión Europea sobre IA
---
Marco regulatorio de la Unión Europea para la Inteligencia Artificial (AI Act). Fuente: {cite:t}`euaiact2024`.
```

Como se muestra en la {numref}`fig-eu-ai-act`, la UE ha establecido un marco comprehensivo para regular la IA.

### Chile:

- Aún no existe legislación específica sobre sesgos en IA
- Nueva ley de protección de datos personales
- Existe un proyecto de ley que pretende regular los sistemas de inteligencia artificial (IA) en Chile, buscando asegurar que el desarrollo y uso de estas tecnologías sea respetuoso de los derechos de las personas, fomentar la innovación y fortalecer la capacidad del Estado para actuar frente a sus riesgos y desafíos {cite}`chile2024ailaw,minciencia2024ai`

## Actividad: Detecta el Sesgo - Ejercicio Práctico

**Escenario**: Una universidad quiere usar IA para seleccionar estudiantes.

**Datos disponibles**:
- Notas de enseñanza media
- Colegio de origen (público/Subvencionado/privado)
- Comuna o ciudad de residencia
- Actividades extracurriculares
- Puntaje PAES
- Foto del estudiante

**Preguntas**:
1. ¿Qué sesgos podrían existir en estos datos?
2. ¿Qué grupos podrían ser discriminados?
3. ¿Cómo mejorarías el sistema?
4. ¿Qué datos NO deberían usarse?

<div align="justify">
La IA tiene el potencial de ser más justa que los humanos, pero solo si la diseñamos conscientemente para serlo. Debemos ser críticos y vigilantes sobre cómo se usa la tecnología en decisiones que afectan vidas humanas.
</div>

## Recursos para Profundizar

- **Libro**: {cite:t}`oneil2016weapons` - "Weapons of Math Destruction"
- **Documental**: "Coded Bias" - Netflix
- **Artículo**: {cite:t}`angwin2016machine` - ProPublica "Machine Bias"
- **Organización**: Algorithmic Justice League

---

**Próxima clase**: Exploraremos la desinformación y los deepfakes en la era digital.

## Referencias

```{bibliography}
:filter: cited
:style: author_year
```