# 0 ‚Äî Problema, Riesgo y Decisiones (antes del modelo)

> **De m√©tricas a decisiones. De modelos a sistemas gobernados.**  
> En este notebook no ‚Äúentrenamos un modelo‚Äù. Definimos el **problema real**: la **decisi√≥n** que el sistema va a tomar y el **riesgo operativo** asociado.
---

## 1) Prop√≥sito del notebook

Este notebook establece el marco de trabajo de toda la serie:

- Aterrizar **qu√© decisi√≥n** queremos automatizar (y cu√°l no).
- Traducir el problema en **riesgo**, **costos de error** y **pol√≠ticas de acci√≥n**.
- Definir el **contrato de decisi√≥n**: qu√© significa ‚Äúaceptar‚Äù, ‚Äúrechazar‚Äù o ‚Äúrevisar‚Äù.
- Preparar el terreno para que, m√°s adelante, m√©tricas, calibraci√≥n, thresholds e incertidumbre (CeRTS) tengan **sentido operativo**.

## 2) Qu√© vamos a construir aqu√≠ (sin modelos)

Vamos a producir tres entregables concretos:

### A. Mapa de decisi√≥n
Una especificaci√≥n simple y accionable:

- **Decisi√≥n**: qu√© est√° decidiendo el sistema.
- **Acci√≥n**: qu√© pasa cuando decide.
- **Actores**: qui√©n asume el impacto (cliente, equipo, negocio).
- **Restricciones**: lo que no se puede permitir (compliance, fraude, reputaci√≥n, etc.).

### B. Matriz de costos (sin datos)
Definiremos el costo/impacto relativo de los errores:

- **Falso positivo (FP)**: el sistema act√∫a cuando no deb√≠a.
- **Falso negativo (FN)**: el sistema no act√∫a cuando deb√≠a.
- **Impacto**: financiero, operativo, reputacional, regulatorio.

Esto se traduce en una **preferencia expl√≠cita**: qu√© error ‚Äúduele m√°s‚Äù.

### C. Pol√≠tica de decisi√≥n (pre-modelo)
Dise√±aremos una pol√≠tica operacional con tres estados:

- **Auto-approve** (automatizar)
- **Auto-reject** (automatizar)
- **Human review** (escalar)

Aqu√≠ dejamos claro un principio que gobernar√° toda la serie:

> **El modelo produce se√±ales. La pol√≠tica decide.**

## 3) C√≥mo lo haremos (metodolog√≠a)

Trabajaremos como si estuvi√©ramos definiendo un producto de ML con gobernanza:

1. **Caso de uso**: describimos el escenario y el resultado deseado.
2. **Decisi√≥n + acci√≥n**: definimos qu√© se automatiza y qu√© gatilla esa automatizaci√≥n.
3. **Errores y costos**: priorizamos riesgos, no m√©tricas.
4. **Pol√≠tica**: dise√±amos reglas de decisi√≥n (incluyendo ‚Äúno decidir‚Äù).
5. **Criterios de √©xito**: definimos c√≥mo se evaluar√° el sistema en t√©rminos de negocio.

## 4) Resultados esperados al finalizar

Al terminar este notebook, vas a tener:

- Un **Decision Spec** claro (qu√© se decide y por qu√©).
- Una **Risk/Cost Spec** (qu√© error es inaceptable y qu√© trade-off aceptas).
- Una **Decision Policy v0** lista para conectarse con:
  - m√©tricas (accuracy, confusion matrix, precision/recall),
  - thresholds como pol√≠tica,
  - calibraci√≥n de probabilidades,
  - y manejo de incertidumbre con **CeRTS** en notebooks posteriores.

## 5) Qu√© NO haremos aqu√≠

Para mantener foco estrat√©gico:

- No entrenaremos modelos.
- No haremos EDA.
- No hablaremos de accuracy, ROC o PR.
- No optimizaremos nada.

Este notebook es la **gobernanza previa**: el punto donde se define si el sistema ser√° √∫til o peligroso.

---
---
---

## 1. Contexto del sistema

Antes de hablar de datos, modelos o m√©tricas, es necesario entender **qu√© tipo de sistema estamos construyendo** y **en qu√© contexto opera**.

Este proyecto no busca entrenar un modelo aislado, sino **dise√±ar un sistema de apoyo a decisiones** donde el machine learning es solo uno de los componentes.
---

---

### 1.1 Descripci√≥n general del sistema

El sistema que construiremos tiene como objetivo **evaluar y clasificar situaciones del mundo real** para apoyar una decisi√≥n operativa concreta.

En t√©rminos generales, el sistema:

- recibe informaci√≥n estructurada (features),
- produce se√±ales estad√≠sticas (scores y probabilidades),
- y **apoya una acci√≥n posterior** que puede ser autom√°tica o supervisada.

El foco no est√° en ‚Äúpredecir por predecir‚Äù, sino en **decidir con responsabilidad**.

### 1.2 Escenario real de uso

El escenario que usaremos como gu√≠a conceptual es el siguiente:

> Un sistema debe evaluar un caso y decidir si:
> - act√∫a autom√°ticamente,
> - solicita revisi√≥n humana,
> - o decide no actuar.

Este tipo de escenario aparece en m√∫ltiples dominios:
- calidad de productos,
- evaluaci√≥n de riesgo,
- sistemas de recomendaci√≥n con impacto,
- automatizaci√≥n parcial de procesos cr√≠ticos.

Aunque el dataset sea acad√©mico, **el marco mental es industrial y operativo**.

### 1.3 Tipo de decisi√≥n que el sistema apoyar√°

La decisi√≥n que el sistema apoya **no es continua**, es **discreta**.

Ejemplos conceptuales:
- aprobar / revisar,
- aceptar / rechazar,
- intervenir / no intervenir.

El modelo no ejecuta la acci√≥n directamente.  
El sistema **traduce se√±ales del modelo en decisiones**, bajo reglas expl√≠citas.

### 1.4 ¬øQu√© significa ‚Äúautomatizar‚Äù en este contexto?

Automatizar no significa eliminar al humano.

En este proyecto, automatizar significa:

- definir **cu√°ndo el sistema puede decidir solo**,
- definir **cu√°ndo debe frenar**,
- y definir **cu√°ndo escalar a revisi√≥n humana**.

La automatizaci√≥n responsable **incluye expl√≠citamente el derecho a no decidir**.

üìå **Idea clave de esta secci√≥n**

> No estamos construyendo un modelo.  
> Estamos dise√±ando un **sistema de decisi√≥n** donde el modelo es solo una pieza.

---
---
---

## 2. La decisi√≥n que el sistema debe tomar

Una vez definido el contexto del sistema, el siguiente paso es **especificar con precisi√≥n la decisi√≥n** que el sistema debe apoyar.

Aqu√≠ no hablamos de predicciones, ni de probabilidades, ni de modelos.  
Hablamos de **una acci√≥n concreta en el mundo real**.

---

### 2.1 Definici√≥n clara de la decisi√≥n

La decisi√≥n que el sistema debe apoyar puede expresarse de forma simple:

> **¬øEs seguro y razonable actuar autom√°ticamente sobre este caso?**

En t√©rminos operativos, esta decisi√≥n se traduce en algo como:

- **Aceptar / Aprobar autom√°ticamente**
- **Enviar a revisi√≥n**
- **No decidir (esperar m√°s informaci√≥n)**

Esta formulaci√≥n es deliberadamente binaria o ternaria.  
Las decisiones reales rara vez son continuas.

### 2.2 Momento en el que ocurre la decisi√≥n

La decisi√≥n ocurre **despu√©s** de que el sistema ha:

- recibido los datos,
- procesado la informaci√≥n,
- generado se√±ales estad√≠sticas.

Pero ocurre **antes** de cualquier acci√≥n irreversible.

Este punto temporal es cr√≠tico:  
una decisi√≥n tomada demasiado pronto o demasiado tarde **cambia completamente el riesgo**.

### 2.3 Actor que ejecuta la acci√≥n

Es fundamental separar:

- **qui√©n propone la decisi√≥n**, y
- **qui√©n la ejecuta**.

En este sistema:

- el **modelo** produce se√±ales,
- el **sistema** aplica reglas y pol√≠ticas,
- el **humano** interviene cuando el sistema lo indica.

El modelo **nunca es el actor final**.

### 2.4 Consecuencias inmediatas de la decisi√≥n

Cada decisi√≥n tiene efectos directos:

- una acci√≥n autom√°tica ahorra tiempo y costos,
- una revisi√≥n humana introduce fricci√≥n,
- una decisi√≥n incorrecta puede generar impacto negativo.

Estas consecuencias existen **independientemente del modelo**.

Por eso, definirlas ahora es obligatorio:  
m√°s adelante, todas las m√©tricas deber√°n **responder a estas consecuencias**.

üìå **Idea clave de esta secci√≥n**

> Antes de entrenar un modelo,  
> hay que poder describir la decisi√≥n en una sola frase clara.

---
---
---

## 3. Acciones y flujos operativos

Definir la decisi√≥n no es suficiente.  
Un sistema de ML responsable necesita **flujos operativos expl√≠citos** que conecten la decisi√≥n con acciones reales.

Aqu√≠ es donde el dise√±o deja de ser abstracto y se vuelve **operacional**.

---

### 3.1 Acciones autom√°ticas posibles

Una acci√≥n autom√°tica es aquella que el sistema puede ejecutar **sin intervenci√≥n humana inmediata**.

Ejemplos conceptuales:
- aceptar un caso,
- aprobar un registro,
- clasificar un √≠tem como v√°lido.

Estas acciones **solo son aceptables** cuando el sistema tiene suficiente confianza y bajo riesgo asociado.

Automatizar sin esta claridad es una fuente cl√°sica de fallos en producci√≥n.

### 3.2 Acciones que requieren validaci√≥n humana

No todos los casos deben resolverse autom√°ticamente.

Algunos escenarios requieren:
- revisi√≥n experta,
- validaci√≥n manual,
- an√°lisis contextual adicional.

El sistema debe ser capaz de **detectar estos casos** y redirigirlos al flujo humano **de forma expl√≠cita**, no como excepci√≥n informal.

### 3.3 Flujo decisi√≥n ‚Üí acci√≥n ‚Üí consecuencia

Toda decisi√≥n genera una cadena clara:

1. El sistema eval√∫a el caso.
2. Se toma una decisi√≥n (autom√°tica o asistida).
3. Se ejecuta una acci√≥n.
4. Se produce una consecuencia.

Este flujo debe ser **observable y trazable**.  
Si no puedes describirlo, no puedes gobernarlo.

### 3.4 Casos donde *no decidir* es una opci√≥n v√°lida

Una idea central de este proyecto es aceptar que:

> **No decidir tambi√©n es una decisi√≥n.**

Existen situaciones donde:
- la informaci√≥n es ambigua,
- el riesgo es alto,
- la se√±al es d√©bil o contradictoria.

En estos casos, **frenar** es la acci√≥n correcta.

Dise√±ar sistemas que saben cu√°ndo no actuar es una se√±al de madurez, no de debilidad.

üìå **Idea clave de esta secci√≥n**

> La calidad de un sistema de ML no se mide solo por sus m√©tricas,  
> sino por la claridad de sus flujos de decisi√≥n y acci√≥n.

---
---
---

## 4. Tipos de error y su significado real

Antes de hablar de m√©tricas, es imprescindible entender **qu√© significa equivocarse** en este sistema.

Los errores no son abstractos.  
Tienen consecuencias reales, costos distintos y niveles de tolerancia diferentes.

---

### 4.1 ¬øQu√© es un falso positivo en este sistema?

Un falso positivo ocurre cuando el sistema **aprueba o act√∫a autom√°ticamente** sobre un caso que **no deb√≠a**.

En t√©rminos operativos, esto puede implicar:
- aceptar algo incorrecto,
- ejecutar una acci√≥n prematura,
- generar un impacto negativo dif√≠cil de revertir.

En muchos sistemas, este es el error **m√°s costoso**, aunque no siempre el m√°s frecuente.

### 4.2 ¬øQu√© es un falso negativo?

Un falso negativo ocurre cuando el sistema **no act√∫a** o **env√≠a a revisi√≥n** un caso que **s√≠ pod√≠a resolverse autom√°ticamente**.

Sus consecuencias suelen ser:
- mayor fricci√≥n operativa,
- retrasos,
- aumento de costos humanos.

Aunque molesto, este error suele ser **m√°s tolerable** que un falso positivo.

### 4.3 Errores aceptables vs errores inaceptables

No todos los errores pesan igual.

En este proyecto distinguimos entre:
- errores **operativamente aceptables** (costosos pero manejables),
- errores **operativamente inaceptables** (cr√≠ticos o irreversibles).

Esta clasificaci√≥n **no la decide el modelo**.  
La decide el contexto del negocio y del sistema.

### 4.4 Asimetr√≠a del costo del error

Un principio clave:

> **Los errores no son sim√©tricos.**

Un falso positivo y un falso negativo pueden tener:
- impactos distintos,
- costos diferentes,
- consecuencias a largo plazo desiguales.

Esta asimetr√≠a es la raz√≥n por la cual:
- accuracy no es suficiente,
- el threshold importa,
- y la incertidumbre debe medirse.

üìå **Idea clave de esta secci√≥n**

> Antes de optimizar una m√©trica,  
> hay que decidir **qu√© error estamos dispuestos a aceptar**.

---
---
---

## 5. Riesgo operativo

Una vez identificados los tipos de error, el siguiente paso es entender el **riesgo real** que estos errores introducen en el sistema.

El riesgo no es una m√©trica.  
Es la **exposici√≥n del sistema a consecuencias no deseadas**.

---

### 5.1 Impacto del error en el negocio o sistema

Cada error genera impacto en al menos una de estas dimensiones:
- costo econ√≥mico,
- fricci√≥n operativa,
- p√©rdida de confianza,
- impacto en usuarios finales.

Un modelo puede equivocarse poco,  
pero si se equivoca **en el lugar incorrecto**, el impacto es alto.

### 5.2 Riesgo legal, financiero y reputacional

Algunos errores trascienden lo t√©cnico:

- **Legal**: incumplimientos, sanciones, responsabilidades.
- **Financiero**: p√©rdidas directas, costos de correcci√≥n.
- **Reputacional**: da√±o a la marca, p√©rdida de credibilidad.

Estos riesgos **no aparecen en las m√©tricas est√°ndar**,  
pero dominan la toma de decisiones reales.

### 5.3 Por qu√© minimizar el error promedio no minimiza el riesgo

Optimizar una m√©trica global (accuracy, F1, etc.) implica asumir que:
- todos los errores pesan igual,
- el contexto es homog√©neo.

En la pr√°ctica:
- los errores cr√≠ticos suelen ser pocos,
- pero concentran la mayor parte del riesgo.

Minimizar el error promedio puede **ocultar fallos graves**.

### 5.4 Relaci√≥n entre riesgo y automatizaci√≥n

Automatizar significa:
- aceptar riesgo a cambio de velocidad y escala.

Cuanto mayor es la automatizaci√≥n:
- menor intervenci√≥n humana,
- mayor exposici√≥n al error sist√©mico.

Por eso:
- no todo debe automatizarse,
- no todo debe decidirse,
- y no toda predicci√≥n debe convertirse en acci√≥n.

üìå **Idea clave de esta secci√≥n**

> Automatizar sin medir riesgo  
> es escalar el error.

---
---
---

## 6. Por qu√© a√∫n no hablamos de m√©tricas

Llegados a este punto, resulta tentador introducir m√©tricas y comenzar a ‚Äúmedir‚Äù.  
Sin embargo, hacerlo ahora ser√≠a **prematuro y conceptualmente incorrecto**.

---

### 6.1 Qu√© informaci√≥n falta en este punto

Todav√≠a no hemos definido:
- c√≥mo se representar√° el problema en datos,
- qu√© variable objetivo se usar√°,
- qu√© modelos se entrenar√°n,
- ni c√≥mo se producir√°n las predicciones.

Sin estas piezas, **no existe a√∫n nada que medir**.

### 6.2 Por qu√© la accuracy aqu√≠ ser√≠a enga√±osa

La accuracy responde a una pregunta muy espec√≠fica:

> ‚Äú¬øCon qu√© frecuencia el modelo acierta?‚Äù

Pero aqu√≠ la pregunta correcta es otra:

> ‚Äú¬øQu√© pasa cuando el sistema se equivoca?‚Äù

Antes de entender:
- el costo del error,
- su asimetr√≠a,
- y su impacto operativo,

cualquier m√©trica global puede generar una **falsa sensaci√≥n de control**.

### 6.3 Evaluar modelos vs evaluar decisiones

Es clave separar dos niveles:

- **Evaluaci√≥n del modelo**  
  Se centra en desempe√±o estad√≠stico.
- **Evaluaci√≥n de la decisi√≥n**  
  Se centra en consecuencias reales.

Un modelo puede ser estad√≠sticamente s√≥lido  
y, aun as√≠, inducir **malas decisiones**.

### 6.4 Preguntas que quedan abiertas

Este notebook deja abiertas, de forma deliberada, preguntas como:

- ¬øQu√© se√±al producir√° el modelo?
- ¬øScore o probabilidad?
- ¬øC√≥mo se convertir√° una predicci√≥n en acci√≥n?
- ¬øCu√°ndo el sistema deber√≠a abstenerse de decidir?

Estas preguntas **no se responden aqu√≠**.  
Se responder√°n m√°s adelante, cuando el contexto est√© completo.

üìå **Cierre del notebook**

> Antes de medir, hay que entender qu√© se est√° decidiendo  
> y qu√© se pone en riesgo al automatizar.

---
---
---

## 7. Definici√≥n del criterio de √©xito (pre-m√©tricas)

Antes de hablar de m√©tricas formales, es imprescindible definir **qu√© significa que el sistema funcione bien** desde un punto de vista operativo y de negocio.

Este criterio de √©xito **no es num√©rico todav√≠a**. Es conceptual, expl√≠cito y verificable.

---

### 7.1 Qu√© significa ‚Äúuna buena decisi√≥n‚Äù

Una buena decisi√≥n **no es simplemente acertar**.

En este sistema, una buena decisi√≥n es aquella que:
- es coherente con el riesgo asumido,
- se toma con informaci√≥n suficiente,
- y produce una consecuencia aceptable incluso cuando falla.

### 7.2 Cu√°ndo el sistema deber√≠a frenar

El sistema **no est√° obligado a decidir siempre**.

Debe ser capaz de:
- detener la automatizaci√≥n,
- escalar a revisi√≥n humana,
- o marcar una situaci√≥n como ambigua,

cuando las condiciones no son adecuadas para una decisi√≥n responsable.

### 7.3 Condiciones m√≠nimas que debe cumplir una predicci√≥n

Aunque a√∫n no definimos m√©tricas, s√≠ podemos establecer principios como:
- la predicci√≥n debe ser consistente,
- no contradictoria con se√±ales alternativas,
- y suficientemente clara para justificar una acci√≥n.

Estas condiciones luego se traducir√°n en **criterios cuantificables**.

### 7.4 Qu√© se considerar√° un fallo del sistema

Un fallo del sistema no es solo ‚Äúequivocarse‚Äù.

Es un fallo cuando:
- automatiza una decisi√≥n que no deb√≠a automatizar,
- ignora se√±ales de incertidumbre,
- o ejecuta una acci√≥n sin comprender el impacto.

üìå **Resultado de este punto**

Al cerrar este notebook, tenemos:
- una definici√≥n clara de √©xito,
- una noci√≥n expl√≠cita de fallo,
- y un marco de decisi√≥n **previo a cualquier m√©trica**.

Esto es la base sobre la que todo el resto del proyecto se construye.

---
---
---

## 8. Salida de este notebook

Este primer notebook no produce modelos, m√©tricas ni gr√°ficos.  
Produce algo m√°s importante: **restricciones claras para todo lo que vendr√° despu√©s**.

---

### 8.1 Resumen de la decisi√≥n definida

Hemos definido:
- qu√© decisi√≥n el sistema apoyar√°,
- en qu√© momento ocurre,
- y qu√© acci√≥n se ejecuta a partir de ella.

La decisi√≥n queda formalizada **antes de cualquier modelado**.

### 8.2 Resumen de los riesgos identificados

Se han identificado riesgos:
- operativos,
- financieros,
- y reputacionales,

asociados tanto al error como a la automatizaci√≥n indebida.

Estos riesgos **no desaparecen con m√©tricas altas**.

### 8.3 Restricciones impuestas al modelo futuro

A partir de este an√°lisis, el modelo futuro deber√°:
- justificar cu√°ndo decide,
- reconocer cu√°ndo no debe hacerlo,
- y alinearse con los costos reales del error.

No se aceptar√° un modelo que solo optimice una m√©trica.

### 8.4 C√≥mo este criterio guiar√° todo el proyecto

Todo el proyecto se guiar√° por este principio:

> **El modelo es un medio.  
> La decisi√≥n es el fin.  
> El riesgo es el marco.**

Los notebooks siguientes construir√°n sobre esta base,  
introduciendo datos, modelos y m√©tricas **sin perder de vista este criterio inicial**.

üìå **Cierre**

Este notebook establece el contrato conceptual del sistema.  
Nada de lo que siga puede violarlo.

---
---
---

## 9. Transici√≥n al siguiente notebook

Con la decisi√≥n, el riesgo y los criterios de √©xito claramente definidos, el siguiente paso ya no es modelar, sino **mirar los datos con otros ojos**.

---

### 9.1 Qu√© se analizar√° a continuaci√≥n

En el siguiente notebook se analizar√°:
- qu√© datos existen realmente,
- qu√© representan y qu√© no,
- y qu√© limitaciones imponen sobre la decisi√≥n definida.

No se buscar√° todav√≠a entrenar modelos, sino **entender la realidad que los datos reflejan**.

### 9.2 Por qu√© ahora s√≠ toca hablar de datos

Solo ahora tiene sentido introducir datos, porque:
- ya sabemos qu√© decisi√≥n deben apoyar,
- qu√© errores son cr√≠ticos,
- y qu√© riesgos no se pueden ignorar.

Los datos dejar√°n de ser un CSV  
y pasar√°n a ser **una aproximaci√≥n imperfecta a un problema real**.

### 9.3 Conexi√≥n con `02_data_reality_and_bias.ipynb`

El pr√≥ximo notebook, `02_data_reality_and_bias.ipynb`, se centrar√° en:
- explorar la distribuci√≥n real de los datos,
- detectar sesgos y desbalances,
- y evaluar si la data disponible permite ‚Äîo no‚Äî apoyar la decisi√≥n definida.

üìå **Continuidad**

> Definir la decisi√≥n sin datos evita modelos in√∫tiles.  
> Analizar los datos sin definir la decisi√≥n genera modelos peligrosos.

El siguiente notebook conecta ambos mundos.

---
---
---

üìå **Mensaje central del notebook**

> Un modelo puede ser t√©cnicamente correcto y operativamente peligroso.
> Aqu√≠ definimos las reglas del juego antes de entrenar nada.