![imagenes](logo.png)

# Criterios de diseño y decisión

Hasta ahora hemos visto cómo funciona una red neuronal por dentro. Ya sabemos que no es magia: es una sucesión de capas que transforman información.

Desde el inicio usamos una analogía clara:  **un antro con varios salones y porteros**, donde cada capa (salón) filtra la información de los clientes… 
y al final **se toma una decisión**.

En este capítulo no vamos a aprender técnicas nuevas.  
Vamos a entender **cómo se toman realmente las decisiones dentro del antro**.

## El antro sí abre… pero ¿a quién deja pasar?

Imagina que tienes un antro. A la entrada no tomas ninguna decisión. 
La información del cliente pasa por varios salones, y en cada uno hay una cierta cantidad de porteros distinto (las neuronas):

En la celda de entrada, se reciben los datos de vestimenta, edad, comportamiento, historial, etc. En la primera celda de la capa oculta, los porteros juzgan esta información y la procesan con una función de activación.

Cada salón filtra información y la pasa, ya procesada, al siguiente salón. Eso es exactamente lo que hace una red neuronal.

Sin embargo, **el antro puede funcionar perfectamente y aun así tomar malas decisiones.**


## Entrenar no es decidir

Una red puede estar muy bien entrenada. Los porteros pueden estar perfectamente coordinados. Las reglas pueden estar bien aprendidas. Y aun así, el antro puede fallar.

Porque entrenar la red no es lo mismo que decidir qué hacer al final. El problema casi nunca es que falte un portero más. El problema es **qué criterio usa el último portero para decidir**.


## ¿Cuál es la decisión final del antro?

Al final del recorrido siempre hay **una decisión**, y solo una:

**“¿Dejamos entrar a este cliente o no?”**

Eso es **clasificación**: puede ser binaria (entra / no entra) o multiclase (VIP, general, no entra).

**“Que entren todos… pero ¿cuánto van a gastar?”**

Eso es **regresión**: No decides quién entra, sino **cuánto vale cada cliente**.

La red interna puede ser la misma. Los porteros pueden ser los mismos.  **Lo que cambia es la decisión final.**


## El error más común

Muchos problemas en Deep Learning no ocurren porque la red sea mala, sino porque no se definió bien qué decisión debía tomarse.

Por ejemplo
- tratar un problema de gasto como si fuera clasificación,  
- usar accuracy cuando una clase es crítica,  
- optimizar una pérdida que no refleja la decisión final.

Si el antro no sabe **qué quiere decidir**,  ningún número de porteros lo va a arreglar.


## Pérdida y métrica

La función de pérdida y la métrica **no hacen el mismo trabajo**. Piensa en dos trabajadores distintos en el antro: el capitán y el gerente.
- uno se encarga de **entrenar a los demás porteros**,  
- otro se encarga de **decidir si el antro está funcionando bien**.

La pérdida ajusta pesos. La métrica evalúa decisiones. Por eso puede pasar algo que al inicio confunde:
- la pérdida baja,  
- pero la métrica que importa no mejora.

No es un error. Es una señal de que **estás entrenando una cosa y evaluando otra**.

## Regularizar es poner reglas al antro

Regularizar no es castigar a la red. Es poner reglas claras dentro del antro.

- L2 limita qué tan extremas pueden ser las reglas de los porteros.  
- Dropout introduce incertidumbre: “¿y si este portero hoy no está?”  
- Early stopping decide cuándo cerrar el entrenamiento antes de memorizar.

Activar todo sin pensar no hace al antro más seguro. Hace al diseño **menos consciente**.

## El antro mínimo suficiente

No buscamos el antro más grande de la ciudad. Buscamos el antro que **funciona bien con las reglas necesarias**. Más salones no garantizan mejores decisiones. Más porteros no garantizan mejor filtrado.

Si el antro ya toma buenas decisiones con cierta estructura, crecerlo más solo aumenta el riesgo de memorizar caras en lugar de aprender patrones.


## Leer lo que pasa dentro del antro

Aquí no entrenamos un modelo nuevo. Observamos uno que ya conocemos.

La idea es responder con claridad:
- ¿qué estaban filtrando los porteros?  
- ¿qué decisión se estaba tomando al final?  
- ¿qué regla era la más importante?  
- ¿por qué se detuvo el entrenamiento?  

No se trata de obtener un mejor número. Se trata de **entender el comportamiento del antro**.


## Cuando el antro “funciona” pero está mal diseñado

Típicamente *probé muchas redes y me quedé con la que dio más accuracy*, o *le agregué capas hasta que funcionó* o *activé todas las regularizaciones*. Eso no es diseño. Eso es dejar entrar gente al azar hasta que el antro se llena. Deep Learning no es probar todo. Es **saber qué reglas poner y por qué**.

## Antes de cambiar el tipo de antro

En los siguientes capítulos vamos a cambiar el tipo de porteros:

- porteros especializados en imágenes (CNN),  
- porteros que recuerdan el historial del cliente (RNN).

Pero la lógica **no cambia**. Siempre habrá filtros, reglas y una decisión final.

Las CNN y las RNN no son antros distintos. Son **antros con porteros especializados**.

A partir de aquí, entrenar redes deja de ser un proceso mecánico. Empieza a ser un ejercicio de diseño. Ya no preguntamos ¿qué arquitectura uso? 

Preguntamos primero ¿qué decisión quiero tomar al final del recorrido? Cuando esa pregunta está clara, la red empieza a tener sentido.