# Capítulo 8 – Detección de Anomalías con Autoencoders

En este capítulo se introduce el enfoque de **Autoencoders**, uno de los primeros modelos de **Deep Learning** aplicados a la detección de anomalías.  

Su principal fortaleza radica en que **aprenden una representación comprimida (codificación) de los datos normales y luego intentan reconstruirlos**.  
Cuando el modelo encuentra un dato anómalo —algo que no encaja en el patrón aprendido— el **error de reconstrucción** tiende a ser mayor, lo que permite identificar la anomalía.

## Motivación

La elección de Autoencoders responde a varias razones:

- Modelan **relaciones no lineales complejas** en los datos.  
- No requieren etiquetas, únicamente muestras representativas del comportamiento normal.  
- Permiten incorporar **estructuras temporales** (ventanas deslizantes o variantes recurrentes).  
- Funcionan como paso previo a arquitecturas más avanzadas, como los **LSTM Autoencoders**.  
- Representan una primera aproximación a las capacidades del **Deep Learning** en el campo de la detección de anomalías.

## Objetivo del capítulo

Este capítulo abordará:

- Los fundamentos teóricos de los Autoencoders y su uso en detección de anomalías.  
- La construcción de un modelo base entrenado sobre datos sintéticos y datos reales en formato MDF.  
- El análisis del **error de reconstrucción** como score de anomalía.  
- La comparación cualitativa con los modelos clásicos (PCA, Isolation Forest, One-Class SVM).  

Finalmente, se discutirán las principales variantes de Autoencoders y se introducirá su extensión hacia arquitecturas recurrentes.

## Intuición

El Autoencoder es una red neuronal formada por dos componentes:

- **Encoder**: reduce la dimensionalidad de los datos, generando una representación latente.  
- **Decoder**: reconstruye los datos originales a partir de dicha representación.  

De forma intuitiva:

> Un Autoencoder aprende a copiar los datos normales. Cuando recibe un patrón desconocido o anómalo, no consigue reconstruirlo con precisión y el error de reconstrucción se incrementa.

## Fundamento teórico

El entrenamiento de un Autoencoder se plantea como la minimización del error de reconstrucción:

$$
\min_{\theta} L(x, g_{\theta}(f_{\theta}(x)))
$$

donde:

- $f_{\theta}(x)$: función de codificación (encoder).  
- $g_{\theta}(z)$: función de decodificación (decoder).  
- $L(\cdot)$: función de pérdida, habitualmente el **MSE** (Mean Squared Error).  

El score de anomalía para un punto $x$ se define como:

$$
s(x) = \|x - \hat{x}\|^2
$$

Si $s(x)$ supera un umbral definido, el punto se clasifica como anómalo.

## Función de decisión y scores

- **Salida del modelo**: reconstrucción $\hat{x}$ de la entrada $x$.  
- **Score de anomalía**: error de reconstrucción.  
  - Valores bajos → dato normal.  
  - Valores altos → potencial anomalía.

## Parámetros clave

- Dimensión del espacio latente.  
- Número de capas y neuronas en la red.  
- Funciones de activación (ReLU, tanh, etc.).  
- Función de pérdida (MSE, MAE o variantes robustas).  
- Regularización (dropout, weight decay, sparsity).  

## Ventajas

- Capturan dependencias no lineales en los datos.  
- Escalan adecuadamente a problemas de alta dimensionalidad.  
- Pueden adaptarse a grandes volúmenes de datos.  
- Flexibles: existen variantes recurrentes y convolucionales.  

## Limitaciones

- Elevado coste computacional y de entrenamiento en comparación con modelos clásicos.  
- Requieren un ajuste cuidadoso de la arquitectura y del proceso de optimización.  
- Riesgo de sobreajuste si se entrenan durante demasiado tiempo o con datos ruidosos.  
- El umbral de anomalías debe definirse de forma adecuada para cada caso.  

## Ejemplo

Consideremos la monitorización de las **vibraciones de un motor** a través de tres sensores.  

En condiciones normales, las señales están correlacionadas entre sí. Si el motor empieza a vibrar de forma irregular en uno de los ejes, el Autoencoder —entrenado para reconstruir patrones normales— no podrá reproducir esa señal anómala con fidelidad.  

El error de reconstrucción crecerá significativamente en ese punto, lo que permitirá marcar la observación como anomalía.

## Referencias

- Sakurada, Mayu, and Takehisa Yairi.  
  *Anomaly detection using autoencoders with nonlinear dimensionality reduction.* MLSDA, 2014.   

- Bui, H., et al.  
  *Predicting sector configuration transitions with autoencoder-based anomaly detection.* ICRAT, 2018.

- GitHub – thomasdubdub.  
  *Autoencoder Anomaly Detection.* Disponible en: [https://github.com/thomasdubdub/autoencoder-anomaly-detection](https://github.com/thomasdubdub/autoencoder-anomaly-detection)  
  