# ‚öñÔ∏è Cap√≠tulo 7 ‚Äì Detecci√≥n de Anomal√≠as con One-Class SVM

En este cap√≠tulo se presenta el algoritmo **One-Class Support Vector Machine (One-Class SVM)**, una t√©cnica no supervisada para la detecci√≥n de anomal√≠as basada en el marco de las m√°quinas de vectores de soporte.  

Su fortaleza principal reside en que **aprende una frontera en el espacio de caracter√≠sticas que encierra la mayor parte de los datos considerados normales**, de modo que todo lo que quede fuera se interpreta como una anomal√≠a.  

---

## üéØ ¬øPor qu√© One-Class SVM?

La elecci√≥n de One-Class SVM responde a varios motivos:

- Es un modelo **matem√°ticamente s√≥lido**, derivado de las M√°quinas de Vectores de Soporte.  
- Puede modelar **fronteras no lineales complejas** mediante kernels como el RBF.  
- Funciona sin necesidad de etiquetas, lo que lo hace adecuado en contextos industriales donde no se dispone de clasificaciones fiables.  
- Permite un control expl√≠cito sobre el **porcentaje esperado de anomal√≠as** mediante el hiperpar√°metro $ \nu $.  

---

## üß≠ Objetivo de este cap√≠tulo

A lo largo del cap√≠tulo se presentar√°n:

- Los fundamentos te√≥ricos del One-Class SVM.  
- Su aplicaci√≥n sobre datos reales extra√≠dos de archivos MDF.  
- El impacto de distintos kernels y par√°metros en la detecci√≥n.  
- Una comparaci√≥n cualitativa de sus resultados con los obtenidos por Isolation Forest.  

Adem√°s, se discutir√°n las limitaciones pr√°cticas del modelo, en particular su **sensibilidad a la escala de los datos y al ajuste de hiperpar√°metros**.  

El cap√≠tulo concluir√° con la transici√≥n hacia modelos de **Deep Learning (Autoencoders)**, que ofrecen mayor capacidad de representaci√≥n.  

---

## üîç Intuici√≥n

El One-Class SVM busca encontrar un **hiperplano en el espacio de caracter√≠sticas** que maximice la separaci√≥n entre los datos normales y el origen.  

De forma intuitiva:  

> "One-Class SVM encierra la nube de puntos normales dentro de una frontera flexible. Todo lo que se salga de esa frontera se considera an√≥malo."

---

## üß† Fundamento Te√≥rico

El One-Class SVM se formula como un problema de optimizaci√≥n:  

Minimizar:  

$$
\frac{1}{2} \|w\|^2 + \frac{1}{\nu n}\sum_{i=1}^n \xi_i - \rho
$$  

Sujeto a:  

$$
(w \cdot \phi(x_i)) \geq \rho - \xi_i, \quad \xi_i \geq 0
$$  

Donde:

- $ \phi(x) $: transformaci√≥n del espacio de caracter√≠sticas mediante el kernel.  
- $ w $: vector de pesos.  
- $ \rho $: umbral que define la frontera.  
- $ \nu \in (0,1] $: par√°metro que controla la fracci√≥n de outliers y el n√∫mero de vectores de soporte.  

La funci√≥n de decisi√≥n resultante es:  

$$
f(x) = \text{sign}((w \cdot \phi(x)) - \rho)
$$  

---

## üìê Funci√≥n de Decisi√≥n y Scores

- **Salida de predicci√≥n**: $ f(x) \in \{+1, -1\} $  
  - +1 ‚Üí Punto normal  
  - -1 ‚Üí An√≥malo  

- **Score de decisi√≥n**:  
  Valores continuos que indican qu√© tan lejos est√° el punto de la frontera.  
  - Valores grandes y positivos ‚Üí normales con alta confianza.  
  - Valores cercanos a 0 ‚Üí puntos ambiguos.  
  - Valores negativos ‚Üí anomal√≠as.  

---

## ‚öôÔ∏è Par√°metros Clave

- **ŒΩ (nu)**: fracci√≥n m√°xima de anomal√≠as esperadas (t√≠picamente entre 0.01 y 0.1).  
- **kernel**: define la forma de la frontera (m√°s usado: RBF).  
- **Œ≥ (gamma)**: controla la influencia de cada punto en el kernel RBF.  
- **coef0**: relevante en kernels polinomiales o sigmoides.  

---

## ‚úÖ Ventajas

- Basado en una teor√≠a matem√°tica robusta.  
- Flexible gracias al uso de kernels.  
- Permite ajustar expl√≠citamente el porcentaje esperado de anomal√≠as.  

---

## üö´ Limitaciones

- **Sensibilidad a la escala de los datos** ‚Üí requiere normalizaci√≥n/estandarizaci√≥n previa.  
- El rendimiento depende mucho de la elecci√≥n de **ŒΩ** y **Œ≥**.  
- Computacionalmente m√°s costoso que Isolation Forest en datasets grandes.  
- Puede sufrir de **overfitting** si se ajustan mal los par√°metros del kernel.  

---

### üîß Ejemplo concreto

Supongamos que se analiza el **consumo el√©ctrico de un veh√≠culo h√≠brido** en funci√≥n de dos variables:

- **Nivel de carga de la bater√≠a (%)**  
- **Velocidad del veh√≠culo (km/h)**  

En condiciones normales, el sistema de gesti√≥n de energ√≠a mantiene una relaci√≥n **no lineal**:  
- A velocidades bajas (20‚Äì50 km/h) el coche utiliza m√°s bater√≠a.  
- A velocidades medias (80‚Äì120 km/h) predomina el motor de combusti√≥n y el consumo el√©ctrico desciende.  
- En frenadas o descensos, incluso puede observarse **recuperaci√≥n de energ√≠a** (consumo negativo).

El One-Class SVM entrenado sobre datos de conducci√≥n normal aprender√° una **frontera curva y cerrada** que encierra esta nube de puntos con forma caracter√≠stica.  

Ahora, imaginemos que aparece un punto con:  

- Velocidad = 100 km/h  
- Nivel de bater√≠a cayendo bruscamente (como si se descargara a alta potencia)  

Esta situaci√≥n es **inconsistente con el patr√≥n aprendido**: a esa velocidad, la bater√≠a deber√≠a estar estable o descargarse muy lentamente.  

‚û°Ô∏è El modelo lo marcar√° como **an√≥malo**, ya que cae fuera de la regi√≥n habitual, revelando un posible fallo en el sistema de gesti√≥n energ√©tica o en la bater√≠a.

---

## üîó Referencias

Sch√∂lkopf, Bernhard, et al.  
**"Estimating the support of a high-dimensional distribution."** Neural computation 13.7 (2001): 1443-1471.  

Tax, David MJ, and Robert PW Duin.  
**"Support vector data description."** Machine learning 54 (2004): 45-66.  


## üß™ Validaci√≥n experimental de One-Class SVM

Para evaluar el rendimiento de nuestro **One-Class SVM**, seguimos el mismo protocolo definido en el resto de modelos:

1. **Partici√≥n temporal**: generamos una serie sint√©tica con anomal√≠as inyectadas y dividimos en *train*, *val* y *test*. Unimos **train+val** para la b√∫squeda de hiperpar√°metros y reservamos **test** para la evaluaci√≥n final.
2. **Validaci√≥n con TSCV**: utilizamos un **Time Series Cross-Validation** con ventanas deslizantes (par√°metros `P_train`, `num_windows`, etc.) para respetar la causalidad temporal y evitar *look-ahead*.
3. **Preprocesado consistente**: aplicamos el mismo pipeline de preprocesado (detecci√≥n/mitigaci√≥n de outliers con filtro de Hampel, tratamiento estacional si procede y normalizaci√≥n). Este paso es especialmente cr√≠tico en SVM, ya que el algoritmo es muy sensible a la escala de las variables.
4. **B√∫squeda de hiperpar√°metros**: realizamos un *grid search* sobre:
   - `ŒΩ` (*nu*): fracci√≥n m√°xima de anomal√≠as esperadas (controla el margen de decisi√≥n).
   - `kernel`: tipo de kernel (RBF, lineal, polin√≥mico).
   - `Œ≥` (*gamma*): par√°metro del kernel RBF que define la influencia local de cada punto.
5. **M√©tricas**: calculamos **precision**, **recall**, **F1**, **ROC-AUC**, **NAB** y **window coverage**. Seleccionamos las 5 mejores configuraciones de validaci√≥n seg√∫n **NAB**.
6. **Evaluaci√≥n final**: reentrenamos las configuraciones *top-5* en **train+val** y medimos en **test**. Para cada configuraci√≥n mostramos la curva ROC y la visualizaci√≥n de anomal√≠as detectadas frente a anomal√≠as reales en las se√±ales.

> Nota: en esta implementaci√≥n, los par√°metros `ŒΩ` y `Œ≥` juegan un papel an√°logo al `contamination` en Isolation Forest:  
> - **ŒΩ alto** ‚Üí el modelo considera m√°s puntos como an√≥malos (mayor *recall*, menor *precision*).  
> - **ŒΩ bajo** ‚Üí el modelo es m√°s estricto, detecta menos anomal√≠as pero con mayor confianza.  
> El *grid search* permite equilibrar esta sensibilidad de acuerdo con las m√©tricas objetivo.
