# Cópulas: Teoría, Aplicaciones y Ejemplo en Python


## 1. Introducción Teórica

Una **cópula** es una función que permite separar la dependencia entre variables de sus distribuciones marginales. En otras palabras, las cópulas vinculan distribuciones univariadas para formar distribuciones multivariadas.

**Teorema fundamental (Sklar, 1959):**

Sea $F$ una distribución conjunta con marginales $F_1, F_2, \dots, F_n$, entonces existe una cópula $C$ tal que:

$$F(x_1, \dots, x_n) = C(F_1(x_1), \dots, F_n(x_n))$$

Además, si las marginales son continuas, la cópula es única.

## 2. ¿Para qué se usan las cópulas?

1. **Modelar dependencia más allá de la correlación lineal**:
   - Permiten capturar colas pesadas o asimetrías en la dependencia.
   - Ejemplo: riesgo financiero (eventos extremos conjuntos).

2. **Construcción flexible de distribuciones multivariadas**:
   - Se eligen marginales según los datos (Normal, T, Exponencial, etc.).
   - Se elige una cópula que modele la dependencia (Gaussiana, t, Clayton, Gumbel...).

3. **Aplicaciones**:
   - Finanzas: Riesgo de crédito, dependencia de activos.
   - Seguros: Riesgos conjuntos de siniestros.
   - Hidrología: Dependencia entre precipitaciones y caudales.
   - Machine Learning: Generación de datos sintéticos.

## 3. Tipos de cópulas comunes

- **Gaussiana**: Dependencia simétrica, no captura colas.
- **t de Student**: Captura colas pesadas (eventos extremos conjuntos).
- **Archimedeanas**: Simples y flexibles (Clayton, Gumbel, Frank).
  - Clayton: Dependencia en la cola inferior.
  - Gumbel: Dependencia en la cola superior.
  - Frank: Dependencia simétrica, moderada.

## 4. Librerías en Python para cópulas

- **copulas** (MIT Data to AI Lab):
  - Soporta cópulas gaussianas, t y archimedeanas.
  - Fácil de usar y bien documentada.

- **statsmodels**:
  - Implementa cópulas gaussianas, t y algunas Archimedeanas.
  - Robusta y bien mantenida.

- **copulalib**:
  - Sencilla, soporta Archimedeanas.
  - Menos mantenida, más académica.

**Recomendación:** Usar `copulas` o `statsmodels` en proyectos serios.

## 5. Ejemplo práctico en Python con `copulas`
En este ejemplo generamos datos correlacionados, ajustamos una cópula gaussiana y luego generamos nuevas muestras.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from copulas.multivariate import GaussianMultivariate

# Generamos datos sintéticos correlacionados
np.random.seed(42)
size = 500
x = np.random.normal(0, 1, size)
y = 0.8 * x + np.random.normal(0, 0.5, size)
data = np.column_stack((x, y))

# Ajustamos una cópula gaussiana
gaussian_copula = GaussianMultivariate()
gaussian_copula.fit(data)

# Generamos nuevas muestras desde la cópula
samples = gaussian_copula.sample(size)

# Visualizamos datos originales vs generados
fig, axs = plt.subplots(1, 2, figsize=(12,5))
axs[0].scatter(data[:,0], data[:,1], alpha=0.5)
axs[0].set_title('Datos originales')

axs[1].scatter(samples[:,0], samples[:,1], alpha=0.5, color='orange')
axs[1].set_title('Datos simulados desde la cópula')

plt.show()

## 6. Conclusión

- Las cópulas permiten separar la estructura de dependencia de las marginales.
- Son útiles cuando la correlación lineal no es suficiente.
- En Python se puede usar `copulas` o `statsmodels`.
- Aplicaciones: riesgo financiero, seguros, hidrología, generación de datos sintéticos.