# üìä Autocorrelaci√≥n (ACF) y Autocorrelaci√≥n Parcial (PACF)

**Curso de Introducci√≥n a Series Temporales para Ciencia de Datos**

En este notebook aprenderemos:
- Qu√© es la autocorrelaci√≥n y c√≥mo interpretarla
- Qu√© es la autocorrelaci√≥n parcial y en qu√© se diferencia
- C√≥mo visualizar ACF y PACF
- C√≥mo usar estos conceptos para seleccionar modelos

---

## 1. Instalaci√≥n de librer√≠as necesarias

In [None]:
# Instalamos statsmodels si no est√° disponible
try:
    import statsmodels
except ImportError:
    !pip install statsmodels

# Importamos las librer√≠as
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
from statsmodels.tsa.stattools import acf, pacf
import warnings
warnings.filterwarnings('ignore')

# Configuraci√≥n de gr√°ficos
plt.style.use('seaborn-v0_8-darkgrid')
plt.rcParams['figure.figsize'] = (12, 6)

---

## 2. ¬øQu√© es la Autocorrelaci√≥n (ACF)?

La **autocorrelaci√≥n** mide la correlaci√≥n de una serie temporal consigo misma en diferentes retardos (lags).

**Pregunta clave:** ¬øQu√© tan relacionado est√° el valor de hoy con el de ayer, anteayer, hace 7 d√≠as, etc.?

### 2.1 Ejemplo simple: Serie con tendencia

In [None]:
# Creamos una serie temporal simple con tendencia
np.random.seed(42)
tiempo = np.arange(100)
serie_tendencia = 2 * tiempo + np.random.normal(0, 10, 100)

# Visualizamos
plt.figure(figsize=(12, 4))
plt.plot(serie_tendencia, linewidth=2)
plt.title('Serie Temporal con Tendencia', fontsize=14, fontweight='bold')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.grid(True, alpha=0.3)
plt.show()

print("üìå Observaci√≥n: Esta serie tiene una tendencia ascendente clara.")
print("   Los valores consecutivos est√°n muy relacionados entre s√≠.")

### 2.2 Gr√°fico de Autocorrelaci√≥n (ACF)

In [None]:
# Graficamos la ACF
fig, ax = plt.subplots(figsize=(12, 5))
plot_acf(serie_tendencia, lags=30, ax=ax)
plt.title('Autocorrelaci√≥n (ACF) - Serie con Tendencia', fontsize=14, fontweight='bold')
plt.xlabel('Lag (Rezago)')
plt.ylabel('Autocorrelaci√≥n')
plt.tight_layout()
plt.show()

print("\nüîç Interpretaci√≥n del gr√°fico ACF:")
print("   - Las barras azules muestran la correlaci√≥n en cada lag")
print("   - El √°rea sombreada indica el nivel de significancia estad√≠stica")
print("   - Si una barra sale del √°rea sombreada, esa correlaci√≥n es significativa")
print("   - Aqu√≠ vemos que la correlaci√≥n decae MUY LENTAMENTE ‚Üí se√±al de tendencia/no estacionariedad")

### 2.3 Calculando valores num√©ricos de ACF

In [None]:
# Calculamos los primeros 10 valores de ACF
acf_values = acf(serie_tendencia, nlags=10)

print("\nüìä Valores de Autocorrelaci√≥n para los primeros 10 lags:")
print("-" * 50)
for i, valor in enumerate(acf_values):
    print(f"Lag {i}: {valor:.4f}")

print("\nüí° Nota: El lag 0 siempre es 1.0 (correlaci√≥n perfecta consigo mismo)")

---

## 3. ¬øQu√© es la Autocorrelaci√≥n Parcial (PACF)?

La **autocorrelaci√≥n parcial** mide la correlaci√≥n entre la serie y un lag espec√≠fico, **eliminando el efecto de los lags intermedios**.

**Analog√≠a:** Imagina que estudias c√≥mo tu estado de √°nimo de hoy se relaciona con el de hace 3 d√≠as:
- **ACF:** Incluye el efecto indirecto (hoy ‚Üí ayer ‚Üí anteayer ‚Üí hace 3 d√≠as)
- **PACF:** Solo la relaci√≥n directa entre hoy y hace 3 d√≠as

### 3.1 Comparaci√≥n ACF vs PACF

In [None]:
# Creamos una serie autoregresiva AR(2)
# Esto significa: valor_actual = 0.7 * valor_anterior + 0.2 * valor_hace_2 + ruido
np.random.seed(123)
n = 200
serie_ar2 = [0, 0]

for i in range(2, n):
    nuevo_valor = 0.7 * serie_ar2[i-1] + 0.2 * serie_ar2[i-2] + np.random.normal(0, 1)
    serie_ar2.append(nuevo_valor)

serie_ar2 = np.array(serie_ar2)

# Visualizamos la serie
plt.figure(figsize=(12, 4))
plt.plot(serie_ar2, linewidth=1.5, alpha=0.8)
plt.title('Serie Temporal AR(2)', fontsize=14, fontweight='bold')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.grid(True, alpha=0.3)
plt.show()

print("üìå Esta es una serie AR(2): cada valor depende de los 2 valores anteriores")

### 3.2 Gr√°ficos ACF y PACF lado a lado

In [None]:
# Creamos gr√°ficos comparativos
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# ACF
plot_acf(serie_ar2, lags=20, ax=axes[0])
axes[0].set_title('Autocorrelaci√≥n (ACF)', fontsize=13, fontweight='bold')
axes[0].set_xlabel('Lag')
axes[0].set_ylabel('ACF')

# PACF
plot_pacf(serie_ar2, lags=20, ax=axes[1], method='ywm')
axes[1].set_title('Autocorrelaci√≥n Parcial (PACF)', fontsize=13, fontweight='bold')
axes[1].set_xlabel('Lag')
axes[1].set_ylabel('PACF')

plt.tight_layout()
plt.show()

print("\nüîç Interpretaci√≥n para serie AR(2):")
print("   ACF:  Decae gradualmente (patr√≥n exponencial/sinusoidal)")
print("   PACF: Corta abruptamente despu√©s del lag 2")
print("   ‚úÖ Esto confirma que es un proceso AR(2)")

---

## 4. Casos pr√°cticos: Identificando patrones

### 4.1 Serie con Estacionalidad

In [None]:
# Creamos una serie con patr√≥n estacional (cada 12 per√≠odos)
np.random.seed(456)
t = np.arange(120)
estacionalidad = 10 * np.sin(2 * np.pi * t / 12)
ruido = np.random.normal(0, 2, 120)
serie_estacional = estacionalidad + ruido

# Visualizamos
fig, axes = plt.subplots(3, 1, figsize=(12, 10))

# Serie temporal
axes[0].plot(serie_estacional, linewidth=2)
axes[0].set_title('Serie con Estacionalidad (per√≠odo = 12)', fontsize=13, fontweight='bold')
axes[0].set_xlabel('Tiempo')
axes[0].set_ylabel('Valor')
axes[0].grid(True, alpha=0.3)

# ACF
plot_acf(serie_estacional, lags=40, ax=axes[1])
axes[1].set_title('ACF - Observa los picos cada 12 lags', fontsize=13, fontweight='bold')

# PACF
plot_pacf(serie_estacional, lags=40, ax=axes[2], method='ywm')
axes[2].set_title('PACF', fontsize=13, fontweight='bold')

plt.tight_layout()
plt.show()

print("üîç Interpretaci√≥n:")
print("   - La ACF muestra picos significativos cada 12 lags")
print("   - Esto indica estacionalidad con per√≠odo 12")
print("   - Para modelar esto, necesitar√≠as componentes estacionales (SARIMA)")

### 4.2 Serie Ruido Blanco (sin correlaci√≥n)

In [None]:
# Ruido blanco: valores completamente aleatorios, sin correlaci√≥n
np.random.seed(789)
ruido_blanco = np.random.normal(0, 1, 200)

# Visualizamos
fig, axes = plt.subplots(3, 1, figsize=(12, 10))

# Serie temporal
axes[0].plot(ruido_blanco, linewidth=1, alpha=0.7)
axes[0].set_title('Ruido Blanco (valores aleatorios independientes)', fontsize=13, fontweight='bold')
axes[0].set_xlabel('Tiempo')
axes[0].set_ylabel('Valor')
axes[0].grid(True, alpha=0.3)
axes[0].axhline(y=0, color='r', linestyle='--', alpha=0.5)

# ACF
plot_acf(ruido_blanco, lags=30, ax=axes[1])
axes[1].set_title('ACF - No hay correlaciones significativas', fontsize=13, fontweight='bold')

# PACF
plot_pacf(ruido_blanco, lags=30, ax=axes[2], method='ywm')
axes[2].set_title('PACF - Tampoco hay correlaciones parciales', fontsize=13, fontweight='bold')

plt.tight_layout()
plt.show()

print("üîç Interpretaci√≥n:")
print("   - Casi todas las barras est√°n dentro del √°rea sombreada")
print("   - No hay autocorrelaci√≥n significativa ‚Üí es ruido puro")
print("   - Este es el resultado ideal para los RESIDUOS de un buen modelo")

---

## 5. Gu√≠a pr√°ctica: ¬øQu√© modelo usar?

### Reglas de decisi√≥n basadas en ACF y PACF

In [None]:
# Tabla resumen
print("=" * 70)
print("GU√çA R√ÅPIDA: Selecci√≥n de Modelos seg√∫n ACF y PACF")
print("=" * 70)
print("\n1Ô∏è‚É£ PROCESO AR(p) - Autoregresivo")
print("   ACF:  Decae gradualmente (exponencial o sinusoidal)")
print("   PACF: Corta despu√©s del lag p")
print("   ‚Üí Modelo: AR(p)")

print("\n2Ô∏è‚É£ PROCESO MA(q) - Media M√≥vil")
print("   ACF:  Corta despu√©s del lag q")
print("   PACF: Decae gradualmente")
print("   ‚Üí Modelo: MA(q)")

print("\n3Ô∏è‚É£ PROCESO ARMA(p,q)")
print("   ACF:  Decae gradualmente")
print("   PACF: Decae gradualmente")
print("   ‚Üí Modelo: ARMA(p,q)")

print("\n4Ô∏è‚É£ NO ESTACIONARIA")
print("   ACF:  Decae MUY lentamente o no decae")
print("   ‚Üí Necesitas diferenciar la serie antes de modelar (ARIMA)")

print("\n5Ô∏è‚É£ ESTACIONALIDAD")
print("   ACF:  Picos significativos en m√∫ltiplos del per√≠odo estacional")
print("   ‚Üí Usa componentes estacionales (SARIMA)")

print("\n6Ô∏è‚É£ RUIDO BLANCO")
print("   ACF y PACF: Sin correlaciones significativas")
print("   ‚Üí No necesitas modelar (o tu modelo ya captur√≥ todo)")
print("=" * 70)

---

## 6. Ejemplo aplicado: Identificando el modelo correcto

Vamos a crear tres series diferentes y practicar la identificaci√≥n:

In [None]:
np.random.seed(2024)

# Serie 1: AR(1)
ar1 = [0]
for i in range(150):
    ar1.append(0.8 * ar1[-1] + np.random.normal(0, 1))
ar1 = np.array(ar1[1:])

# Serie 2: MA(1)
errores = np.random.normal(0, 1, 151)
ma1 = [errores[0]]
for i in range(1, 150):
    ma1.append(errores[i] + 0.6 * errores[i-1])
ma1 = np.array(ma1)

# Serie 3: ARMA(1,1)
arma = [0]
errores_arma = np.random.normal(0, 1, 151)
for i in range(1, 150):
    arma.append(0.7 * arma[-1] + errores_arma[i] + 0.4 * errores_arma[i-1])
arma = np.array(arma[1:])

# Funci√≥n para analizar cada serie
def analizar_serie(serie, titulo):
    fig, axes = plt.subplots(3, 1, figsize=(12, 9))

    # Serie
    axes[0].plot(serie, linewidth=1.5)
    axes[0].set_title(f'{titulo} - Serie Temporal', fontsize=12, fontweight='bold')
    axes[0].grid(True, alpha=0.3)

    # ACF
    plot_acf(serie, lags=20, ax=axes[1])
    axes[1].set_title('ACF', fontsize=11, fontweight='bold')

    # PACF
    plot_pacf(serie, lags=20, ax=axes[2], method='ywm')
    axes[2].set_title('PACF', fontsize=11, fontweight='bold')

    plt.tight_layout()
    plt.show()

# Analizamos cada serie
print("üîç EJERCICIO: Identifica el tipo de proceso en cada caso\n")

print("=" * 60)
print("SERIE 1")
print("=" * 60)
analizar_serie(ar1, "Serie 1")
print("¬øQu√© modelo sugieres? (Piensa antes de ver la respuesta abajo)\n")

print("=" * 60)
print("SERIE 2")
print("=" * 60)
analizar_serie(ma1, "Serie 2")
print("¬øQu√© modelo sugieres?\n")

print("=" * 60)
print("SERIE 3")
print("=" * 60)
analizar_serie(arma, "Serie 3")
print("¬øQu√© modelo sugieres?\n")

### Respuestas:

In [None]:
print("\n" + "=" * 60)
print("‚úÖ RESPUESTAS")
print("=" * 60)
print("\nSERIE 1:")
print("  ACF ‚Üí Decae gradualmente")
print("  PACF ‚Üí Corta despu√©s del lag 1")
print("  ‚û°Ô∏è Modelo sugerido: AR(1)")

print("\nSERIE 2:")
print("  ACF ‚Üí Corta despu√©s del lag 1")
print("  PACF ‚Üí Decae gradualmente")
print("  ‚û°Ô∏è Modelo sugerido: MA(1)")

print("\nSERIE 3:")
print("  ACF ‚Üí Decae gradualmente")
print("  PACF ‚Üí Decae gradualmente")
print("  ‚û°Ô∏è Modelo sugerido: ARMA(1,1) o similar")

---

## 7. Resumen y Conclusiones

### Conceptos clave:

1. **Autocorrelaci√≥n (ACF)**: Mide la correlaci√≥n total entre valores separados por k per√≠odos
   
2. **Autocorrelaci√≥n Parcial (PACF)**: Mide la correlaci√≥n directa, eliminando efectos intermedios

3. **Uso principal**: Identificar el orden de modelos ARIMA(p,d,q)

### Checklist para an√°lisis de series temporales:

Visualiza tu serie temporal primero  

1. Calcula y grafica ACF y PACF
2. Identifica patrones: estacionalidad, tendencia, estacionariedad
3. Usa las reglas de decisi√≥n para seleccionar el modelo base
4. Valida los residuos del modelo ajustado (deben parecer ruido blanco)

### Pr√≥ximos pasos:

- Aprender sobre diferenciaci√≥n para hacer series estacionarias
- Ajustar modelos ARIMA usando las pistas de ACF/PACF
- Validar modelos mediante an√°lisis de residuos
- Explorar modelos estacionales (SARIMA)

---


# EOF (End Of File)