# El m√©todo `.shift()` de pandas
En **pandas**, el m√©todo **`.shift()`** es una herramienta fundamental para **desplazar (rezagar o adelantar) una serie de tiempo**, y por eso es clave cuando construyes **atributos meteorol√≥gicos con rezago** para modelos estad√≠sticos o de *machine learning* (ARIMA/SARIMAX, regresi√≥n, Random Forest, SVM, etc.).



Dado tu trabajo con **series meteorol√≥gicas y epidemiol√≥gicas**, este m√©todo aparece en casi todas las etapas de *feature engineering* temporal.

---

## 1. ¬øQu√© hace `.shift()`?



```python
Series.shift(periods=1, freq=None)
DataFrame.shift(periods=1, freq=None)
```



* **`periods`**: n√∫mero de pasos que se desplaza la serie

  * positivo ‚Üí **rezago (lag)**
  * negativo ‚Üí **adelanto (lead)**
* **`freq`**: desplaza el √≠ndice temporal (no los datos), se usa menos en ML

üìå **Idea clave**:

> `.shift()` **no mezcla informaci√≥n del futuro**, por lo que evita *data leakage*.

---

## 2. Ejemplo b√°sico con una serie meteorol√≥gica

Supongamos una serie diaria de **temperatura media**:



```python
import pandas as pd

fechas = pd.date_range("2024-01-01", periods=5, freq="D")
temp = pd.Series([28, 29, 30, 31, 32], index=fechas, name="temp_media")

temp
```



### Rezago de 1 d√≠a



```python
temp.shift(1)
```



Resultado conceptual:

| Fecha      | temp_media | temp_media_lag1 |
| ---------- | ---------- | --------------- |
| 2024-01-01 | 28         | NaN             |
| 2024-01-02 | 29         | 28              |
| 2024-01-03 | 30         | 29              |
| 2024-01-04 | 31         | 30              |
| 2024-01-05 | 32         | 31              |

üìå El **NaN inicial** aparece porque no existe informaci√≥n previa.

---



## 3. `.shift()` en DataFrames meteorol√≥gicos

Con varias variables:



```python
df = pd.DataFrame({
    "temp": [28, 29, 30, 31, 32],
    "humedad": [70, 72, 75, 78, 80],
    "precipitacion": [0, 5, 0, 10, 2]
}, index=fechas)
```



## Crear rezagos de un d√≠a



```python
df_lag1 = df.shift(1)
```



O agregarlos al mismo DataFrame:



```python
df["temp_lag1"] = df["temp"].shift(1)
df["humedad_lag1"] = df["humedad"].shift(1)
df["precip_lag1"] = df["precipitacion"].shift(1)
```



---

## 4. Creaci√≥n sistem√°tica de atributos con rezago

Muy √∫til en proyectos como **alertas tempranas epidemiol√≥gicas**:



```python
for lag in [1, 3, 7, 14]:
    df[f"temp_lag{lag}"] = df["temp"].shift(lag)
    df[f"humedad_lag{lag}"] = df["humedad"].shift(lag)
```



üìå Interpretaci√≥n:

* `lag 1` ‚Üí efecto inmediato
* `lag 7` ‚Üí efecto semanal
* `lag 14` ‚Üí incubaci√≥n o efectos retardados

---



## 5. Uso did√°ctico: interpretaci√≥n causal

En meteorolog√≠a‚Äìsalud:

> ‚ÄúEl n√∫mero de casos hoy **no depende del clima de hoy**, sino del clima de **hace varios d√≠as**‚Äù.

Formalmente:

$$
\text{Casos}*t = f(\text{Temp}*{t-7}, \text{Hum}*{t-10}, \text{Prec}*{t-14})
$$

En c√≥digo:



```python
df["temp_lag7"] = df["temp"].shift(7)
df["humedad_lag10"] = df["humedad"].shift(10)
df["precip_lag14"] = df["precipitacion"].shift(14)
```



---

## 6. Diferencia entre `.shift()` y `.diff()`

| M√©todo     | Qu√© hace                   | Uso t√≠pico                 |
| ---------- | -------------------------- | -------------------------- |
| `.shift()` | Desplaza la serie          | Rezagos, causalidad        |
| `.diff()`  | Resta valores consecutivos | Tendencia, estacionariedad |

Ejemplo combinado:



```python
df["temp_cambio"] = df["temp"].diff()
df["temp_lag1"] = df["temp"].shift(1)
```



---

## 7. `.shift()` y modelos de ML



### Matriz de entrenamiento



```python
X = df[[
    "temp_lag1", "temp_lag7",
    "humedad_lag1", "humedad_lag7"
]]

y = df["casos"]
```



‚ö†Ô∏è **Siempre eliminar NaN antes de entrenar**:



```python
Xy = pd.concat([X, y], axis=1).dropna()
```



---

## 8. `.shift(freq=...)` (menos usado)



```python
df.shift(freq="D")
```



* Desplaza el **√≠ndice temporal**
* No mueve los valores
* √ötil para alineaciones de calendario, no para ML



---

## 9. Buenas pr√°cticas en proyectos reales

‚úî Crear rezagos coherentes con el fen√≥meno
‚úî Documentar el significado f√≠sico de cada lag
‚úî Evitar usar valores futuros (`shift(-1)`)
‚úî Probar m√∫ltiples ventanas (1, 7, 14, 21, 28 d√≠as)
‚úî Combinar con promedios m√≥viles (`rolling()`)



Ejemplo potente:

```python


df["temp_lag7"] = df["temp"].shift(7)
df["temp_media_7d"] = df["temp"].shift(1).rolling(7).mean()


```

---

## 10. Mensaje clave para tus estudiantes

> **`.shift()` transforma una serie de tiempo en un conjunto de variables explicativas que respetan el tiempo y permiten modelar relaciones causales.**

Si quieres, en el siguiente mensaje puedo:

* Proponerte **ejercicios did√°cticos** con datos meteorol√≥gicos
* Mostrar un **caso completo SARIMAX**
* Conectar `.shift()` con **Random Forest o SVM** para predicci√≥n de casos epidemiol√≥gicos
