# Pr√°ctica sobre remuestreo de los datos de la NASA 

Prompt  

Tengo datos meteorol√≥gicos de frecuencia: diaria, con atributo fecha en formato datetime de Python y quiero remuestrearlos con una funci√≥n de usuario de Python, a una frecuencia semanal (Pero de semana epidemiol√≥gica de domingo a s√°bado) y a la vez crear un tributo llamado "n√∫mero de d√≠as con lluvia", para colectar en el n√∫mero de d√≠as de cada semana con precipitaci√≥n mayor a 1 mm.  Siendo que el rango de fechas est√° desde 01-01_2021 a 31-12-2024

Vamos a resolverlo paso a paso.
Supongamos que tienes un **DataFrame `df`** con una columna de fechas (`'fecha'`) y otra con precipitaci√≥n (`'precipitacion'`), con frecuencia **diaria** desde el **01-01-2021 al 31-12-2024**.

El objetivo es:

* Remuestrear de **diario a semanal**, con semanas **epidemiol√≥gicas (domingo a s√°bado)**.
* Crear un atributo `"dias_con_lluvia"` que cuente cu√°ntos d√≠as en cada semana tuvieron precipitaci√≥n **> 1 mm**.

---



# Clave t√©cnica

En `pandas`, el par√°metro de frecuencia `'W-SAT'` indica **semanas que terminan el s√°bado**, es decir, **domingo a s√°bado**, que coincide con las semanas epidemiol√≥gicas.

---



### ‚úÖ Ejemplo completo en Python



In [3]:
import pandas as pd
import numpy as np

# Crear rango de fechas diarias
fechas = pd.date_range(start="2021-01-01", end="2024-12-31", freq="D")

# Simular precipitaci√≥n diaria (puedes reemplazarla por tus datos reales)
np.random.seed(42)
precipitacion = np.random.gamma(shape=2, scale=2, size=len(fechas))  # valores aleatorios

# Crear DataFrame
df = pd.DataFrame({
    "fecha": fechas,
    "precipitacion": precipitacion
})

# Asegurar que la columna fecha sea √≠ndice tipo datetime
df["fecha"] = pd.to_datetime(df["fecha"])
df = df.set_index("fecha")

# Definir funci√≥n personalizada para contar d√≠as con lluvia > 1 mm
def dias_con_lluvia(x):
    return (x > 1).sum()

# Remuestrear a frecuencia semanal (domingo a s√°bado)
df_semana = df.resample("W-SAT").agg({
    "precipitacion": ["sum", dias_con_lluvia]
})

# Renombrar columnas
df_semana.columns = ["precipitacion_total", "dias_con_lluvia"]

# Mostrar primeras filas
df_semana.head()


Unnamed: 0_level_0,precipitacion_total,dias_con_lluvia
fecha,Unnamed: 1_level_1,Unnamed: 2_level_1
2021-01-02,7.776288,2
2021-01-09,31.761719,7
2021-01-16,23.244774,6
2021-01-23,17.181001,6
2021-01-30,28.104019,7


```

---

### üîç Explicaci√≥n

* `resample('W-SAT')` ‚Üí Agrupa las fechas por semana epidemiol√≥gica (domingo‚Äìs√°bado).
* `.agg({...})` ‚Üí Aplica m√∫ltiples funciones de agregaci√≥n a la columna `'precipitacion'`.
* La funci√≥n `dias_con_lluvia(x)` cuenta cu√°ntos d√≠as en esa semana superan 1 mm de precipitaci√≥n.

---

### üìä Resultado (ejemplo)

| fecha      | precipitaci√≥n_media | precipitaci√≥n_total | d√≠as_con_lluvia |
| ---------- | ------------------- | ------------------- | --------------- |
| 2021-01-02 | 3.15                | 22.05               | 6               |
| 2021-01-09 | 2.84                | 19.88               | 5               |
| 2021-01-16 | 1.47                | 10.29               | 4               |
| ...        | ...                 | ...                 | ...             |

---

¬øQuieres que adem√°s te a√±ada una columna con el **n√∫mero de la semana epidemiol√≥gica (1 a 52/53)** y el **a√±o epidemiol√≥gico** (√∫til para an√°lisis epidemiol√≥gicos o de salud p√∫blica)?
