# **01 ‚Äì Exploratory Data Analysis (EDA) ‚Äì ERA5 Precipitation**

Este notebook tiene por objetivo realizar una exploraci√≥n inicial de los datos ERA5 de precipitaci√≥n,
verificar su estructura espacial y temporal, y preparar la base para su uso posterior en el modelo AE+DMD.

---

## **1. Cargar librer√≠as y funciones**

In [1]:
import xarray as xr
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from src.data_prep import load_era5_dataset, to_dataframe

ModuleNotFoundError: No module named 'src'

## **2. Cargar dataset NetCDF**

In [None]:
path = "data/raw/era5_precipitation_sample.nc"
ds = load_era5_dataset(path, variable="tp")
ds

## **3. Visualizar estructura temporal**

In [None]:
ds["tp"].isel(latitude=100, longitude=100).plot()
plt.title("Serie temporal de precipitaci√≥n (punto espec√≠fico)")
plt.show()


## **4. Conversi√≥n a DataFrame**

In [None]:
df = to_dataframe(ds, "tp")
df.head()


## **5. Distribuci√≥n temporal**

In [None]:
df["date"] = pd.to_datetime(df["time"]).dt.date
daily = df.groupby("date")["value"].mean().reset_index()

plt.figure(figsize=(12,4))
plt.plot(daily["date"], daily["value"], color="royalblue")
plt.title("Precipitaci√≥n diaria promedio ‚Äì Chile")
plt.xlabel("Fecha")
plt.ylabel("Precipitaci√≥n (m)")
plt.grid(True)
plt.show()


## 6. **Mapa promedio espacial**

In [None]:
mean_map = df.groupby(["latitude", "longitude"])["value"].mean().reset_index()
pivot = mean_map.pivot_table(index="latitude", columns="longitude", values="value")

plt.figure(figsize=(8,6))
plt.imshow(pivot, origin="lower", cmap="Blues", extent=[df.longitude.min(), df.longitude.max(), df.latitude.min(), df.latitude.max()])
plt.title("Precipitaci√≥n promedio (mm)")
plt.colorbar(label="mm")
plt.xlabel("Longitud")
plt.ylabel("Latitud")
plt.show()


## 7. **Guardar versi√≥n procesada**

In [None]:
from src.data_prep import aggregate_daily, save_processed

df_daily = aggregate_daily(df)
save_processed(df_daily, "data/processed/era5_daily.csv")


üìò Notas:

Sustituir "tp" por la variable que corresponda a precipitaci√≥n acumulada (depende de la versi√≥n de ERA5).

Este EDA puede ampliarse para correlacionar precipitaci√≥n con temperatura o NDVI satelital.