# üìò Exploraci√≥n de formatos clim√°ticos: NetCDF y GRIB
**Curso AtmosCol-2023 ‚Äì Cuadernillo Did√°ctico**

Este cuaderno est√° dise√±ado para introducir los dos formatos de archivo m√°s comunes en el an√°lisis de datos meteorol√≥gicos y clim√°ticos: **NetCDF** y **GRIB**. Est√° pensado para ser completado en aproximadamente 20 minutos y utiliza exclusivamente Python.

## ‚ú® Introducci√≥n
Los modelos meteorol√≥gicos y los sat√©lites generan enormes vol√∫menes de datos. Estos se almacenan en formatos especializados que permiten eficiencia y flexibilidad. En este cuaderno aprender√°s a reconocer, leer y explorar los formatos **NetCDF** y **GRIB** usando Python. Estos conocimientos son esenciales para cualquier persona que trabaje en ciencia del clima, meteorolog√≠a operativa o an√°lisis satelital.

## ‚öôÔ∏è Prerrequisitos
Este cuaderno requiere conocimientos b√°sicos de Python y las siguientes librer√≠as:

```python
import xarray as xr
import matplotlib.pyplot as plt
# Para archivos GRIB
# pip install cfgrib
```

## üì¶ Formato NetCDF
**NetCDF (Network Common Data Form)** es un formato de archivo binario auto-descriptivo ampliamente utilizado en las ciencias atmosf√©ricas.

### üìä Estructura conceptual
![NetCDF](sandbox:/mnt/data/A_digital_educational_diagram_provides_a_conceptua.png)

### üîç Caracter√≠sticas principales
- Almacena datos multidimensionales (tiempo, latitud, longitud, nivel)
- Permite metadatos descriptivos
- Soporta estructuras jer√°rquicas (NetCDF-4)

### ‚úÖ Ventajas
- F√°cil de explorar con `xarray`
- Compatible con muchas herramientas cient√≠ficas
- Ideal para almacenamiento a largo plazo

### ‚ö†Ô∏è Desventajas
- Tama√±o de archivo mayor comparado con GRIB
- Puede ser m√°s lento para acceso puntual

### üîÑ Versiones
- **Classic**: estructura simple y universal
- **NetCDF-4**: permite compresi√≥n y grupos jer√°rquicos

### üõ†Ô∏è Tips ETL en Python
- Usa `ds.sel()` y `ds.isel()` para filtrar por dimensi√≥n
- Verifica unidades (`ds.attrs`, `ds.variable.attrs`)
- Asegura el formato de fechas (`time` en UTC)

In [None]:
# Lectura b√°sica NetCDF
ds = xr.open_dataset('datos/ejemplo.nc')
ds

In [None]:
# Visualizaci√≥n de una variable
ds['nombre_variable'].isel(time=0).plot()

## üì¶ Formato GRIB
**GRIB (GRIdded Binary)** es un formato binario eficiente utilizado principalmente para pron√≥sticos num√©ricos del tiempo.

### üìä Estructura conceptual
![GRIB](sandbox:/mnt/data/A_two-dimensional_digital_diagram_depicts_the_conc.png)

### üîç Caracter√≠sticas principales
- Datos almacenados como registros binarios con encabezados
- Alta eficiencia en tama√±o y lectura
- Muy usado por servicios meteorol√≥gicos operativos

### ‚úÖ Ventajas
- Tama√±o de archivo reducido
- Acceso puntual eficiente
- Ideal para distribuci√≥n de pron√≥sticos

### ‚ö†Ô∏è Desventajas
- Menos intuitivo que NetCDF
- Requiere herramientas espec√≠ficas como `cfgrib`

### üîÑ Versiones
- **GRIB1**: formato m√°s simple y a√∫n en uso
- **GRIB2**: admite m√°s metadatos y compresi√≥n

### üõ†Ô∏è Tips ETL en Python
- Usa `engine='cfgrib'` con `xarray`
- Explora claves con `filter_by_keys` si hay m√∫ltiples campos
- Presta atenci√≥n al paso temporal (`step`), tipo de nivel y superficie

In [None]:
# Lectura b√°sica GRIB
ds_grib = xr.open_dataset('datos/ejemplo.grib', engine='cfgrib')
ds_grib

In [None]:
# Visualizaci√≥n de una variable
ds_grib['nombre_variable'].isel(time=0).plot()

## üìä Comparaci√≥n general
| Aspecto        | NetCDF                    | GRIB                      |
|----------------|-----------------------------|----------------------------|
| Compresi√≥n     | Opcional (NetCDF-4)         | Alta (GRIB2)               |
| Usabilidad     | M√°s intuitivo               | M√°s eficiente              |
| Finalidad      | Archivos cient√≠ficos        | Distribuci√≥n operativa     |
| Estructura     | Auto-descriptiva            | Encabezados + binario      |

## ‚úÖ Conclusiones
Ambos formatos son esenciales en meteorolog√≠a. NetCDF es m√°s flexible para an√°lisis y documentaci√≥n, mientras que GRIB es √≥ptimo para pron√≥sticos y distribuci√≥n de modelos. Manejar ambos con Python permite construir flujos ETL robustos para proyectos clim√°ticos, energ√©ticos y operativos.

## üìö Recursos y Bibliograf√≠a
- Earth Lab. (s.f.). *Introduction to Climate Data in NetCDF Format*. University of Colorado Boulder. https://www.earthdatascience.org/courses/use-data-open-source-python/hierarchical-data-formats-hdf/intro-to-climate-data/
- ECMWF. (2014). *GRIB ‚Äì NetCDF: Setting the Scene*. https://www.ecmwf.int/sites/default/files/elibrary/2014/13706-grib-netcdf-setting-scene.pdf
- UCAR Unidata. (s.f.). *NetCDF Documentation*. https://www.unidata.ucar.edu/software/netcdf/docs/
- ECMWF. (s.f.). *GRIB API & ecCodes*. https://confluence.ecmwf.int/display/ECC