# NetCDF de la Temperatura de la Superficie del Mar (SST - Sea Surface temperature)

El manejo de datos climáticos implica trabajar con una variedad de formatos de archivos que contienen información sobre el clima y el tiempo. Cada formato de archivo tiene sus propias características y se utiliza en diferentes contextos.

NetCDF (Network Common Data Form) es un conjunto de bibliotecas de software y formatos de datos independientes de la máquina que permiten crear, acceder y compartir datos científicos orientados a matrices. También es un estándar comunitario para compartir datos científicos.

Los archivos NetCDF son un formato de archivo destinado a almacenar datos científicos multidimensionales (variables) como la temperatura, la humedad, la presión, la velocidad del viento y la dirección. Su extensión se define como ‘.nc’.

Para trabajar con archivos NetCDF en Python, puedes utilizar la biblioteca netCDF4, que es una de las herramientas más utilizadas para leer y escribir datos en formato NetCDF en Python. Documentación aquí.


## 1. Importar bibliotecas

In [2]:
%matplotlib inline
import numpy as np  
from netCDF4 import Dataset

## 2. Cargar datos NetCDF

Puede descargar los datos utilizando wget o aria2c en Linux.

In [3]:
#!wget ftp://ftp.cdc.noaa.gov/Datasets/ncep.reanalysis.derived/surface_gauss/skt.mon.mean.nc
ncfile = '../data/skt.mon.mean.nc'

## 3. Extraer variables

Abrir archivo NetCDF e imprimir el controlador del archivo. Mostrará la información de sus variables en las últimas líneas, como se muestra a continuación:

* Plataforma: Modelo
* Convenciones: COARDS
* Dimensiones(tamaños): lon(192), lat(94), time(687)
* variables(dimensiones): float32 **lat(lat), float32 lon(lon), float64 time(time), float32 skt(time,lat,lon)**


In [4]:
fh = Dataset(ncfile, mode='r')
print(fh)
fh.close()

<type 'netCDF4._netCDF4.Dataset'>
root group (NETCDF3_CLASSIC data model, file format NETCDF3):
    title: 4x daily NMC reanalysis
    history: Tue Jul  6 00:05:45 1999: ncrcat skt.mon.mean.nc /Datasets/ncep.reanalysis.derived/surface_gauss/skt.mon.mean.nc /dm/dmwork/nmc.rean.ingest/combinedMMs/skt.mon.mean.nc
renamevars Fri Dec 18 12:16:41 1998 from airsst.mon.mean.nc
/home/hoop/crdc/cpreanjuke2farm/cpreanjuke2farm Mon Oct 23 21:04:20 1995 from air.sfc.gauss.85.nc
created 95/03/13 by Hoop (netCDF2.3)
    description: Data is from NMC initialized reanalysis
(4x/day).  It consists of T42  variables interpolated to
pressure surfaces from model (sigma) surfaces.
    platform: Model
    Conventions: COARDS
    dimensions(sizes): lon(192), lat(94), time(687)
    variables(dimensions): float32 [4mlat[0m(lat), float32 [4mlon[0m(lon), float64 [4mtime[0m(time), float32 [4mskt[0m(time,lat,lon)
    groups: 


In [5]:
fh = Dataset(ncfile, mode='r')
lon = fh.variables['lon'][:]
lat = fh.variables['lat'][:]
nctime = fh.variables['time'][:]
t_unit = fh.variables['time'].units
skt = fh.variables['skt'][:]

try :
    t_cal = fh.variables['time'].calendar
except AttributeError :
    t_cal = u"gregorian"

fh.close()

## 4. Acceder al primer y último valor de latitud

In [6]:
lat[0]

88.542

In [7]:
lat[-1]

-88.542

## 5. Selección de región de interés

* Lat: -50 ~ -90
* Lon: 0 ~ 360

In [8]:
lat_so = lat[-21:-1]
lon_so = lon
skt_so = skt[:,-21:-1,:]

## 6. Guardar datos de la región

Guardar los datos de la subregión (varios arrays) en un solo archivo en formato .npz sin comprimir utilizando np.savez.

In [9]:
np.savez('../data/skt.so.mon.mean.npz', skt_so=skt_so, lat_so=lat_so, lon_so=lon_so)

In [10]:
npzfile = np.load('../data/skt.so.mon.mean.npz')
npzfile.files

['skt_so', 'lat_so', 'lon_so']