## O que veremos neste Jupyter Notebook?

1. Remover uma váriavel do arquivo
1. Adicionar uma nova variável no arquivo
1. Salva o resultado em um arquivo NetCDF
1. Renomear variáveis
1. Renomear dimensão
1. Reordenar dimensão
1. Concatenar (juntar) arquivos

## O que vou aprender no fim deste Jupyter Notebook?

**Noção** sobre processamento de dados no formato NetCDF.

## Importação de bibliotecas

In [31]:
import xarray as xr

## Leitura recomendada

[https://xarray.pydata.org/en/v2022.11.0/getting-started-guide/quick-overview.html](https://xarray.pydata.org/en/v2022.11.0/getting-started-guide/quick-overview.html)

## Abertura do arquivo

In [32]:
ds = xr.open_dataset("../dados/ERA5_Superficie_2021.nc")

## Explorar o conteúdo do arquivo aberto

In [33]:
ds

## Processando do arquivo

### Remover uma váriavel do arquivo

In [34]:
drop_tp = ds.drop_vars("tp")

### Remover várias variáveis do arquivo

In [35]:
drop = ds.drop_vars(["tp", "u10", "v10", "msl", "sp"])

Converte de Kelvin para Celsius.

In [36]:
tdc = drop["d2m"] - 273.15
ttc = drop["t2m"] - 273.15

Adiciona atributo ```units``` as variáveis criadas (tdc e ttc).

In [37]:
tdc.attrs['units'] = '°C' # Adiciona a unidade da variável de temperatura do ponto de orvalho.
ttc.attrs['units'] = '°C' # Adiciona a unidade da variávelde temperatura.

### Adicionar uma nova variável no arquivo

In [38]:
ds.assign(tt = ds['t2m'] - 273.15)
ds.assign(td = ds['d2m'] - 273.15)

In [39]:
new_ds = ds.assign(tt = ds['t2m'] - 273.15)
new_ds1 = new_ds.assign(td = ds['d2m'] - 273.15)

new_ds1.tt.attrs['units'] = '°C' # Adiciona a unidade da variável de temperatura do ponto de orvalho.
new_ds1.td.attrs['units'] = '°C'

In [40]:
new_ds1

Salva o resultado em um arquivo NetCDF.

In [41]:
new_ds1.to_netcdf("saida.nc")

In [42]:
new_ds1['td'].to_netcdf("td.nc")

### Renomear variáveis

Renomeia a variável de `tp` para `prec`.

In [43]:
ds

In [44]:
ds.rename({"tp":"prec"}) # Sempre será: "{antigo_nome":"novo_nome}".

In [45]:
ds

In [46]:
ds_rename = ds.rename({"tp":"prec"}) # Sempre será: "{antigo_nome":"novo_nome}".

In [47]:
ds_rename

Renomeia mais de uma variável.

In [48]:
ds_rename_tudo = ds.rename({"d2m":"td2m", "t2m":"tk2m", "sp":"pressure"})

In [49]:
ds_rename_tudo

### Renomear dimensão

In [50]:
ds

In [51]:
ds_nova_dim = ds.swap_dims({"longitude":"lon", "latitude":"lat"})# Sempre será: "{antigo_nome":"novo_nome}".

In [52]:
ds_nova_dim

## Reordenar dimensão

In [53]:
ds

In [54]:
ds_transpose = ds.transpose("longitude", "time", "latitude")

In [55]:
ds_transpose

Inverter a ordem de todas as dimensões.

In [56]:
ds_transpose1 = ds.transpose()

In [57]:
ds_transpose1

## Concatenar (juntar) arquivos

In [58]:
ds1 = xr.open_dataset("../dados/t2m.2019.mes.01.nc")
ds2 = xr.open_dataset("../dados/t2m.2019.mes.02.nc")
ds3 = xr.open_dataset("../dados/t2m.2019.mes.03.nc")

In [59]:
ds4 = xr.concat([ds1, ds2, ds3], dim='time')

In [60]:
ds4

## Abrir arquivos separados

Imagina que há vários arquivos, neste exemplo, arquivos que estão separados por dias.

In [62]:
ds = xr.open_mfdataset("../dados/chuva_diaria_merge_cptec/MERGE_CPTEC_????????.nc", combine='nested', concat_dim='time')

ds

Unnamed: 0,Array,Chunk
Bytes,60.43 MiB,672.66 kiB
Shape,"(92, 410, 420)","(1, 410, 420)"
Dask graph,92 chunks in 185 graph layers,92 chunks in 185 graph layers
Data type,float32 numpy.ndarray,float32 numpy.ndarray
"Array Chunk Bytes 60.43 MiB 672.66 kiB Shape (92, 410, 420) (1, 410, 420) Dask graph 92 chunks in 185 graph layers Data type float32 numpy.ndarray",420  410  92,

Unnamed: 0,Array,Chunk
Bytes,60.43 MiB,672.66 kiB
Shape,"(92, 410, 420)","(1, 410, 420)"
Dask graph,92 chunks in 185 graph layers,92 chunks in 185 graph layers
Data type,float32 numpy.ndarray,float32 numpy.ndarray
