# Python #

## - Pacote NETCDF4 - ##

### 0) Referências: ###
- http://unidata.github.io/netcdf4-python/
- http://unidata.github.io/netcdf4-python/#section1
- http://unidata.github.io/netcdf4-python/#netCDF4.Dataset
- https://netcdf4-python.googlecode.com/svn/trunk/docs/netCDF4-module.html


É uma biblioteca do Python com a qual é possível criar, ler e alterar arquivos no formato netcdf. 

Pacotes Requeridos:

In [13]:
import netCDF4 as nc
%matplotlib inline

**%matplorlib inline** , serve para mostrar logo após a célula de código, o resultado gerado a partir dela.
### 1) Criando / Abrindo / Fechando um arquivo netCDF: ###

   No pacote netCDF4 existe o construtor (classe) chamado **Dataset**. Ele é utilizado para abrir, ler e alterar arquivos. O Dataset de um arquivo netCDF contém informações em dimensões, variáveis, grupos e atributos. Juntos eles descrevem o significado dos dados e as relações entre os dados armazenados no arquivo netCDF. Arquivos netCDF vêm em 5 formatos; **NETCDF3_CLASSIC, NETCDF3_64BIT_OFFSET, NETCDF3_64BIT_DATA, NETCDF4_CLASSIC,** e **NETCDF4**.   
   O modulo netCDF4 pode ler e alterar arquivos em qualquer um desses formatos. Quando criar um novo arquivo, o formato pode ser especificado usando a keyword **format** do Dataset. O formato padrão é o NETCDF4. Para ver qual é o formato de um dado arquivo, você pode usar o atributo __data_model__. Para fechar o arquivo netCDF, use o método close do Dataset.
   
   Segue um exemplo:

In [32]:
arquivo = nc.Dataset("brleste_oc_20160303.nc", "r")

In [31]:
print(arquivo.data_model)
arquivo.close()

NETCDF3_CLASSIC


Note que por causa da linha '<code> arquivo.close()</code>', quando essa célula for rodada novamente ocorrerá um erro e será necessário abrir novamente o arquivo pela célula acima para então conseguir o formato do netCDF.

#### - Keywords do Dataset - ####
def __init__(	self, filename, mode="r", clobber=True, diskless=False, persist=False, weakref=False, format='NETCDF4')

Analisando item a item, temos que:

 1. **filename**: nome do arquivo que contém o Dataset.
 
 2. **mode**: é o modo de acesso, que pode ser: 

 **r** : significa somente ler. Nenhum dado pode ser alterado.
 
 **w** : significa _write_ , escrever. Ele cria um novo arquivo e o arquivo com o mesmo nome é deletado.
 
 **a** ou **r+** : significa _append_; O arquivo existente é aberto para ser lido e alterado.
  
 3. **clobber**: Se estiver **True**(default), ao abrir um arquivo com o modo 'w' irá sobrepujar um arquivo existente com o mesmo nome. Caso esteja **False**, uma exceção será se o arquivo com o mesmo nome existir.
 
 _clobber definition (eng): to defeat someone very easily in a way that is embarrassing for the team that loses._ 
  
 5. **diskless**: caso **"True"**, cria um arquivo na memória ao invés do disco rígido.
  
 6. **persist**: se **"diskless=True"**, mantém o arquivo no disco quando ele é fechado. (default **False**)

 4. **format**: é o formato do arquivo netCDF( um deles: 'NETCDF4', 'NETCDF4_CLASSIC', 'NETCDF3_CLASSIC', 'NETCDF3_64BIT_OFFSET' ou 'NETCDF3_64BIT_DATA'). Só é relevante quando estiver no modo "**w**", caso contrário, o formato é automaticamente detectado.
  
 7. **keepweakref**: if True, child Dimension and Variable instances will keep weak references to the parent Dataset or Group object. Default is False, which means strong references will be kept. Having Dimension and Variable instances keep a strong reference to the parent Dataset instance, which in turn keeps a reference to child Dimension and Variable instances, creates circular references. Circular references complicate garbage collection, which may mean increased memory usage for programs that create may Dataset instances with lots of Variables. Setting keepweakref=True allows Dataset instances to be garbage collected as soon as they go out of scope, potential reducing memory usage. However, in most cases this is not desirable, since the associated Variable instances may still be needed, but are rendered unusable when the parent Dataset instance is garbage collected.
 
 #### - Variáveis do Dataset -

- **data_model**: describes the netCDF data model version, one of NETCDF3_CLASSIC, NETCDF4, NETCDF4_CLASSIC, NETCDF3_64BIT_OFFSET or NETCDF3_64BIT_DATA.

In [38]:
print (arquivo.data_model)

NETCDF3_CLASSIC


- **dimensions**: The dimensions dictionary maps the names of dimensions defined for the Group or Dataset to instances of the Dimension class. 

In [39]:
print (arquivo.dimensions)

OrderedDict([('time', <class 'netCDF4._netCDF4.Dimension'>: name = 'time', size = 1
), ('NbLatitudes', <class 'netCDF4._netCDF4.Dimension'>: name = 'NbLatitudes', size = 276
), ('NbLongitudes', <class 'netCDF4._netCDF4.Dimension'>: name = 'NbLongitudes', size = 301
)])


- **variables**: The variables dictionary maps the names of variables defined for this Dataset or Group to instances of the Variable class.

In [37]:
print (arquivo.variables)

OrderedDict([('time', <class 'netCDF4._netCDF4.Variable'>
int32 time(time)
    axis: T
    calendar: gregorian
    units: hours since 1950-01-01 00:00:00.0
    long_name: Time (hours since 1950-01-01)
    standard_name: time
    _CoordinateAxisType: Time
unlimited dimensions: 
current shape = (1,)
filling off
), ('NbLatitudes', <class 'netCDF4._netCDF4.Variable'>
float64 NbLatitudes(NbLatitudes)
    _FillValue: 1.84467440737e+19
    long_name: latitude
    units: degrees_north
    standard_name: latitude
    _CoordinateAxisType: Lat
    axis: Y
unlimited dimensions: 
current shape = (276,)
filling off
), ('NbLongitudes', <class 'netCDF4._netCDF4.Variable'>
float64 NbLongitudes(NbLongitudes)
    _FillValue: 1.84467440737e+19
    long_name: longitude
    units: degrees_east
    standard_name: longitude
    _CoordinateAxisType: Lon
    axis: X
unlimited dimensions: 
current shape = (301,)
filling off
), ('Grid_0001', <class 'netCDF4._netCDF4.Variable'>
int8 Grid_0001(time, NbLongitudes, N

- **groups**: The groups dictionary maps the names of groups created for this Dataset or Group to instances of the Group class (the Dataset class is simply a special case of the Group class which describes the root group in the netCDF4 file).

In [40]:
print (arquivo.groups)

OrderedDict()


- **vltypes**: The vltypes dictionary maps the names of variable-length types defined for the Group or Dataset to instances of the VLType class.

In [41]:
print (arquivo.vltypes)

OrderedDict()


- **path**: path shows the location of the Group in the Dataset in a unix directory format (the names of groups in the hierarchy separated by backslashes). A Dataset instance is the root group, so the path is simply '/'.

In [42]:
print (arquivo.path)

/


- **parent**: parent is a reference to the parent Group instance. None for the root group or Dataset instance.

In [43]:
print (arquivo.parent)

None


- **disk_format**: disk_format describes the underlying file format, one of NETCDF3, HDF5, HDF4, PNETCDF, DAP2, DAP4 or UNDEFINED. Only available if using netcdf C library version >= 4.3.1, otherwise will always return UNDEFINED.

In [44]:
print(arquivo.disk_format)

NETCDF3


- **enumtypes**: The enumtypes dictionary maps the names of Enum types defined for the Group or Dataset to instances of the EnumType class.

In [45]:
print (arquivo.enumtypes)

OrderedDict()


- **cmptypes**: The cmptypes dictionary maps the names of compound types defined for the Group or Dataset to instances of the CompoundType class.

In [46]:
print(arquivo.cmptypes)

OrderedDict()


### 2) Grupos em um arquivo netCDF ###

Os grupos em um netCDF (na versão 4) funcionam como diretórios no Sistema Operacional (SO). Os grupos servem como containers para variáveis, dimensões e atributos, assim como outros grupos. O Dataset cria um grupo especial, chamado 'root group', que é similar ao diretório raiz em um sistema operacional. 

Para criar um grupo, use o método <code> createGroup </code> do Dataset. O <code> createGroup </code> requer um único argumento, uma  string do python contendo o nome do novo grupo. 

In [73]:
rootgrp = nc.Dataset("teste.nc", "w", format='NETCDF4')
rootgrp.close()

In [74]:
rootgrp = nc.Dataset("teste.nc","a")
fcastgrp = rootgrp.createGroup("forecasts")
analgrp = rootgrp.createGroup("analyses")

In [69]:
print(rootgrp.groups)

OrderedDict([('forecasts', <class 'netCDF4._netCDF4.Group'>
group /forecasts:
    dimensions(sizes): 
    variables(dimensions): 
    groups: 
), ('analyses', <class 'netCDF4._netCDF4.Group'>
group /analyses:
    dimensions(sizes): 
    variables(dimensions): 
    groups: 
)])


Grupos podem existir dentro de grupos em um Dataset, como pastas existem dentro de pastas. Cada instância tem um atributo **<code>groups</code>** contendo todos os grupos que se encontram dentro daquele grupo.

Cada instância de um grupo também tem um atributo **<code> path </code>** que contém uma espécie de path de um diretório unix para esse grupo. 

Observe o exemplo: 

In [75]:
fcastgrp1 = rootgrp.createGroup("/forecasts/model1")
fcastgrp2 = rootgrp.createGroup("/forecasts/model2")
print(rootgrp.groups)

OrderedDict([('forecasts', <class 'netCDF4._netCDF4.Group'>
group /forecasts:
    dimensions(sizes): 
    variables(dimensions): 
    groups: model1, model2
), ('analyses', <class 'netCDF4._netCDF4.Group'>
group /analyses:
    dimensions(sizes): 
    variables(dimensions): 
    groups: 
)])


- ** Obs.: **Note que o atributo <code> groups </code> agora contém os crupos criados dentro de /forecast.     
<code>      
        OrderedDict([('forecasts', <class 'netCDF4._netCDF4.Group'>
        group /forecasts:
            dimensions(sizes): 
            variables(dimensions): 
            groups: model1, model2)
        
</code>

In [76]:
rootgrp.close()

### 3) Dimensões em um arquivo netCDF ###

netCDF define os tamanhos de todas as variáveis em termos de dimensões, então antes de qualquer variável ser criada as dimensões que elas usam devem ser  criadas antes. Um caso especial, pouco usado na prática, é o de uma variável escalar, que não tem dimensão.

Uma dimensão é criada usando o método <code> createDimension</code> do Dataset ou Grupo. Uma string do Python é usada para atribuir o nome da dimensão e um numero inteiro é usado para atribuir o tamanho. Para criar uma dimensão ilimitada (uma dimensão que possa ser adicionada - _appended to_), o valor do tamanho é configurado como <code> None </code> ou <code> 0 </code>.

Neste exemplo, tanto as dimensões **<code>time</code>** e **<code>level</code>** são ilimitadas. Ter mais de uma dimensão ilimitada é uma característica do netCDF4, nos arquivos netCDF3 só poderia haver uma, e ela deveria ser a primeira dimensão da variável.


In [77]:
rootgrp = nc.Dataset("teste.nc","a")

In [78]:
level = rootgrp.createDimension("level", None)
time = rootgrp.createDimension("time",None)
lat = rootgrp.createDimension("latitude", 73)
lon = rootgrp.createDimension("longitude",144)

Todas as dimensões foram armazenadas em um dicionário python.

In [79]:
print(rootgrp.dimensions)

OrderedDict([('level', <class 'netCDF4._netCDF4.Dimension'> (unlimited): name = 'level', size = 0
), ('time', <class 'netCDF4._netCDF4.Dimension'> (unlimited): name = 'time', size = 0
), ('latitude', <class 'netCDF4._netCDF4.Dimension'>: name = 'latitude', size = 73
), ('longitude', <class 'netCDF4._netCDF4.Dimension'>: name = 'longitude', size = 144
)])


Usando a função <code>len</code> com uma dimensão retorna o tamanho atual daquela dimensão. O método <code>isunlimited</code> de uma dimensão pode ser usado para determinar se a dimensão é ilimitada, ou _appendable_.


In [80]:
print(len(lon))

144


In [81]:
print(lat.isunlimited())

False


In [82]:
print(time.isunlimited())

True


"Printar" o <code>Dimension object</code> (dimobj) fornece informação resumida, incluindo o nome e o tamanho da dimensão, além de informar se são ilimitadas.

In [84]:
for dimobj in rootgrp.dimensions.values():
    print(dimobj)

<class 'netCDF4._netCDF4.Dimension'> (unlimited): name = 'level', size = 0

<class 'netCDF4._netCDF4.Dimension'> (unlimited): name = 'time', size = 0

<class 'netCDF4._netCDF4.Dimension'>: name = 'latitude', size = 73

<class 'netCDF4._netCDF4.Dimension'>: name = 'longitude', size = 144



O nome de Dimensões pode ser alterado usando o método **<code>netCDF4.Datatset.renameDimension</code>** de um Dataset ou Group.

### 4) Variáveis em um arquivo netCDF ###
