In [27]:
import requests
import pendulum
from pathlib import Path
import os
import sys

In [28]:
"""
Caso não exista a pasta 'downloads', ela é criada ao chamar este módulo
"""
#caminho_base = utils.dir_abs
diretorio_saida = Path(f'cfs_clima_82_09/')
diretorio_saida.mkdir(exist_ok=True, parents=True)


def auxiliar_download(url_base:str, data_requerida:pendulum.datetime, nome_arquivo:str) -> bool:
    """ Subfunção de download(). Não é chamada diretamente.
    Faz a requisição do dado de TSM no repositório da NOAA.
    Args:
        url_base (str): Parte imutável do link de endereço.
        data_requerida (pendulum.datetime): data do dado procurado.
        nome_arquivo (str): [description] Nome do arquivo a ser requisitado.
    Returns:
        bool: True = dado baixado, False= erro 404 | arquivo não disponível.
    """

    url=f'{url_base}/{nome_arquivo}'
    resp=requests.get(url)

    if resp.status_code == 200:
        resp=requests.get(url).content
        diretorio = Path(diretorio_saida, nome_arquivo)

        with open(diretorio, "wb") as arquivo_:
            arquivo_.write(resp)
            print(f"{nome_arquivo} [ok]")
            mensagem_de_sucesso = True

    elif resp.status_code == 404:
        print(f'Erro 404. {nome_arquivo} ainda não disponível')
        mensagem_de_sucesso = False

    return mensagem_de_sucesso


def download(data_string:str=None, hoje:bool=False) -> str:
    """Chama a função de download dos dados de temperatura oceânica do NOAA.
    Caso o dado final não esteja pronto, baixa o preliminar.
    Args:
        data_string (str, optional): [DD-MM-YYYY] data do dado procurado. Defaults to None.
        hoje (bool, optional): Habilita o dia atual na hora da execução. Sobrescreve o data_string. Defaults to False.
    Returns:
        str: Nome do arquivo baixado
    """

    data_requerida = pendulum.now('America/Sao_Paulo') if hoje else pendulum.from_format(data_string, 'DD-MM-YYYY')
    #url_base = 'https://www.ncei.noaa.gov/data/sea-surface-temperature-optimum-interpolation/v2.1/access/avhrr'
    url_base2='https://ftp.emc.ncep.noaa.gov/cmb/sst/oimonth_v2/GRIB'
    url_base='https://ftp.cpc.ncep.noaa.gov/precip/PORT/sst/oimonth_v2/GRIB/'

    nome_arquivo = f'oiv2mon.{data_requerida.format("YYYYMM")}.grb'	
    sucesso = auxiliar_download(url_base, data_requerida, nome_arquivo)
    if sucesso:
        print(f'{nome_arquivo} {sucesso}')
    else:
        print(f'>>> Tratativa de erro - link 2<<< {nome_arquivo}')
        sucesso = auxiliar_download(url_base2, data_requerida, nome_arquivo)
    '''
    if sucesso:
        tipo = "consistido"
        return nome_arquivo, tipo
    else :
        nome_arquivo =  f'oiv2mon.{data_requerida.format("YYYYMM")}198111.grb'	
        sucesso = auxiliar_download(url_base, data_requerida, nome_arquivo)
        
        if sucesso:
            tipo = "preliminar"
            return nome_arquivo, tipo
        else:
            sys.exit('A data solicitada ainda não possui dados')
    '''

In [29]:
#import tsm
import pendulum

inicio = pendulum.datetime(1982,1,1)    #(1991, 1, 1)
fim = pendulum.datetime(2009, 12, 31)
periodo = pendulum.period(inicio, fim)

for dt in periodo.range('months'):
    data_string = dt.format('DD-MM-YYYY')

    download(data_string=data_string)

Erro 404. oiv2mon.198201.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198201.grb
oiv2mon.198201.grb [ok]
Erro 404. oiv2mon.198202.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198202.grb
oiv2mon.198202.grb [ok]
Erro 404. oiv2mon.198203.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198203.grb
oiv2mon.198203.grb [ok]
Erro 404. oiv2mon.198204.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198204.grb
oiv2mon.198204.grb [ok]
Erro 404. oiv2mon.198205.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198205.grb
oiv2mon.198205.grb [ok]
Erro 404. oiv2mon.198206.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198206.grb
oiv2mon.198206.grb [ok]
Erro 404. oiv2mon.198207.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198207.grb
oiv2mon.198207.grb [ok]
Erro 404. oiv2mon.198208.grb ainda não disponível
>>> Tratativa de erro - link 2<<< oiv2mon.198208.grb
oiv2mon.

In [30]:
import xarray as xr

In [15]:
ds = xr.open_dataset('download/oiv2mon.202012.grb')

In [16]:
ds

In [31]:
diretorio_saida

PosixPath('cfs_clima_82_09')

In [32]:
dataset = xr.open_mfdataset(f'{diretorio_saida}/*.grb', concat_dim="valid_time", combine="nested",
                data_vars='minimal', coords='minimal', compat='override',
                backend_kwargs={
                    "filter_by_keys": {
                        "typeOfLevel": "surface",
                        "shortName": "t",
                    },
                 },
                parallel=True)

In [33]:
dataset

Unnamed: 0,Array,Chunk
Bytes,83.06 MiB,253.12 kiB
Shape,"(336, 180, 360)","(1, 180, 360)"
Count,1009 Graph Layers,336 Chunks
Type,float32,numpy.ndarray
"Array Chunk Bytes 83.06 MiB 253.12 kiB Shape (336, 180, 360) (1, 180, 360) Count 1009 Graph Layers 336 Chunks Type float32 numpy.ndarray",360  180  336,

Unnamed: 0,Array,Chunk
Bytes,83.06 MiB,253.12 kiB
Shape,"(336, 180, 360)","(1, 180, 360)"
Count,1009 Graph Layers,336 Chunks
Type,float32,numpy.ndarray


In [34]:
clima_tsm = dataset.t.groupby('valid_time.month').mean()

In [35]:
clima_tsm

Unnamed: 0,Array,Chunk
Bytes,2.97 MiB,253.12 kiB
Shape,"(12, 180, 360)","(1, 180, 360)"
Count,1070 Graph Layers,12 Chunks
Type,float32,numpy.ndarray
"Array Chunk Bytes 2.97 MiB 253.12 kiB Shape (12, 180, 360) (1, 180, 360) Count 1070 Graph Layers 12 Chunks Type float32 numpy.ndarray",360  180  12,

Unnamed: 0,Array,Chunk
Bytes,2.97 MiB,253.12 kiB
Shape,"(12, 180, 360)","(1, 180, 360)"
Count,1070 Graph Layers,12 Chunks
Type,float32,numpy.ndarray


In [36]:
clima_tsm.to_netcdf('oisst_climatologia_1982-2009.nc')

In [37]:
import recorta_dado
import pandas as pd

In [38]:
dicionario = {
            'mes'   : [1,2,3,4,5,6,7,8,9,10,11,12],
            'nino34': [],
}

latitude=(5, -5)
longitude=(-170, -120)

In [39]:
for mes in range(1,12+1):
    tsm = clima_tsm.sel(month=mes)
    
    #for regiao in regioes.keys():

    tsm_nino = recorta_dado.main(tsm,
        contorno_tipo='lat_lon',
        tipo='grib',
        latitude=[ latitude[0], latitude[1] ], 
        longitude=[ longitude[0], longitude[1] ]
        )

    valor = tsm_nino.mean(dim=["latitude", "longitude"]) 
    valor = valor - 273.15
    valor = round(float(valor.values), 2)
    
    dicionario['nino34'].append(valor)

    print(f'O valor da região nino34 no mês {mes} é : {valor}')

O valor da região nino34 no mês 1 é : 26.48
O valor da região nino34 no mês 2 é : 26.67
O valor da região nino34 no mês 3 é : 27.18
O valor da região nino34 no mês 4 é : 27.76
O valor da região nino34 no mês 5 é : 27.84
O valor da região nino34 no mês 6 é : 27.64
O valor da região nino34 no mês 7 é : 27.22
O valor da região nino34 no mês 8 é : 26.81
O valor da região nino34 no mês 9 é : 26.71
O valor da região nino34 no mês 10 é : 26.68
O valor da região nino34 no mês 11 é : 26.64
O valor da região nino34 no mês 12 é : 26.57


In [40]:
dicionario

{'mes': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
 'nino34': [26.48,
  26.67,
  27.18,
  27.76,
  27.84,
  27.64,
  27.22,
  26.81,
  26.71,
  26.68,
  26.64,
  26.57]}

In [49]:
dt = pd.DataFrame.from_dict(dicionario)

In [53]:
dt.set_index('mes').to_csv('clima_nino34.csv', sep=';')