---

# **Download dos dados de precipitação do MERGE-CPTEC**


---


**OBJETIVO:** Este Colab tem como objetivo baixar os dados de precipitação do produto MERGE do CPTEC. Os dados estão disponibilizados no [ftp](http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/) do CPTEC.


---


**DADOS QUE SÃO BAIXADOS**:

1.   Arquivos diários (**DAILY**) de precipitação do produto MERGE:
    - Exemplo: **MERGE_CPTEC_20220202.grib2**
2.   Arquivos horários (**HOURLY**) de precipitação do produto MERGE:
    - Exemplo: **MERGE_CPTEC_2022021801.grib2**

---

**PROCEDIMENTO REALIZADO:** Os seguintes procedimentos são realizados nesse código:
1.   Importação das bibliotecas
2.   Monta o drive
2.   São realizados os seguintes passos:
     1. Define o intervalo de datas (**fazer mudanças aqui**)
     2. Define as informações de entrada
     3. Realiza o download dos dados


---
**OBSERVAÇÕES IMPORTANTES**:
1. Definir o período dos dados
2. Alterar o nome (**dir_output**) do diretório de saída dos dados


---
- **Realizado por:** Enrique V. Mattos - 01/03/2022
- **Atualizado por:** Enrique V. Mattos - 05/07/2023


---



# **1° Passo:** Importando as bibliotecas

In [1]:
import os
import time as t
from datetime import datetime, timedelta
import pandas as pd

# **2° Passo:** Montando drive

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


# **PARTE 1):** Dados `diários`
 - Exemplo: "MERGE_CPTEC_20220202.grib2"

- **>>> ALTERAÇÕES AQUI <<<**: Insira as informações necessárias

In [11]:
# definir a data inicial e final
anoi, mesi, diai = 2022, 2, 1 # ano, mes e dia inicial do período
anof, mesf, diaf = 2022, 2, 5 # ano, mes e dia final do período

# escolha o tipo de dado (tem duas opções: i) horária-DAILY e ii) mensal-HOURLY)
frequencia_chuva = 'DAILY'

# definir o caminho de saída
dir_output = '/content/drive/MyDrive/PYHTON/00_GITHUB/11_Precipitacao_MERGE/output/'

- **Informações de entrada**

In [12]:
# informações sobre os dados
url_cptec = 'http://ftp.cptec.inpe.br/'
diretorio = f'modelos/tempo/MERGE/GPM/{frequencia_chuva}/'
codigo = 'MERGE_CPTEC'
extensao = 'grib2'

- **Download dos dados**

In [13]:
# Inicia o contador de tempo
start_time = t.time()

# Data desejada
date_in = datetime(anoi, mesi, diai)  # 2022-02-02 00:00:00
date_ini = date_in.strftime('%Y%m%d') # 20220202

date_en = datetime(anof, mesf, diaf)
date_end = date_en.strftime('%Y%m%d')

print('.... Processando Data ...:', date_ini, date_end)

# Download dos dados
for file in pd.date_range(date_ini, date_end, freq='d'):

    # Extrai ano e mes
    data = file.strftime('%Y%m%d')
    ano = file.strftime('%Y')
    mes = file.strftime('%m')

    # nome do arquivo
    filename = f'{codigo}_{data}.{extensao}'
    filename_total = os.path.join(url_cptec, diretorio, ano, mes, filename) # http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/DAILY/2020/10/

    #print(filename, filename_total)

    print('\n---------------------')
    print('Downloading FTP File:')
    print('---------------------')
    print('Model:MERGE / Tipo:' + frequencia_chuva)
    print('File:' + filename_total)
    print('---------------------')

    !wget -c {filename_total} -P {dir_output}

    #break

# Contabiliza o tempo para baixar os dados
print('\nTempo de download dos dados:', round((t.time() - start_time),2), 'segundos.')

.... Processando Data ...: 20220201 20220205

---------------------
Downloading FTP File:
---------------------
Model:MERGE / Tipo:DAILY
File:http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/DAILY/2022/02/MERGE_CPTEC_20220201.grib2
---------------------
--2023-07-05 17:25:36--  http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/DAILY/2022/02/MERGE_CPTEC_20220201.grib2
Resolving ftp.cptec.inpe.br (ftp.cptec.inpe.br)... 150.163.141.22
Connecting to ftp.cptec.inpe.br (ftp.cptec.inpe.br)|150.163.141.22|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 449691 (439K)
Saving to: ‘/content/drive/MyDrive/PYHTON/00_GITHUB/11_Precipitacao_MERGE/output/MERGE_CPTEC_20220201.grib2’


2023-07-05 17:25:40 (130 KB/s) - ‘/content/drive/MyDrive/PYHTON/00_GITHUB/11_Precipitacao_MERGE/output/MERGE_CPTEC_20220201.grib2’ saved [449691/449691]


---------------------
Downloading FTP File:
---------------------
Model:MERGE / Tipo:DAILY
File:http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/

# **PARTE 2):** Dados `horários`
 - Exemplo: "MERGE_CPTEC_2022021801.grib2"

- **>>> ALTERAÇÕES AQUI <<<**: Insira as informações necessárias

In [18]:
# definir a data inicial e final
anoi, mesi, diai, hori = 2022, 2, 2, 0,  # ano, mes, dia e hora inicial do período
anof, mesf, diaf, horf = 2022, 2, 2, 23  # ano, mes, dia e hora final do período

# escolha o tipo de dado (tem duas opções: i) horária-DAILY e ii) mensal-HOURLY)
frequencia_chuva = 'HOURLY'

# definir o caminho de saída
dir_output = '/content/drive/MyDrive/PYHTON/00_GITHUB/11_Precipitacao_MERGE/output/'

- **Informações de entrada**

In [19]:
# informações sobre os dados
url_cptec = 'http://ftp.cptec.inpe.br/'
diretorio = f'modelos/tempo/MERGE/GPM/{frequencia_chuva}/'
codigo = 'MERGE_CPTEC'
extensao = 'grib2'

- **Download dos dados**

In [21]:
# Inicia o contador de tempo
start_time = t.time()

# Data desejada
date_in = datetime(anoi, mesi, diai, hori)  # 2022-02-02 00
date_ini = date_in.strftime('%Y-%m-%d %H')  # 2022020200

date_en = datetime(anof, mesf, diaf, horf)
date_end = date_en.strftime('%Y-%m-%d %H')

print('.... Processando Data ...:', date_ini, date_end)

# Download dos dados
for file in pd.date_range(date_ini, date_end, freq='H'):

    # Extrai ano e mes
    data = file.strftime('%Y%m%d%H')
    ano = file.strftime('%Y')
    mes = file.strftime('%m')
    dia = file.strftime('%d')
    hor = file.strftime('%H')

    # nome do arquivo
    filename = f'{codigo}_{data}.{extensao}'
    filename_total = os.path.join(url_cptec, diretorio, ano, mes, dia, filename) # http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/HOURLY/2022/02/18/

    print('\n---------------------')
    print('Downloading FTP File:')
    print('---------------------')
    print('Model:MERGE / Tipo:' + frequencia_chuva)
    print('File:' + filename_total)
    print('---------------------')

    # baixando o dado
    !wget -c {filename_total} -P {dir_output}

# Contabiliza o tempo para baixar os dados
print('\nTempo de download dos dados:', round((t.time() - start_time),2), 'segundos.')

.... Processando Data ...: 2022-02-02 00 2022-02-02 23

---------------------
Downloading FTP File:
---------------------
Model:MERGE / Tipo:HOURLY
File:http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/HOURLY/2022/02/02/MERGE_CPTEC_2022020200.grib2
---------------------
--2023-07-05 17:28:15--  http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/HOURLY/2022/02/02/MERGE_CPTEC_2022020200.grib2
Resolving ftp.cptec.inpe.br (ftp.cptec.inpe.br)... 150.163.141.22
Connecting to ftp.cptec.inpe.br (ftp.cptec.inpe.br)|150.163.141.22|:80... connected.
HTTP request sent, awaiting response... 416 Requested Range Not Satisfiable

    The file is already fully retrieved; nothing to do.


---------------------
Downloading FTP File:
---------------------
Model:MERGE / Tipo:HOURLY
File:http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/HOURLY/2022/02/02/MERGE_CPTEC_2022020201.grib2
---------------------
--2023-07-05 17:28:16--  http://ftp.cptec.inpe.br/modelos/tempo/MERGE/GPM/HOURLY/2022/02/02/MERGE_CPTEC_202