#  Projeto de Ci√™ncia de Dados

# Modelagem, Detec√ß√£o e Predi√ß√£o dos Ciclos Hidrol√≥gicos do Pantanal

---

##  1. Contextualiza√ß√£o

O **Pantanal** √© a maior plan√≠cie alag√°vel tropical do planeta, com regime hidrol√≥gico altamente sazonal.

A altern√¢ncia entre **cheias e secas** impacta:

* üå± Biodiversidade
* üö¢ Navega√ß√£o
* üåæ Agricultura
* üíß Seguran√ßa h√≠drica
* üí∞ Economia regional

Mudan√ßas recentes levantam hip√≥teses sobre poss√≠vel altera√ß√£o estrutural no regime hidrol√≥gico.

---

##  2. Problema de Pesquisa

### Pergunta Central

> Qual √© a din√¢mica, frequ√™ncia, intensidade, espacializa√ß√£o e tend√™ncia dos ciclos de cheias e secas no Pantanal ao longo das √∫ltimas d√©cadas?

### Subquest√µes

* H√° mudan√ßa estrutural no regime hidrol√≥gico?
* Eventos extremos est√£o se intensificando?
* √â poss√≠vel prever cheias e secas com modelos estat√≠sticos e Deep Learning?
* Existem padr√µes distintos entre munic√≠pios?

---

##  3. √Årea de Estudo

###  Mato Grosso (MT)

* Bar√£o de Melga√ßo
* C√°ceres
* Lambari d‚ÄôOeste
* Pocon√©
* Nossa Senhora do Livramento
* Santo Ant√¥nio do Leverger
* Itiquira

###  Mato Grosso do Sul (MS)

* Corumb√°
* Lad√°rio
* Aquidauana
* Miranda
* Bodoquena
* Porto Murtinho
* Rio Verde de Mato Grosso
* Sonora
* Coxim

### üîé Total

* 16 munic√≠pios
* 7 em MT
* 9 em MS

Munic√≠pios com maior √°rea no Pantanal:

* Bar√£o de Melga√ßo (MT)
* Corumb√° (MS)

---

##  4. Fonte de Dados

Os dados ser√£o obtidos via pacote **HydroBR**, com acesso estruturado √†s bases da
**Ag√™ncia Nacional de √Åguas**.

### Vari√°veis dispon√≠veis

* Cota (n√≠vel do rio)
* Vaz√£o
* Precipita√ß√£o
* Metadados das esta√ß√µes

### Crit√©rios de sele√ß√£o

* Esta√ß√µes em MT e MS
* S√©ries hist√≥ricas longas
* Consist√™ncia temporal

---

#  5. Metodologia Anal√≠tica

---

## 5.1 Coleta Automatizada

* Sele√ß√£o automatizada de esta√ß√µes
* Download program√°tico
* Consolida√ß√£o em DataFrame √∫nico
* Padroniza√ß√£o do √≠ndice temporal

---

## 5.2 Pr√©-processamento

### üîπ Tratamento

* Interpola√ß√£o temporal
* Remo√ß√£o de outliers (IQR / Z-score)
* Verifica√ß√£o de consist√™ncia

### üîπ Engenharia de Vari√°veis

* Anomalias hidrol√≥gicas
* M√©dias m√≥veis
* Padroniza√ß√£o (z-score)
* Classifica√ß√£o autom√°tica:

| Classe         | Crit√©rio       |
| -------------- | -------------- |
| Cheia extrema  | > Percentil 95 |
| Cheia moderada | 90‚Äì95          |
| Normal         | 10‚Äì90          |
| Seca           | 5‚Äì10           |
| Seca extrema   | < 5            |

---

## 5.3 An√°lise Explorat√≥ria (EDA)

### Estat√≠sticas Descritivas

* M√©dia
* Desvio padr√£o
* Assimetria
* Curtose
* Quantis extremos

### Visualiza√ß√µes

* S√©ries hist√≥ricas completas
* Compara√ß√£o por d√©cadas
* Heatmap anual
* Boxplots sazonais

### Depend√™ncia Temporal

* ACF
* PACF

### Decomposi√ß√£o STL

* Tend√™ncia
* Sazonalidade
* Res√≠duo

---

## 5.4 An√°lise Espectral ‚Äì Extra√ß√£o de Ciclos

Aplica√ß√£o da Transformada R√°pida de Fourier (FFT):

[
FFT(x_t)
]

### Objetivos

* Identificar periodicidade dominante
* Detectar ciclos interanuais
* Avaliar mudan√ßas na frequ√™ncia dominante
* Identificar ciclos de seca prolongada

### T√©cnicas complementares

* Periodograma
* Densidade espectral
* Filtro passa-banda
* Wavelet (an√°lise multiescalar)

---

## 5.5 Modelagem de S√©ries Temporais

###  Modelos Estat√≠sticos

* ARIMA
* SARIMA
* SARIMAX (com precipita√ß√£o ex√≥gena)

### M√©tricas

* AIC
* BIC
* RMSE
* Cross-validation temporal

---

###  Modelos de Deep Learning

* LSTM
* Transformer para S√©ries Temporais

### Objetivos

* Previs√£o de cheias futuras
* Antecipa√ß√£o de eventos extremos
* Compara√ß√£o com modelos cl√°ssicos

---

## 5.6 Detec√ß√£o de Eventos Extremos

### Crit√©rios

* Percentil 90‚Äì95 ‚Üí Cheia
* Percentil 5‚Äì10 ‚Üí Seca
* Dura√ß√£o m√≠nima consecutiva
* Intensidade acumulada

### Visualiza√ß√µes

* Gr√°fico tipo Gantt
* Curvas de severidade
* Ranking hist√≥rico

---

## 5.7 An√°lise de Tend√™ncia e Mudan√ßa Estrutural

* Teste de Mann-Kendall
* Regress√£o linear robusta
* Theil-Sen
* Change Point Detection

### Objetivos

* Detectar intensifica√ß√£o de secas
* Avaliar aumento da variabilidade
* Identificar altera√ß√µes no regime sazonal

---

## 5.8 Visualiza√ß√£o Interativa

### Mapas

* Esta√ß√µes georreferenciadas
* Classifica√ß√£o por intensidade
* Timeline animada

### Ferramentas

* Folium
* Plotly
* GeoPandas

---

## 5.9 Exporta√ß√£o

* Excel (.xlsx)
* CSV
* Relat√≥rio PDF
* Download direto no Colab

---

#  6. Estrutura do Notebook

```
01 - Instala√ß√£o de Pacotes
02 - Coleta de Dados
03 - Pr√©-processamento
04 - An√°lise Explorat√≥ria
05 - An√°lise Espectral (FFT)
06 - Modelagem SARIMA
07 - Modelagem LSTM / Transformer
08 - Eventos Extremos
09 - Mapas Interativos
10 - Exporta√ß√£o
```

---

#  7. Resultados Esperados

* ‚úî Periodicidade dominante dos ciclos
* ‚úî Identifica√ß√£o de ciclos interanuais
* ‚úî Dura√ß√£o m√©dia das cheias
* ‚úî Tend√™ncia estatisticamente significativa (ou n√£o)
* ‚úî Modelo preditivo validado
* ‚úî Dashboard interativo
* ‚úî Base export√°vel para pesquisas futuras

---

#  8. Contribui√ß√µes Cient√≠ficas

* Integra√ß√£o entre hidrologia e ci√™ncia de dados
* FFT + SARIMA + Transformers no mesmo pipeline
* Detec√ß√£o autom√°tica de eventos extremos
* An√°lise multiescalar (dias, meses, anos)
* Pipeline totalmente reprodut√≠vel

## **1Ô∏è‚É£ Instala√ß√£o de pacotes e configura√ß√£o inicial**
* `pandas` ‚Üí manipula√ß√£o de DataFrames
* `numpy` ‚Üí opera√ß√µes matem√°ticas
* `hydrobr.get_data` ‚Üí pacote que acessa dados da **ANA** (Ag√™ncia Nacional de √Åguas)
* `tqdm.notebook` ‚Üí barra de progresso visual no Colab durante downloads grandes

In [None]:
# Instala√ß√£o de Bibliotecas
!pip install hydrobr # Acesso e download de dados hidrol√≥gicos da ANA (Hidroweb) de forma automatizada
!pip install pymannkendall # Testes estat√≠sticos de tend√™ncia em s√©ries temporais (ex.: Mann-Kendall)
!pip install statsmodels #an√°lise estat√≠stica avan√ßada e modelagem estat√≠stica
!pip install openpyxl #leitura e escrita de arquivos Excel (.xlsx)
!pip install tqdm #barras de progresso para loops e tarefas demoradas
!pip install seaborn #cria√ß√£o de gr√°ficos estat√≠sticos bonitos e simples



Collecting hydrobr
  Downloading hydrobr-0.1.1.tar.gz (16 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: hydrobr
  Building wheel for hydrobr (setup.py) ... [?25l[?25hdone
  Created wheel for hydrobr: filename=hydrobr-0.1.1-py3-none-any.whl size=15071 sha256=85b035d39b5870206044810d7d30ae5e3611cf3b88fe13a48564c53d7ea49186
  Stored in directory: /root/.cache/pip/wheels/02/4f/7c/6a321192de4209adc0e12aa57867ff91671957c896246b894d
Successfully built hydrobr
Installing collected packages: hydrobr
Successfully installed hydrobr-0.1.1
Collecting pymannkendall
  Downloading pymannkendall-1.4.3-py3-none-any.whl.metadata (14 kB)
Downloading pymannkendall-1.4.3-py3-none-any.whl (12 kB)
Installing collected packages: pymannkendall
Successfully installed pymannkendall-1.4.3


In [None]:
# Imports


import pandas as pd
import numpy as np
from hydrobr import get_data
from tqdm.notebook import tqdm



In [None]:

# Lista todas as esta√ß√µes de precipita√ß√£o dispon√≠veis
lista_estacoes_precipitacao = get_data.ANA.list_prec_stations()
print("Total de esta√ß√µes:", lista_estacoes_precipitacao.shape[0])

# Exibir as 20 primeiras
lista_estacoes_precipitacao.head(20)




Total de esta√ß√µes: 11976


Unnamed: 0,Name,Code,Type,SubBasin,City,State,Responsible,Latitude,Longitude,StartDate,EndDate,NYD,MD,N_YWOMD,YWMD
0,SALIN√ìPOLIS,47000,2,32,SALIN√ìPOLIS,PAR√Å,INMET,-0.65,-47.55,1958/01/01,1964/12/31,7,25.0,0,100.0
1,SALIN√ìPOLIS,47002,2,32,SALIN√ìPOLIS,PAR√Å,ANA,-0.6231,-47.3536,1977/12/09,2019/08/31,43,3.5,35,18.6
2,CURU√áA,47003,2,32,CURU√áA,PAR√Å,ANA,-0.7375,-47.8536,1981/07/01,2019/07/31,39,2.4,29,25.6
3,PRIMAVERA,47004,2,32,PRIMAVERA,PAR√Å,ANA,-0.9294,-47.0994,1982/02/18,2019/08/31,38,0.0,35,7.9
4,MARUDA,47005,2,32,MARAPANIM,PAR√Å,ANA,-0.6336,-47.6583,1989/08/21,2019/07/31,31,5.0,20,35.5
5,S√ÉO JO√ÉO DE PIRABAS,47006,2,32,S√ÉO JO√ÉO DE PIRABAS,PAR√Å,ANA,-0.7747,-47.1775,1989/08/30,2019/08/31,31,0.4,25,19.4
6,MAGALH√ÉES BARATA,47007,2,31,MAGALH√ÉES BARATA,PAR√Å,ANA,-0.7944,-47.5997,1995/11/17,2019/08/31,25,1.4,20,20.0
7,SOURE (ILHA DE MARAJ√ì),48000,2,19,SOURE,PAR√Å,INMET,-0.7278,-48.5158,1961/01/01,1998/12/31,38,3.2,26,31.6
8,C√ÇMARA,48002,2,19,CACHOEIRA DO ARARI,PAR√Å,IDESP,-0.9,-48.6333,1971/09/21,1982/12/31,12,0.0,9,25.0
9,FAZENDA TAPERA (MARAJ√ì),48003,2,19,SOURE,PAR√Å,IDESP,-0.55,-48.7833,1971/01/01,1982/12/31,12,9.6,8,33.3


In [None]:
cidade = "Campo Grande"
filtro = lista_estacoes_precipitacao[
    lista_estacoes_precipitacao["City"].str.upper() == cidade.upper()
]

print(f"Esta√ß√µes encontradas em {cidade}:")
filtro


Esta√ß√µes encontradas em Campo Grande:


Unnamed: 0,Name,Code,Type,SubBasin,City,State,Responsible,Latitude,Longitude,StartDate,EndDate,NYD,MD,N_YWOMD,YWMD
3216,OLHO D'√ÅGUA DO CAMPO,936071,2,49,CAMPO GRANDE,ALAGOAS,CODEVASF,-9.9333,-36.8,1963/11/01,1973/01/31,11,43.5,2,81.8
3217,PO√áO D'ANTAS,936072,2,49,CAMPO GRANDE,ALAGOAS,CODEVASF,-9.9833,-36.7333,1967/06/01,1974/03/31,8,12.1,4,50.0
3530,PO√áO DOS BOIS,1036044,2,49,CAMPO GRANDE,ALAGOAS,CODEVASF,-10.0333,-36.7333,1963/08/01,1975/04/30,13,26.2,6,53.8
6911,CAMPO GRANDE,2054000,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,INMET,-20.4442,-54.7225,1933/04/01,1998/12/31,66,61.4,19,71.2
6912,CAMPO GRANDE (SBCG),2054001,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,DEPV,-20.4667,-54.6667,1949/12/01,1984/12/31,36,12.4,29,19.4
6917,CAIXA D√ÅGUA,2054010,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,ANA,-20.45,-54.6333,1976/01/01,1994/08/27,19,23.4,12,36.8
6918,LAGEADO - TOMADA D'√ÅGUA - SAEE,2054011,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,ANA,-20.45,-54.6333,1974/04/01,1994/08/27,21,55.4,3,85.7
6919,USINA DE TRATAMENTO - SAEE,2054012,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,ANA,-20.45,-54.6333,1976/08/01,1994/08/29,19,56.1,3,84.2
6920,CONJUNTO FERROVI√ÅRIOS - SAEE,2054013,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,ANA,-20.45,-54.6333,1976/04/08,1989/07/31,14,48.9,4,71.4
6921,DNOS - 8.DRS,2054014,2,63,CAMPO GRANDE,MATO GROSSO DO SUL,ANA,-20.4517,-54.6275,1976/01/01,2019/08/31,44,25.1,28,36.4


In [None]:
cidade_parcial = "Miran"
filtro_parcial = lista_estacoes_precipitacao[
    lista_estacoes_precipitacao["City"].str.contains(cidade_parcial, case=False, na=False)
]

print("Esta√ß√µes com nome que cont√©m:", cidade_parcial)
filtro_parcial


Esta√ß√µes com nome que cont√©m: Miran


Unnamed: 0,Name,Code,Type,SubBasin,City,State,Responsible,Latitude,Longitude,StartDate,EndDate,NYD,MD,N_YWOMD,YWMD
634,MIRANDA,344012,2,33,MIRANDA DO NORTE,MARANH√ÉO,ANA,-3.5497,-44.5833,1984/04/16,2019/11/30,36,0.5,32,11.1
844,GUARAMIRANGA,438100,2,35,GUARAMIRANGA,CEAR√Å,FUNCEME-CE,-4.2667,-38.9333,1974/01/01,2019/12/31,46,0.6,42,8.7
870,BOTIJA,438127,2,35,GUARAMIRANGA,CEAR√Å,FUNCEME-CE,-4.2472,-38.9414,2017/01/01,2020/02/29,4,28.9,1,75.0
907,GUARAMIRANGA,439040,2,35,GUARAMIRANGA,CEAR√Å,INMET,-4.4667,-38.95,1961/01/01,1985/12/31,25,27.8,14,44.0
2926,A√áUDE SERRINHA,838002,2,48,MIRANDIBA,PERNAMBUCO,ANA,-8.2397,-38.5278,1962/11/01,2019/10/31,58,0.4,51,12.1
2930,CARNAUBEIRA,838006,2,48,MIRANDIBA,PERNAMBUCO,SUDENE,-8.0167,-38.8833,1962/11/01,1991/04/30,30,7.9,21,30.0
2948,MIRANDIBA (S√ÉO JO√ÉO DE CAMPOS),838025,2,48,MIRANDIBA,PERNAMBUCO,APAC-PE,-8.1167,-38.7333,1962/11/01,1993/10/31,32,1.1,26,18.8
2955,A√áUDE SERRINHA,838036,2,48,MIRANDIBA,PERNAMBUCO,ANA,-8.2333,-38.5333,1973/03/01,1974/11/30,2,37.2,0,100.0
3660,MIRANGABA (RIACHUELO),1040006,2,50,MIRANGABA,BAHIA,DNOCS,-10.9539,-40.5753,1959/09/01,2000/11/30,42,18.6,28,33.3
3670,TAQUARANDI,1040016,2,47,MIRANGABA,BAHIA,SUDENE,-10.89,-40.6997,1963/01/01,2000/05/31,38,12.5,28,26.3


In [None]:
# 2 Coleta de Dados - Lista de munic√≠pios do Pantanal e normaliza√ß√£o
# Lista oficial de munic√≠pios pantaneiros
municipios_pantanal = [
    "BAR√ÉO DE MELGA√áO","C√ÅCERES","LAMBARI D‚ÄôOESTE","POCON√â",
    "NOSSA SENHORA DO LIVRAMENTO","SANTO ANT√îNIO DO LEVERGER","ITIQUIRA",
    "CORUMB√Å","LAD√ÅRIO","AQUIDAUANA","MIRANDA","BODOQUENA",
    "PORTO MURTINHO","RIO VERDE DE MATO GROSSO","SONORA","COXIM",
    # "Porto Esperidi√£o", #vinculada a regi√£o Pantaneira
    # "Porto Estrela", #vinculada a regi√£o Pantaneira"
]

# Normalizar texto para evitar problemas com acentos e mai√∫sculas/min√∫sculas
lista_estacoes_precipitacao["City_norm"] = (
    lista_estacoes_precipitacao["City"]
    .str.upper()
    .str.normalize('NFKD')
    .str.encode('ascii', errors='ignore')
    .str.decode('utf-8')
)

municipios_norm = [
    m.upper().encode('ascii', errors='ignore').decode('utf-8')
    for m in municipios_pantanal
]

# Filtrar apenas as esta√ß√µes do Pantanal
estacoes_pantanal = lista_estacoes_precipitacao[
    lista_estacoes_precipitacao["City_norm"].isin(municipios_norm)
]

print("Esta√ß√µes encontradas nas cidades do Pantanal:", estacoes_pantanal.shape[0])
estacoes_pantanal



Esta√ß√µes encontradas nas cidades do Pantanal: 32


Unnamed: 0,Name,Code,Type,SubBasin,City,State,Responsible,Latitude,Longitude,StartDate,EndDate,NYD,MD,N_YWOMD,YWMD,City_norm
5755,ITIQUIRA,1754000,2,66,ITIQUIRA,MATO GROSSO,ANA,-17.2078,-54.14,1965/11/22,2019/11/30,55,0.2,49,10.9,ITIQUIRA
5756,PIQUIRI,1754001,2,66,ITIQUIRA,MATO GROSSO,ANA,-17.75,-54.3333,1974/11/24,1979/12/31,6,14.0,4,33.3,ITIQUIRA
5757,POSTO CORRENTES (MT-163),1754002,2,66,SONORA,MATO GROSSO DO SUL,ANA,-17.5869,-54.7567,1969/08/14,2019/09/30,51,35.5,22,56.9,SONORA
5758,ACAMPAMENTO ITIQUIRA,1754003,2,66,ITIQUIRA,MATO GROSSO,ANA,-17.0833,-54.7833,1970/09/01,1983/12/31,14,9.5,5,64.3,ITIQUIRA
5760,SANTO ANT√îNIO DO PARA√çSO,1755000,2,66,ITIQUIRA,MATO GROSSO,ANA,-17.4917,-55.2322,1969/03/02,2018/03/31,50,22.1,31,38.0,ITIQUIRA
5764,S√ÉO JER√îNIMO,1755004,2,66,AQUIDAUANA,MATO GROSSO DO SUL,ANA,-17.1667,-55.9833,1963/10/18,1989/07/31,27,2.5,19,29.6,AQUIDAUANA
5765,SANTA TEREZA,1755005,2,66,AQUIDAUANA,MATO GROSSO DO SUL,ANA,-17.0,-55.0,1982/09/28,1983/12/31,2,7.0,1,50.0,AQUIDAUANA
6001,CACHOEIRA POLVORA,1853002,2,66,COXIM,MATO GROSSO DO SUL,ANA,-18.1906,-54.2578,1971/02/05,2019/09/30,49,26.6,31,36.7,COXIM
6005,COXIM,1854000,2,66,COXIM,MATO GROSSO DO SUL,INMET,-18.5042,-54.7347,1975/01/01,1994/01/31,20,37.2,9,55.0,COXIM
6008,JAURU,1854003,2,66,COXIM,MATO GROSSO DO SUL,ANA,-18.6492,-54.3572,1971/02/03,2019/09/30,49,24.1,23,53.1,COXIM


In [None]:
# Listar de todos os m√©todos dispon√≠veis para ANA
dir(get_data.ANA)


['_ANA__data_ana',
 '_ANA__list_ana',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'flow_data',
 'list_flow_stations',
 'list_prec_stations',
 'prec_data',
 'stage_data']

In [None]:
# Verifica√ß√£o da documenta√ß√£o dentro do Colab:
help(get_data.ANA)


Help on class ANA in module hydrobr.get_data:

class ANA(builtins.object)
 |  It provides a connection with the Brazilian National Water Agency (Ag√™ncia Nacional de √Åguas - ANA) database
 |
 |  Static methods defined here:
 |
 |  flow_data(list_station, only_consisted=False)
 |      Get the flow station data series from a list of stations code of the Brazilian National Water Agency
 |      (ANA) database.
 |
 |      Parameters
 |      ----------
 |      list_station : list of strings
 |          A list of with the stations code as strings.
 |      only_consisted : boolean, default False
 |          If True, returns only the data classified as consistent by the provider.
 |
 |      Returns
 |      -------
 |      data_stations : pandas DataFrame
 |          The data os each station as a column in a pandas DataFrame
 |
 |  list_flow_stations(state='', city='', source='ANAF')
 |      Searches for flow/stage stations registered at the Brazilian National Agency of Water inventory.
 |
 |  

list_flow_stations() √© o m√©todo correto para listar esta√ß√µes de vaz√£o.

flow_data() recebe uma lista de c√≥digos mesmo que seja s√≥ um c√≥digo por vez.

Normalizamos os nomes das cidades (City_norm) para filtrar apenas os munic√≠pios pantaneiros.

Consolidamos todas as s√©ries em um DataFrame √∫nico (df_flu_all), pronto para an√°lise.

In [None]:
# -------------------------------
# Importa√ß√µes
# -------------------------------
import pandas as pd
import numpy as np
from hydrobr import get_data
from tqdm.notebook import tqdm
import unicodedata

# -------------------------------
# 1Ô∏è‚É£ Lista oficial de munic√≠pios do Pantanal
# -------------------------------
municipios_pantanal = [
    "BAR√ÉO DE MELGA√áO","C√ÅCERES","LAMBARI D‚ÄôOESTE","POCON√â",
    "NOSSA SENHORA DO LIVRAMENTO","SANTO ANT√îNIO DO LEVERGER","ITIQUIRA",
    "CORUMB√Å","LAD√ÅRIO","AQUIDAUANA","MIRANDA","BODOQUENA",
    "PORTO MURTINHO","RIO VERDE DE MATO GROSSO","SONORA","COXIM"
]

# Fun√ß√£o de normaliza√ß√£o de texto
# def normalize_txt(txt):
#    return txt.upper().normalize('NFKD').encode('ascii', errors='ignore').decode('utf-8')

def normalize_txt(txt):
    # Garantir que txt √© string
    txt = str(txt)
    # Normalizar acentos
    txt = unicodedata.normalize('NFKD', txt)
    # Remover caracteres n√£o ASCII e converter para mai√∫sculas
    txt = txt.encode('ascii', errors='ignore').decode('utf-8').upper()
    return txt


# Normalizar lista de munic√≠pios
municipios_norm = [normalize_txt(m) for m in municipios_pantanal]
print(municipios_norm)

# -------------------------------
# 2Ô∏è‚É£ Esta√ß√µes de precipita√ß√£o
# -------------------------------
lista_prec = get_data.ANA.list_prec_stations()  # todas as esta√ß√µes de precipita√ß√£o
lista_prec["City_norm"] = lista_prec["City"].apply(normalize_txt)

# Filtrar apenas munic√≠pios do Pantanal
estacoes_prec_pantanal = lista_prec[lista_prec["City_norm"].isin(municipios_norm)].copy()
print("Esta√ß√µes de precipita√ß√£o no Pantanal:", estacoes_prec_pantanal.shape[0])

# Baixar s√©ries de precipita√ß√£o
dados_prec = {}
for codigo in tqdm(estacoes_prec_pantanal["Code"].astype(str), desc="Baixando precipita√ß√£o"):
    try:
        df = get_data.ANA.prec_data([codigo], only_consisted=False)  # recebe lista
        df.index = pd.to_datetime(df.index)  # padronizar √≠ndice temporal
        dados_prec[codigo] = df
    except Exception as e:
        print(f"Erro ao baixar {codigo}: {e}")

# Consolidar todas as s√©ries em um √∫nico DataFrame
df_prec_all = pd.concat(dados_prec.values(), keys=dados_prec.keys(), names=["Code", "Date"])
df_prec_all.reset_index(inplace=True)

# -------------------------------
# 3Ô∏è‚É£ Esta√ß√µes de vaz√£o (flow)
# -------------------------------
lista_flu = get_data.ANA.list_flow_stations()  # m√©todo correto
lista_flu["City_norm"] = lista_flu["City"].apply(normalize_txt)

# Filtrar munic√≠pios do Pantanal
estacoes_flu_pantanal = lista_flu[lista_flu["City_norm"].isin(municipios_norm)].copy()
codigos_flu = estacoes_flu_pantanal["Code"].astype(str).tolist()
print("Esta√ß√µes de vaz√£o no Pantanal:", len(codigos_flu))

# Baixar s√©ries de vaz√£o
dados_flu = {}
for codigo in tqdm(codigos_flu, desc="Baixando vaz√£o"):
    try:
        df = get_data.ANA.flow_data([codigo], only_consisted=False)  # recebe lista de c√≥digos
        df.index = pd.to_datetime(df.index)
        dados_flu[codigo] = df
    except Exception as e:
        print(f"Erro ao baixar {codigo}: {e}")

# Consolidar em √∫nico DataFrame
df_flu_all = pd.concat(dados_flu.values(), keys=dados_flu.keys(), names=["Code", "Date"])
df_flu_all.reset_index(inplace=True)

# -------------------------------
# 4Ô∏è‚É£ Visualiza√ß√£o inicial
# -------------------------------
print("Pr√©-visualiza√ß√£o - Precipita√ß√£o")
display(df_prec_all.head())

print("Pr√©-visualiza√ß√£o - Vaz√£o")
display(df_flu_all.head())


['BARAO DE MELGACO', 'CACERES', 'LAMBARI DOESTE', 'POCONE', 'NOSSA SENHORA DO LIVRAMENTO', 'SANTO ANTONIO DO LEVERGER', 'ITIQUIRA', 'CORUMBA', 'LADARIO', 'AQUIDAUANA', 'MIRANDA', 'BODOQUENA', 'PORTO MURTINHO', 'RIO VERDE DE MATO GROSSO', 'SONORA', 'COXIM']
Esta√ß√µes de precipita√ß√£o no Pantanal: 87


Baixando precipita√ß√£o:   0%|          | 0/87 [00:00<?, ?it/s]


  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:00<00:00,  1.03it/s]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.69s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.28s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.53s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:05<00:00,  5.05s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.93s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.19s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.40s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.47s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.51s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<0

Esta√ß√µes de vaz√£o no Pantanal: 48


Baixando vaz√£o:   0%|          | 0/48 [00:00<?, ?it/s]


  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.75s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.22s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.57s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.55s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.69s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.96s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.77s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:07<00:00,  7.62s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:18<00:00, 18.41s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.04s/it]

  0%|          | 0/1 [00:00<?, ?i

Erro ao baixar 66523000: No objects to concatenate



  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.05s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.12s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.20s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.67s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.80s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.05s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.96s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.66s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.74s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.57s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚

Pr√©-visualiza√ß√£o - Precipita√ß√£o


Unnamed: 0,Code,Date,01557002,01557004,01558002,01559005,01655000,01655002,01655004,01656000,...,02056007,02057000,02057001,02058001,02157000,02157002,02157003,02157004,02157005,02157006
0,1557002,1968-01-01,,,,,,,,,...,,,,,,,,,,
1,1557002,1968-01-02,,,,,,,,,...,,,,,,,,,,
2,1557002,1968-01-03,,,,,,,,,...,,,,,,,,,,
3,1557002,1968-01-04,,,,,,,,,...,,,,,,,,,,
4,1557002,1968-01-05,,,,,,,,,...,,,,,,,,,,


Pr√©-visualiza√ß√£o - Vaz√£o


Unnamed: 0,Code,Date,66065000,66070004,66071300,66076000,66090000,66110000,66120000,66126000,...,66945000,66960008,66970000,67006000,67025000,67030000,67050000,67100000,67175000,67176000
0,66065000,1969-01-01,,,,,,,,,...,,,,,,,,,,
1,66065000,1969-01-02,,,,,,,,,...,,,,,,,,,,
2,66065000,1969-01-03,,,,,,,,,...,,,,,,,,,,
3,66065000,1969-01-04,,,,,,,,,...,,,,,,,,,,
4,66065000,1969-01-05,,,,,,,,,...,,,,,,,,,,


In [None]:
# -------------------------------
# Importa√ß√µes
# -------------------------------
import pandas as pd
import numpy as np
from hydrobr import get_data
from tqdm.notebook import tqdm
import unicodedata
from scipy.stats import zscore
import os

# Criar pasta de exporta√ß√£o
if not os.path.exists("export"):
    os.makedirs("export")

# -------------------------------
# Fun√ß√£o de normaliza√ß√£o de texto
# -------------------------------
def normalize_txt(txt):
    txt = str(txt)
    txt = unicodedata.normalize('NFKD', txt)
    txt = txt.encode('ascii', errors='ignore').decode('utf-8').upper()
    return txt

# -------------------------------
# Lista oficial de munic√≠pios do Pantanal
# -------------------------------
municipios_pantanal = [
    "BAR√ÉO DE MELGA√áO","C√ÅCERES","LAMBARI D‚ÄôOESTE","POCON√â",
    "NOSSA SENHORA DO LIVRAMENTO","SANTO ANT√îNIO DO LEVERGER","ITIQUIRA",
    "CORUMB√Å","LAD√ÅRIO","AQUIDAUANA","MIRANDA","BODOQUENA",
    "PORTO MURTINHO","RIO VERDE DE MATO GROSSO","SONORA","COXIM"
]
municipios_norm = [normalize_txt(m) for m in municipios_pantanal]

# -------------------------------
# 1Ô∏è‚É£ Esta√ß√µes de precipita√ß√£o
# -------------------------------
lista_prec = get_data.ANA.list_prec_stations()
lista_prec["City_norm"] = lista_prec["City"].apply(normalize_txt)
estacoes_prec_pantanal = lista_prec[lista_prec["City_norm"].isin(municipios_norm)].copy()
print("Esta√ß√µes de precipita√ß√£o no Pantanal:", estacoes_prec_pantanal.shape[0])

# Baixar s√©ries de precipita√ß√£o
dados_prec = {}
for codigo in tqdm(estacoes_prec_pantanal["Code"].astype(str), desc="Baixando precipita√ß√£o"):
    try:
        df = get_data.ANA.prec_data([codigo], only_consisted=False)
        df.index = pd.to_datetime(df.index)
        if not df.empty:
            # Interpola√ß√£o linear para valores faltantes
            df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')
            # Z-score
            df_z = df.apply(zscore)
            df_z.columns = [f"{c}_zscore" for c in df_z.columns]
            # Percentis para cheias/secas
            df_perc = df.rank(pct=True)
            df_perc.columns = [f"{c}_percentile" for c in df_perc.columns]
            # Concatenar normal, zscore e percentis
            df_final = pd.concat([df, df_z, df_perc], axis=1)
            dados_prec[codigo] = df_final
    except Exception as e:
        print(f"Erro ao baixar {codigo}: {e}")

# Concatenar todas as s√©ries de precipita√ß√£o
dfs_validos = [df for df in dados_prec.values() if not df.empty]
df_prec_all = pd.concat(dfs_validos, keys=dados_prec.keys(), names=["Code", "Date"])
df_prec_all.reset_index(inplace=True)

# Exportar para Excel
df_prec_all.to_excel("export/precipitacao_pantanal.xlsx", index=False)
print("‚úÖ Precipita√ß√£o exportada para export/precipitacao_pantanal.xlsx")

# -------------------------------
# 2Ô∏è‚É£ Esta√ß√µes de vaz√£o (flow)
# -------------------------------
lista_flu = get_data.ANA.list_flow_stations()
lista_flu["City_norm"] = lista_flu["City"].apply(normalize_txt)
estacoes_flu_pantanal = lista_flu[lista_flu["City_norm"].isin(municipios_norm)].copy()
codigos_flu = estacoes_flu_pantanal["Code"].astype(str).tolist()
print("Esta√ß√µes de vaz√£o no Pantanal:", len(codigos_flu))

dados_flu = {}
for codigo in tqdm(codigos_flu, desc="Baixando vaz√£o"):
    try:
        df = get_data.ANA.flow_data([codigo], only_consisted=False)
        df.index = pd.to_datetime(df.index)
        if not df.empty:
            # Interpola√ß√£o linear para valores faltantes
            df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')
            # Z-score
            df_z = df.apply(zscore)
            df_z.columns = [f"{c}_zscore" for c in df_z.columns]
            # Percentis para cheias/secas
            df_perc = df.rank(pct=True)
            df_perc.columns = [f"{c}_percentile" for c in df_perc.columns]
            # Concatenar normal, zscore e percentis
            df_final = pd.concat([df, df_z, df_perc], axis=1)
            dados_flu[codigo] = df_final
    except Exception as e:
        print(f"Erro ao baixar {codigo}: {e}")

# Concatenar todas as s√©ries de vaz√£o
dfs_validos_flu = [df for df in dados_flu.values() if not df.empty]
df_flu_all = pd.concat(dfs_validos_flu, keys=dados_flu.keys(), names=["Code", "Date"])
df_flu_all.reset_index(inplace=True)

# Exportar para Excel
df_flu_all.to_excel("export/vazao_pantanal.xlsx", index=False)
print("‚úÖ Vaz√£o exportada para export/vazao_pantanal.xlsx")


Esta√ß√µes de precipita√ß√£o no Pantanal: 87


Baixando precipita√ß√£o:   0%|          | 0/87 [00:00<?, ?it/s]


  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:00<00:00,  1.05it/s]
  df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.58s/it]
  df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.26s/it]
  df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.54s/it]
  df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:05<00:00,  5.24s/it]
  df = df.interpolate(method='time').fillna(method='bfill').fillna(method='ffill')

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.76s/it]
  df = df.int

ValueError: This sheet is too large! Your sheet size is: 1253700, 263 Max sheet size is: 1048576, 16384

Fun√ß√£o preprocess_df:

Filtra DataFrames vazios

Interpola dados faltantes

Calcula STL (trend, seasonal, resid)

Calcula z-score e percentis

Fun√ß√£o export_dfs_to_excel:

Exporta m√∫ltiplos DataFrames em um √∫nico arquivo Excel

Divide em v√°rias planilhas se ultrapassar 1 milh√£o de linhas

Limita nomes das abas a 31 caracteres

Substitui a exporta√ß√£o direta to_excel pelo pipeline robusto acima

Mant√©m a estrutura de download das esta√ß√µes de precipita√ß√£o e vaz√£o

In [None]:
# -------------------------------
# Importa√ß√µes
# -------------------------------
import pandas as pd
import numpy as np
from hydrobr import get_data
from tqdm.notebook import tqdm
import unicodedata
from scipy.stats import zscore
from statsmodels.tsa.seasonal import STL
import math
import os

# Criar pasta de exporta√ß√£o
EXPORT_PATH = "export"
if not os.path.exists(EXPORT_PATH):
    os.makedirs(EXPORT_PATH)

# -------------------------------
# Fun√ß√£o de normaliza√ß√£o de texto
# -------------------------------
def normalize_txt(txt):
    txt = str(txt)
    txt = unicodedata.normalize('NFKD', txt)
    txt = txt.encode('ascii', errors='ignore').decode('utf-8').upper()
    return txt

# -------------------------------
# Lista oficial de munic√≠pios do Pantanal
# -------------------------------
municipios_pantanal = [
    "BAR√ÉO DE MELGA√áO","C√ÅCERES","LAMBARI D‚ÄôOESTE","POCON√â",
    "NOSSA SENHORA DO LIVRAMENTO","SANTO ANT√îNIO DO LEVERGER","ITIQUIRA",
    "CORUMB√Å","LAD√ÅRIO","AQUIDAUANA","MIRANDA","BODOQUENA",
    "PORTO MURTINHO","RIO VERDE DE MATO GROSSO","SONORA","COXIM"
]
municipios_norm = [normalize_txt(m) for m in municipios_pantanal]

# -------------------------------
# Fun√ß√µes de pr√©-processamento
# -------------------------------
def preprocess_df(df, value_cols=None):
    """Filtra vazio, interpola, calcula STL, z-score e percentis"""
    if df.empty:
        return None

    df = df.sort_index().copy()

    if value_cols is None:
        value_cols = df.columns.tolist()

    # Interpola√ß√£o temporal
    df[value_cols] = df[value_cols].interpolate(method='time', limit_direction='both')

    # STL
    for col in value_cols:
        stl = STL(df[col], period=12, robust=True)
        res = stl.fit()
        df[f"{col}_trend"] = res.trend
        df[f"{col}_seasonal"] = res.seasonal
        df[f"{col}_resid"] = res.resid

    # Z-score
    df_z = df[value_cols].apply(zscore)
    df_z.columns = [f"{c}_zscore" for c in df_z.columns]

    # Percentis
    df_perc = df[value_cols].rank(pct=True)
    df_perc.columns = [f"{c}_percentile" for c in df_perc.columns]

    df_final = pd.concat([df, df_z, df_perc], axis=1)
    return df_final

def export_dfs_to_excel(dfs_dict, filename, max_rows=1_000_000):
    """Exporta m√∫ltiplos DataFrames em um √∫nico Excel, dividindo em planilhas se necess√°rio"""
    full_path = os.path.join(EXPORT_PATH, filename)
    with pd.ExcelWriter(full_path, engine="openpyxl") as writer:
        for station, df in dfs_dict.items():
            if df is None or df.empty:
                print(f"‚ö†Ô∏è {station}: DataFrame vazio, pulando exporta√ß√£o")
                continue
            num_sheets = math.ceil(len(df) / max_rows)
            for i in range(num_sheets):
                start = i * max_rows
                end = (i + 1) * max_rows
                sheet_name = f"{station}" if num_sheets == 1 else f"{station}_{i+1}"
                sheet_name = sheet_name[:31]  # limite de 31 caracteres
                df.iloc[start:end].to_excel(writer, sheet_name=sheet_name, index=True)
    print(f"‚úÖ Exporta√ß√£o conclu√≠da em '{full_path}'")

# -------------------------------
# 1Ô∏è‚É£ Esta√ß√µes de precipita√ß√£o
# -------------------------------
lista_prec = get_data.ANA.list_prec_stations()
lista_prec["City_norm"] = lista_prec["City"].apply(normalize_txt)
estacoes_prec_pantanal = lista_prec[lista_prec["City_norm"].isin(municipios_norm)].copy()
print("Esta√ß√µes de precipita√ß√£o no Pantanal:", estacoes_prec_pantanal.shape[0])

dados_prec = {}
for codigo in tqdm(estacoes_prec_pantanal["Code"].astype(str), desc="Baixando precipita√ß√£o"):
    try:
        df = get_data.ANA.prec_data([codigo], only_consisted=False)
        df.index = pd.to_datetime(df.index)
        if not df.empty:
            df_proc = preprocess_df(df)
            dados_prec[codigo] = df_proc
    except Exception as e:
        print(f"Erro ao baixar {codigo}: {e}")

# Exportar todas as esta√ß√µes de precipita√ß√£o em um √∫nico Excel
export_dfs_to_excel(dados_prec, "precipitacao_pantanal.xlsx")

# -------------------------------
# 2Ô∏è‚É£ Esta√ß√µes de vaz√£o
# -------------------------------
lista_flu = get_data.ANA.list_flow_stations()
lista_flu["City_norm"] = lista_flu["City"].apply(normalize_txt)
estacoes_flu_pantanal = lista_flu[lista_flu["City_norm"].isin(municipios_norm)].copy()
codigos_flu = estacoes_flu_pantanal["Code"].astype(str).tolist()
print("Esta√ß√µes de vaz√£o no Pantanal:", len(codigos_flu))

dados_flu = {}
for codigo in tqdm(codigos_flu, desc="Baixando vaz√£o"):
    try:
        df = get_data.ANA.flow_data([codigo], only_consisted=False)
        df.index = pd.to_datetime(df.index)
        if not df.empty:
            df_proc = preprocess_df(df)
            dados_flu[codigo] = df_proc
    except Exception as e:
        print(f"Erro ao baixar {codigo}: {e}")

# Exportar todas as esta√ß√µes de vaz√£o em um √∫nico Excel
export_dfs_to_excel(dados_flu, "vazao_pantanal.xlsx")


Esta√ß√µes de precipita√ß√£o no Pantanal: 87


Baixando precipita√ß√£o:   0%|          | 0/87 [00:00<?, ?it/s]


  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:00<00:00,  1.03it/s]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.97s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.24s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.52s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.47s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.95s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.51s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.10s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.43s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  5.00s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<0

‚úÖ Exporta√ß√£o conclu√≠da em 'export/precipitacao_pantanal.xlsx'
Esta√ß√µes de vaz√£o no Pantanal: 48


Baixando vaz√£o:   0%|          | 0/48 [00:00<?, ?it/s]


  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.71s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.02s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.62s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.29s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.96s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.63s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.08s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.38s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.94s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.96s/it]

  0%|          | 0/1 [00:00<?, ?i

Erro ao baixar 66523000: No objects to concatenate



  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:06<00:00,  6.65s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.11s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.91s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.25s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:02<00:00,  2.78s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.90s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.06s/it]

  0%|          | 0/1 [00:00<?, ?it/s][A
100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:04<00:00,  4.33s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:01<00:00,  1.81s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 1/1 [00:03<00:00,  3.27s/it]

  df = pd.concat(df)

100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚

‚úÖ Exporta√ß√£o conclu√≠da em 'export/vazao_pantanal.xlsx'
