In [1]:
import earthaccess
import xarray as xr
import pandas as pd
from datetime import datetime
import os
import shutil

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# ======================= CONFIGURAÇÕES =======================
# Coordenadas do local de interesse (Uberlândia, MG)
LATITUDE = -18.91
LONGITUDE = -48.27

# Período histórico para análise
# Para um teste rápido, comece com um range pequeno, ex: 1980-1982
START_YEAR = 2010
END_YEAR = 2024 

# Definição dos limiares
THRESHOLDS = {
    "Muito Quente": {"percentile": 90, "variable": "temp_max_c"},
    "Muito Frio": {"percentile": 10, "variable": "temp_min_c"}
}

# Diretório para baixar os arquivos
DOWNLOAD_PATH = "./earthaccess_downloads"
# =============================================================

In [3]:
# (Função reutilizada da abordagem anterior - a lógica de análise é a mesma)
def calculate_historical_probabilities(df, target_date):
    if df is None or df.empty: return None
    results = {}
    target_day_data = df[(df.index.day == target_date.day) & (df.index.month == target_date.month)]
    if target_day_data.empty: return None
        
    total_years = len(target_day_data)
    print(f"\nAnalisando {total_years} registros históricos para o dia {target_date.day} de {target_date.strftime('%B')}...")

    for condition, rules in THRESHOLDS.items():
        variable = rules['variable']
        threshold_value = df[variable].quantile(rules['percentile'] / 100.0)
        
        if rules['percentile'] > 50:
            count_met = target_day_data[target_day_data[variable] > threshold_value].shape[0]
            comparison = f"> {threshold_value:.1f}°C"
        else:
            count_met = target_day_data[target_day_data[variable] < threshold_value].shape[0]
            comparison = f"< {threshold_value:.1f}°C"

        probability = (count_met / total_years) * 100
        results[condition] = {"limiar": comparison, "probabilidade": f"{probability:.1f}%"}
        
    return results

def fetch_and_extract_with_earthaccess(year, lat, lon):
    print(f"\n--- Processando ano: {year} ---")
    try:
        results = earthaccess.search_data(
            short_name="M2T1NXSLV",
            version='5.12.4',
            temporal=(f'{year}-01-01', f'{year}-12-31'),
            bounding_box=(lon - 0.5, lat - 0.5, lon + 0.5, lat + 0.5)
        )
        if not results:
            print(f"Nenhum dado encontrado para o ano {year}.")
            return None

        print(f"Baixando {len(results)} arquivos para o ano {year}...")
        local_path_year = os.path.join(DOWNLOAD_PATH, str(year))
        downloaded_files = earthaccess.download(results, local_path=local_path_year)

        print("Extraindo dados do ponto de interesse...")
        with xr.open_mfdataset(downloaded_files, combine='by_coords') as ds:
            point_ds = ds[['T2MMAX', 'T2MMIN']].sel(lat=lat, lon=lon, method='nearest')
            df_year = point_ds.to_dataframe()

        shutil.rmtree(local_path_year)
        print(f"Arquivos para o ano {year} processados e limpos.")
        
        return df_year
    except Exception as e:
        print(f"Falha ao processar o ano {year}. Erro: {e}")
        return None

In [None]:
# Autenticação (Lembrete: certifique-se que seu arquivo .netrc está configurado!)
try:
    auth = earthaccess.login()
    if not auth.authenticated:
        raise Exception("Falha na autenticação. Verifique seu arquivo .netrc ou credenciais.")
    print("Autenticação com Earthdata bem-sucedida!")
except Exception as e:
    print(f"Erro durante a autenticação: {e}")

# Loop principal para buscar e processar os dados
all_years_dfs = []
if auth.authenticated:
    for current_year in range(START_YEAR, END_YEAR + 1):
        df_for_year = fetch_and_extract_with_earthaccess(current_year, LATITUDE, LONGITUDE)
        if df_for_year is not None:
            all_years_dfs.append(df_for_year)

Autenticação com Earthdata bem-sucedida!

--- Processando ano: 2010 ---
Baixando 365 arquivos para o ano 2010...


QUEUEING TASKS | : 100%|██████████| 365/365 [00:00<00:00, 32631.80it/s]
PROCESSING TASKS | :  53%|█████▎    | 192/365 [20:28<12:48,  4.44s/it]

In [None]:
import netrc
import requests
from requests.auth import HTTPBasicAuth
import pandas as pd
import io

# 1. Parâmetros do usuário
lat = -18.91
lon = -48.27
time_start = "2000-01-01T00:00:00"
time_end = "2020-09-30T21:00:00"
data = "GLDAS_NOAH025_3H_2_1_Tair_f_inst"  # variável NASA/GLDAS: temperatura do ar instantânea

# 2. Autenticação Earthdata (leitura do .netrc)
# Certifique-se de ter ~/.netrc com:
# machine urs.earthdata.nasa.gov login SEU_LOGIN password SUA_SENHA
signin_url = "https://api.giovanni.earthdata.nasa.gov/signin"
creds = netrc.netrc().authenticators('urs.earthdata.nasa.gov')
if creds is None:
    raise RuntimeError("Credenciais Earthdata não encontradas em ~/.netrc!")
user, _, pwd = creds
token = requests.get(signin_url, auth=HTTPBasicAuth(user, pwd), allow_redirects=True).text.replace('"','')

# 3. Função para obter a série temporal
def call_time_series(lat, lon, time_start, time_end, data, token):
    query_parameters = {
        "data": data,
        "location": f"[{lat},{lon}]",
        "time": f"{time_start}/{time_end}"
    }
    headers = {"authorizationtoken": token}
    response = requests.get("https://api.giovanni.earthdata.nasa.gov/timeseries",
                            params=query_parameters, headers=headers)
    if response.status_code != 200:
        raise RuntimeError(f"Erro na requisição: HTTP {response.status_code} - {response.text[:300]}")
    return response.text

# 4. Chamar API e carregar CSV em pandas
csv_text = call_time_series(lat, lon, time_start, time_end, data, token)

lines = csv_text.splitlines()
header_index = next(i for i, line in enumerate(lines) if line.strip().lower().startswith("timestamp (utc),"))
table_csv = "\n".join(lines[header_index:])
df = pd.read_csv(io.StringIO(table_csv))

 # Converte para datetime e Celsius
df['time'] = pd.to_datetime(df.iloc[:, 0])
df.set_index('time', inplace=True)
df['temp_c'] = df['Data'] - 273.15

# 1. Salvar os dados HORÁRIOS
hourly_df = df[['temp_c']].dropna()
output_hourly = 'dados_horarios_temperatura.csv'
hourly_df.to_csv(output_hourly)
print(f"-> Arquivo com dados horários salvo em: {output_hourly}")

# 2. Agrupar por dia e salvar os dados DIÁRIOS
daily_df = df.resample('D').agg(
    temp_avg_c=('temp_c', 'mean'),
    temp_max_c=('temp_c', 'max'),
    temp_min_c=('temp_c', 'min')
)

daily_df = df.resample('D').agg(
    temp_avg_c=('temp_c', 'mean'),
    temp_max_c=('temp_c', 'max'),
    temp_min_c=('temp_c', 'min')
)
    
final_df = daily_df.dropna()

# Salva o arquivo final que a API Flask vai usar
output_filename = 'dados_historicos_tempeartura.csv'
final_df.to_csv(output_filename)


-> Arquivo com dados horários salvo em: dados_horarios.csv


In [2]:
if not all_years_dfs:
    print("Nenhum dado foi processado com sucesso. Verifique a saída da célula anterior para erros.")
else:
    # Combina os dataframes de todos os anos em um só
    print("\nCombinando todos os anos em um único dataset...")
    historical_df = pd.concat(all_years_dfs)

    # Limpeza final e conversão de Kelvin para Celsius
    historical_df['temp_max_c'] = historical_df['T2MMAX'] - 273.15
    historical_df['temp_min_c'] = historical_df['T2MMIN'] - 273.15
    historical_df = historical_df[['temp_max_c', 'temp_min_c']]
    
    # Calcular as probabilidades
    data_alvo = datetime.now()
    probabilities = calculate_historical_probabilities(historical_df, data_alvo)

    # Exibir os resultados
    if probabilities:
        print("\n" + "="*50)
        print(f"Análise de Probabilidade (via earthaccess) para Uberlândia, MG")
        print(f"Data da Análise: {data_alvo.day} de {data_alvo.strftime('%B')}") # Note que estamos em Outubro
        print(f"Baseado em dados de {START_YEAR} a {END_YEAR}")
        print("="*50)
        for condition, result in probabilities.items():
            print(f"Condição:       {condition}")
            print(f"  ↳ Limiar:       Temperatura {result['limiar']}")
            print(f"  ↳ Probabilidade: {result['probabilidade']}")
        print("="*50)

# Dica: Inspecione o dataframe final a qualquer momento em uma nova célula
# Basta digitar e executar:
# historical_df.head()
# historical_df.describe()

Nenhum dado foi processado com sucesso. Verifique a saída da célula anterior para erros.
