In [47]:
import pandas as pd
from glob import glob
import os

caminho_pasta = r"C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs"
arquivos = glob(os.path.join(caminho_pasta, "*.csv"))

lista_df = []

for arquivo in arquivos:
    try:
        df = pd.read_csv(arquivo, sep=";", encoding="latin1",skiprows=10)

        # Padroniza os nomes das colunas
        df.columns = [col.lower()
                          .strip()
                          .replace(" ", "_")
                          .replace(",", "")
                          .replace("(", "")
                          .replace(")", "")
                          .replace("ã", "a")
                          .replace("á", "a")
                          .replace("é", "e")
                          .replace("í", "i")
                          .replace("ó", "o")
                          .replace("ú", "u")
                          .replace("ç", "c")
                          .replace("°", "")
                          for col in df.columns]

                # Faz o rename baseado em parte do nome (mais tolerante a variações)
        colunas_renomeadas = {}
        for col in df.columns:
            if "data" in col:
                colunas_renomeadas[col] = "data"
            elif "precipitacao" in col:
                colunas_renomeadas[col] = "precipitacao"
            elif "temperatura_maxima" in col:
                colunas_renomeadas[col] = "temp_max"
            elif "temperatura_minima" in col:
                colunas_renomeadas[col] = "temp_min"
            elif "temperatura_media" in col or "temperatura_compensada" in col:
                colunas_renomeadas[col] = "temp_med"
            elif "umidade_relativa" in col and "media" in col:
                colunas_renomeadas[col] = "umid_med"
            elif "umidade_relativa" in col and "minima" in col:
                colunas_renomeadas[col] = "umid_min"

        df = df.rename(columns=colunas_renomeadas)

        # Adiciona a estação
        df["estacao"] = os.path.basename(arquivo).split("_")[1]

        # Seleciona colunas úteis
        colunas_finais = ["data", "estacao", "precipitacao", "temp_min", "temp_med", "temp_max", "umid_min", "umid_med"]
        df = df[[col for col in colunas_finais if col in df.columns]]

        # Mostra colunas do arquivo atual
        print(f"📁 {arquivo}")
        print("✅ Colunas reconhecidas:", df.columns.tolist())
        print("-" * 40)

        lista_df.append(df)

    except Exception as e:
        print(f"Erro no arquivo {arquivo}: {e}")

# Junta tudo
if lista_df:
    df_clima = pd.concat(lista_df, ignore_index=True)
    print("🎉 Dados finais unidos!")
    print(df_clima.head())
else:
    print("❌ Nenhum dado válido foi encontrado.")

📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_82927_D_2000-01-01_2000-11-07.csv
✅ Colunas reconhecidas: ['data', 'estacao', 'precipitacao', 'temp_min', 'temp_med', 'temp_max', 'umid_min', 'umid_med']
----------------------------------------
📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_83214_D_2000-01-01_2021-03-14.csv
✅ Colunas reconhecidas: ['data', 'estacao', 'precipitacao', 'temp_min', 'temp_med', 'temp_max', 'umid_min', 'umid_med']
----------------------------------------
📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_83264_D_2000-01-01_2014-05-01.csv
✅ Colunas reconhecidas: ['data', 'estacao', 'precipitacao', 'temp_min', 'temp_med', 'temp_max', 'umid_min', 'umid_med']
----------------------------------------
📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_83265_D_200

📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_A918_D_2008-06-06_2018-03-11.csv
✅ Colunas reconhecidas: ['data', 'estacao', 'precipitacao', 'temp_min', 'temp_med', 'temp_max', 'umid_min', 'umid_med']
----------------------------------------
📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_A919_D_2007-05-27_2023-12-31.csv
✅ Colunas reconhecidas: ['data', 'estacao', 'precipitacao', 'temp_min', 'temp_med', 'temp_max', 'umid_min', 'umid_med']
----------------------------------------
📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_A920_D_2006-11-23_2023-12-31.csv
✅ Colunas reconhecidas: ['data', 'estacao', 'precipitacao', 'temp_min', 'temp_med', 'temp_max', 'umid_min', 'umid_med']
----------------------------------------
📁 C:/Users/Jonas/Documents/MeusProjetos/Projetos_e_Analises/milho-clima-mt/data/raw/inmet_csvs\dados_A921_D_2007-10

In [48]:
df_clima

Unnamed: 0,data,estacao,precipitacao,temp_min,temp_med,temp_max,umid_min,umid_med
0,2000-01-01,82927,,21,255,32,69.0,843
1,2000-01-02,82927,,226,,,67.0,
2,2000-01-03,82927,,22,258,33,79.0,893
3,2000-01-04,82927,,224,255,332,74.0,868
4,2000-01-05,82927,,25,,288,90.0,
...,...,...,...,...,...,...,...,...
324331,2023-12-27,A944,,218,,357,39.0,722
324332,2023-12-28,A944,,228,,383,31.0,655
324333,2023-12-29,A944,,249,,343,51.0,793
324334,2023-12-30,A944,,229,,337,48.0,791


In [49]:
df_clima.to_csv("dados_clima_mt.csv", index=False, encoding="utf-8")

