In [1]:
# %% [markdown]
# # 1️⃣ Formatar Colunas
# Este notebook padroniza os nomes de colunas e mantém apenas as relevantes.
# Salva as tabelas limpas na pasta `data_clean/01_Formatado/`.

import pandas as pd
import os

input_dir = "C:/Users/Valentine/Artigo_Mapitos/data_clean/01_Municipios_Normalizados"
output_dir = "C:/Users/Valentine/Artigo_Mapitos/data_clean/02_Formatado"
os.makedirs(output_dir, exist_ok=True)

# Dicionário de colunas para cada arquivo (você preenche aos poucos)
colunas_por_arquivo = {
    "01_Atividades_Mun.csv": ["atividade_produtiva", "municipio_ibge", "Record Count"],
    "01_Autorizacao_Uso_Agua_Mun.csv": ["autorizacao_para_uso_de_agua__", "municipio_ibge", "Record Count"],
    "01_Politicas_Publicas_Mun.csv": ["acessa_ou_ja_acessou_politicas_publicas__", "municipio_ibge", "Record Count"],
    "01_Uso_Convencionais_Degradacao_Mun.csv": ["uso_de_praticas_convencionais", "qual_o_nivel_de_degradacao_que_predomina_nas_pastagens_", "municipio_ibge", "Record Count"],
    "01_Uso_Sustentavel_Degradacao_Mun.csv": ["uso_de_praticas_sustentaveis_", "qual_o_nivel_de_degradacao_que_predomina_nas_pastagens_", "municipio_ibge", "Record Count"],
    "atividade_tamanho.csv": ["atividade_produtiva", "area_da_propriedade__hectares__", "Record Count"],
    "politica_publica_tamanho.csv": ["acessa_ou_ja_acessou_politicas_publicas__", "area_da_propriedade__hectares__", "Record Count"],
    "uso_convencionais_tamanho.csv": ["uso_de_praticas_convencionais", "area_da_propriedade__hectares__","regional_","Record Count"],
    "Uso_de_Agrotox_por_tamanho.csv": ["usa_agrotoxicos_", "area_da_propriedade__hectares__","regional_","Record Count"],
    "uso_sustentaveis_tamanho.csv": ["uso_de_praticas_sustentaveis_", "area_da_propriedade__hectares__","regional_", "Record Count"]
}

for nome, colunas in colunas_por_arquivo.items():
    caminho = os.path.join(input_dir, nome)
    if not os.path.exists(caminho):
        print(f"⚠️ {nome} não encontrado.")
        continue
    
    df = pd.read_csv(caminho)
    colunas_existentes = [c for c in colunas if c in df.columns]
    df = df[colunas_existentes]
    df = df.rename(columns={"Record Count": "count"})
    df.to_csv(os.path.join(output_dir, nome), index=False, encoding="utf-8-sig")
    print(f"✅ {nome} formatado e salvo.")


✅ 01_Atividades_Mun.csv formatado e salvo.
✅ 01_Autorizacao_Uso_Agua_Mun.csv formatado e salvo.
✅ 01_Politicas_Publicas_Mun.csv formatado e salvo.
✅ 01_Uso_Convencionais_Degradacao_Mun.csv formatado e salvo.
✅ 01_Uso_Sustentavel_Degradacao_Mun.csv formatado e salvo.
✅ atividade_tamanho.csv formatado e salvo.
✅ politica_publica_tamanho.csv formatado e salvo.
✅ uso_convencionais_tamanho.csv formatado e salvo.
✅ Uso_de_Agrotox_por_tamanho.csv formatado e salvo.
✅ uso_sustentaveis_tamanho.csv formatado e salvo.
