In [2]:
# %% [markdown]
# # 5️⃣ Adicionar coluna "Regional" aos dados municipais
# Este script classifica cada município em sua respectiva Regional do Ruraltins.

import pandas as pd
import os

# Caminhos
input_dir = "C:/Users/Valentine/Artigo_Mapitos/data_clean/05_Regionais/Municipios"
output_dir = "C:/Users/Valentine/Artigo_Mapitos/data_clean/05_Regionais/Regionais"
os.makedirs(output_dir, exist_ok=True)

# %% [markdown]
# ## 1️⃣ Definir dicionário de regionais

regionais = {
    "Araguína": [
        "Aragominas", "Araguaína", "Araguanã", "Babaçulândia", "Barra do Ouro",
        "Campos Lindos", "Carmolândia", "Filadélfia", "Goiatins",
        "Muricilândia", "Nova Olinda", "Piraquê", "Santa Fé do Araguaia", "Wanderlândia", "Xambioá"
    ],
    "Araguatins": [
        "Aguiarnópolis", "Ananás", "Angico", "Araguatins", "Augustinópolis", "Axixá do Tocantins",
        "Buriti do Tocantins", "Cachoeirinha", "Carrasco Bonito", "Darcinópolis", "Esperantina",
        "Itaguatins", "Luzinópolis", "Maurilândia do Tocantins", "Nazaré", "Palmeiras do Tocantins",
        "Praia Norte", "Riachinho", "Sampaio", "Santa Terezinha do Tocantins", "São Bento do Tocantins",
        "São Miguel do Tocantins", "São Sebastião do Tocantins", "Sítio Novo do Tocantins", "Tocantinópolis"
    ],
    "Colinas": [
        "Arapoema", "Bandeirantes do Tocantins", "Bernardo Sayão", "Brasilândia do Tocantins",
        "Colinas do Tocantins", "Colméia", "Couto Magalhães", "Goianorte", "Guaraí", "Itacajá",
        "Itapiratins", "Itaporã do Tocantins", "Juarina", "Palmeirante", "Pau D'Arco", "Pequizeiro",
        "Presidente Kennedy", "Tupiratins"
    ],
    "Gurupi": [
        "Aliança do Tocantins", "Alvorada", "Araguaçu", "Cariri do Tocantins", "Crixás do Tocantins",
        "Dueré", "Figueirópolis", "Formoso do Araguaia", "Gurupi", "Jaú do Tocantins", "Palmeirópolis",
        "Peixe", "Sandolândia", "Santa Rita do Tocantins", "São Salvador do Tocantins", "Sucupira", "Talismã"
    ],
    "Miracema": [
        "Bom Jesus do Tocantins", "Centenário", "Fortaleza do Tabocão", "Lizarda", "Miracema do Tocantins",
        "Miranorte", "Pedro Afonso", "Recursolândia", "Rio dos Bois", "Rio Sono",
        "Santa Maria do Tocantins", "Tocantínia", "Tupirama"
    ],
    "Paraiso": [
        "Abreulândia", "Araguacema", "Barrolândia", "Caseara", "Chapada de Areia", "Cristalândia",
        "Divinópolis do Tocantins", "Dois Irmãos do Tocantins", "Lagoa da Confusão", "Marianópolis do Tocantins",
        "Monte Santo do Tocantins", "Nova Rosalândia", "Paraíso do Tocantins", "Pium", "Pugmil"
    ],
    "Porto Nacional": [
        "Aparecida do Rio Negro", "Brejinho de Nazaré", "Chapada da Natividade", "Fátima",
        "Ipueiras", "Lagoa do Tocantins", "Lajeado", "Mateiros", "Monte do Carmo", "Natividade",
        "Novo Acordo", "Oliveira de Fátima", "Palmas", "Pindorama do Tocantins", "Ponte Alta do Tocantins",
        "Porto Nacional", "Santa Rosa do Tocantins", "Santa Tereza do Tocantins",
        "São Félix do Tocantins", "São Valério da Natividade", "Silvanópolis"
    ],
    "Taguatinga do Tocantins": [
        "Almas", "Arraias", "Aurora do Tocantins", "Combinado", "Conceição do Tocantins", "Dianópolis",
        "Lavandeira", "Novo Alegre", "Novo Jardim", "Paranã", "Ponte Alta do Bom Jesus",
        "Porto Alegre do Tocantins", "Rio da Conceição", "Taguatinga do Tocantins", "Taipas"
    ]
}

# Inverter dicionário (município → regional)
mapa_municipio_regional = {}
for reg, munis in regionais.items():
    for m in munis:
        mapa_municipio_regional[m.lower()] = reg

# %% [markdown]
# ## 2️⃣ Função para adicionar a coluna "regional"

def adicionar_regional(df, coluna_municipio):
    df["regional"] = (
        df[coluna_municipio]
        .astype(str)
        .str.lower()
        .str.strip()
        .map(mapa_municipio_regional)
    )
    return df

# %% [markdown]
# ## 3️⃣ Aplicar a função a todos os arquivos da pasta de agregados

arquivos = [f for f in os.listdir(input_dir) if f.endswith(".csv")]

for nome in arquivos:
    caminho = os.path.join(input_dir, nome)
    df = pd.read_csv(caminho)

    # Detectar qual coluna de município usar
    if "municipio_ibge" in df.columns:
        df = adicionar_regional(df, "municipio_ibge")
    elif "municipio_original" in df.columns:
        df = adicionar_regional(df, "municipio_original")
    else:
        print(f"⚠️ {nome} não possui coluna de município, pulando.")
        continue

    # Exportar com nova coluna
    caminho_out = os.path.join(output_dir, nome)
    df.to_csv(caminho_out, index=False, encoding="utf-8-sig")
    print(f"✅ {nome} salvo com coluna 'regional' ({df['regional'].notna().sum()} municípios classificados).")

print("\n🌿 Adição de regionais concluída!")


✅ 04_Atividades_Mun.csv salvo com coluna 'regional' (1015 municípios classificados).
✅ 04_Autorizacao_Uso_Agua_Mun.csv salvo com coluna 'regional' (135 municípios classificados).
✅ 04_Politicas_Publicas_Mun.csv salvo com coluna 'regional' (525 municípios classificados).
✅ 04_Uso_Convencionais_Degradacao_Mun.csv salvo com coluna 'regional' (975 municípios classificados).
✅ 04_Uso_Sustentavel_Degradacao_Mun.csv salvo com coluna 'regional' (949 municípios classificados).

🌿 Adição de regionais concluída!
