## Unificação com filtro de municípios (2k a 200k habitantes)

In [1]:
# Passo 1: gerar CSV de emendas com partidos
import subprocess
subprocess.run([
    'python', '../src/insert_parties.py',
    '--emendas', '../data/emendas_por_favorecido.csv',
    '--mapping', '../json_data/politicos_partidos_padronizado.json',
    '--out', '../data/emendas_por_favorecido_partidos.csv'
], check=True)


CompletedProcess(args=['python', '../src/insert_parties.py', '--emendas', '../data/emendas_por_favorecido.csv', '--mapping', '../json_data/politicos_partidos_padronizado.json', '--out', '../data/emendas_por_favorecido_partidos.csv'], returncode=0)

In [None]:
import pandas as pd
import re
from unidecode import unidecode


def normalize_municipio(nome: str) -> str:
    if pd.isna(nome):
        return None
    nome = unidecode(str(nome)).upper().strip()
    m = re.search(r"\((\w{2})\)$", nome)
    uf = None
    if m:
        uf = m.group(1)
        base = nome[:m.start()].strip()
    else:
        m = re.search(r"\s-\s([A-Z]{2})$", nome)
        if m:
            uf = m.group(1)
            base = nome[:m.start()].strip()
        else:
            base = nome
    return f"{base} - {uf}" if uf else base

# Emendas agregadas por municipio e partido
emendas = pd.read_csv('../data/emendas_por_favorecido_partidos.csv', encoding='utf-8-sig')
emendas['municipio'] = (emendas['Município Favorecido'] + ' - ' + emendas['UF Favorecido']).apply(normalize_municipio)
agg_pix_party = emendas.groupby(['municipio','siglaPartido'], as_index=False)['Valor Recebido'].sum().rename(columns={'Valor Recebido':'valor_pix'})

# Indicadores
dens = pd.read_csv('../data/densidade.csv')
dens['municipio'] = dens['name_muni_x'].apply(normalize_municipio)
dens = dens[['code_muni','municipio','population_2022','densidade_demografica']]

pib = pd.read_csv('../data/pib_per_capita.csv')
pib['municipio'] = pib['name_muni'].apply(normalize_municipio)
pib = pib[['municipio','pib_per_capita_2021']]

idhm = pd.read_csv('../data/idhm.csv')
idhm['municipio'] = idhm['Territorialidades'].apply(normalize_municipio)
idhm['alfabetizacao_2010'] = 100 - idhm['Taxa de analfabetismo - 15 anos ou mais de idade 2010']
idhm = idhm[['municipio','IDHM 2010','alfabetizacao_2010']]

# Resultados eleitorais
results = pd.read_csv('../data/resultados_eleicoes.csv')
results['municipio'] = (results['NM_MUNICIPIO'] + ' - ' + results['SG_UF']).apply(normalize_municipio)
agg = results.groupby(['municipio','NM_URNA_CANDIDATO','SG_PARTIDO','DS_SIT_TOT_TURNO'], as_index=False)['QT_VOTOS_NOMINAIS_VALIDOS'].sum()

tot = agg.groupby('municipio')['QT_VOTOS_NOMINAIS_VALIDOS'].sum()
agg = agg.join(tot, on='municipio', rsuffix='_tot')
agg['pct_votos'] = agg['QT_VOTOS_NOMINAIS_VALIDOS'] / agg['QT_VOTOS_NOMINAIS_VALIDOS_tot']

winners = agg[agg['DS_SIT_TOT_TURNO'] == 'ELEITO']

base = winners.merge(dens, on='municipio', how='left')
base = base.merge(agg_pix_party, left_on=['municipio','SG_PARTIDO'], right_on=['municipio','siglaPartido'], how='left')
base = base.merge(pib, on='municipio', how='left')
base = base.merge(idhm, on='municipio', how='left')

base['emendas_pix_per_capita_partido_prefeito_eleito'] = base['valor_pix'] / base['population_2022']
base['sigla_municipio'] = base['municipio'].str.extract(r'-\s*(\w{2})$')[0]

base_filtered = base[(base['population_2022'] >= 2000) & (base['population_2022'] <= 200000)]
final = base_filtered[['municipio','sigla_municipio','NM_URNA_CANDIDATO','pct_votos','emendas_pix_per_capita_partido_prefeito_eleito','IDHM 2010','alfabetizacao_2010','pib_per_capita_2021','densidade_demografica']]
final = final.rename(columns={'NM_URNA_CANDIDATO':'prefeito_eleito_2024',
                              'pct_votos':'porcentagem_votos_validos_2024',
                              'IDHM 2010':'idhm_2010'})

final.to_csv('../data/dados_unificados_prefeitos_200k.csv', index=False, encoding='utf-8-sig')
final.head()


Unnamed: 0,municipio,sigla_municipio,prefeito_eleito_2024,porcentagem_votos_validos_2024,emendas_pix_per_capita_partido_prefeito_eleito,idhm_2010,alfabetizacao_2010,pib_per_capita_2021,densidade_demografica
0,ABADIA DE GOIAS - GO,GO,WANDER SARAIVA,1.0,18716.018402,0.708,92.19,18491.217064,133.397997
1,ABADIA DOS DOURADOS - MG,MG,CIRO,0.575992,3188.77551,0.689,90.88,28184.630102,7.1274
2,ABADIANIA - GO,GO,DR ITAMAR,0.619504,3481.89415,0.689,89.16,25842.850511,16.509351
3,ABAETE - MG,MG,IVANIR,0.491826,1764.057332,0.698,91.28,23869.415656,12.47983
4,ABAETETUBA - PA,PA,FRANCINETI CARVALHO,0.417201,2528.605204,0.628,86.29,12322.938529,98.228786
