In [151]:
import requests
import pandas as pd
from tqdm import tqdm

In [152]:
url_uf = "https://resultados.tse.jus.br/oficial/ele2022/544/config/mun-e000544-cm.json"
requisicao_uf = requests.get(url_uf)
requisicao_uf = requisicao_uf.json()

In [163]:
from joblib import Parallel, delayed

# função para rodar código em paralelo

def pegar_dados_api(uf):
    lista_candidatos = []

    sigla_uf = uf["cd"]
    estado = uf["ds"]

    #if sigla_uf == "AL":


    for municipio in uf["mu"]:

        nome_mun = municipio["nm"]
        cod_tse = municipio["cd"]
        cod_ibge = municipio["cdi"]

        url_mun = f"https://resultados.tse.jus.br/oficial/ele2022/544/dados/{sigla_uf.lower()}/{sigla_uf.lower()}{cod_tse}-c0001-e000544-v.json"
        requisicao_mun = requests.get(url_mun)
        requisicao_mun = requisicao_mun.json()

        for candidato in requisicao_mun["abr"][0]["cand"]:

            lista_candidatos.append({
                "uf": sigla_uf,
                "estado": estado,
                "nome_mun": nome_mun,
                "cod_tse": cod_tse,
                "cod_ibge": cod_ibge,
                "posicao_canditato": candidato["seq"],
                "num_canditato": candidato["n"],
                "situacao": candidato["st"],
                "votos_totais": candidato["vap"],
                "perc_votos_totais": candidato["pvap"],
            })

    return lista_candidatos


In [164]:
# vídeo explicativo de como funciona a biblioteca para rodar código em paralelo https://www.youtube.com/watch?v=maj47xd_R7g&t=906

resultado = Parallel(n_jobs=-1)(delayed(pegar_dados_api)(uf) for uf in requisicao_uf["abr"])
#print(resultado)

In [170]:
# organizando os dados em apenas uma lista
lista_dados_coletados = []

for uf in resultado:
    for municipio in uf:
        lista_dados_coletados.append(municipio)

In [176]:
df_dados = pd.DataFrame(lista_dados_coletados)

# transportando dados de linhas para colunas com a função "pivote"
dados_agredados = df_dados.pivot(index=["cod_tse", "cod_ibge", "nome_mun", "uf", "estado"],
                                columns='num_canditato', 
                                values="perc_votos_totais")
dados_agredados.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,num_canditato,12,13,14,15,16,21,22,27,30,44,80
cod_tse,cod_ibge,nome_mun,uf,estado,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1
19,1100106,GUAJARÁ-MIRIM,RO,RONDÔNIA,206,3419,5,382,0,0,5914,1,15,53,3
35,1100205,PORTO VELHO,RO,RONDÔNIA,294,3421,11,455,2,3,5683,2,42,81,4
51,1100122,JI-PARANÁ,RO,RONDÔNIA,192,2424,8,308,2,3,6979,1,26,55,2
78,1100023,ARIQUEMES,RO,RONDÔNIA,174,2097,6,285,1,3,7352,0,29,48,3
94,1100049,CACOAL,RO,RONDÔNIA,210,2404,8,328,1,2,6955,1,34,55,3


In [177]:
# reorganizando os nomes das colunas
dados_agredados = dados_agredados.reset_index()
dados_agredados.head()

num_canditato,cod_tse,cod_ibge,nome_mun,uf,estado,12,13,14,15,16,21,22,27,30,44,80
0,19,1100106,GUAJARÁ-MIRIM,RO,RONDÔNIA,206,3419,5,382,0,0,5914,1,15,53,3
1,35,1100205,PORTO VELHO,RO,RONDÔNIA,294,3421,11,455,2,3,5683,2,42,81,4
2,51,1100122,JI-PARANÁ,RO,RONDÔNIA,192,2424,8,308,2,3,6979,1,26,55,2
3,78,1100023,ARIQUEMES,RO,RONDÔNIA,174,2097,6,285,1,3,7352,0,29,48,3
4,94,1100049,CACOAL,RO,RONDÔNIA,210,2404,8,328,1,2,6955,1,34,55,3


In [179]:
# dar nota de 1 a 4 (a depender do resultado) para ajudar na visualização no datawrapper

dados_status = []

for row in dados_agredados.values:
    
    lula = float(row[6].replace(',', '.'))
    bolsonaro = float(row[11].replace(',', '.'))

    if lula < 50 and lula > bolsonaro:
        status = 2 # Lula ganha mas tem menos que 50%    

    if lula >= 50:
        status = 1 # Lula ganha com mais de 50%

    if bolsonaro < 50 and bolsonaro > lula:
        status = 3 # Lula ganha mas tem menos que 50%    

    if bolsonaro >= 50:
        status = 4 # Lula ganha com mais de 50%

    dados_status.append(status)
    

In [180]:
# adicionando dados em uma nova coluna do dataframe
dados_agredados['status'] = dados_status

In [182]:
df_dados.to_csv("dados/votos_presidente_municipios_2022.csv")

#### ---- FIM ----

### execucao do código normal
(sem dar nota de status)

In [30]:
lista_candidatos = [] 

for uf in tqdm(requisicao_uf["abr"]):
    
    #print(uf["ds"])
    if sigla_uf == "AL":
        sigla_uf = uf["cd"]
        estado = uf["ds"]

        #print("------")
        for municipio in uf["mu"]:

            nome_mun = municipio["nm"]
            cod_tse = municipio["cd"]
            cod_ibge = municipio["cdi"]

            url_mun = f"https://resultados.tse.jus.br/oficial/ele2022/544/dados/{sigla_uf.lower()}/{sigla_uf.lower()}{cod_tse}-c0001-e000544-v.json"
            requisicao_mun = requests.get(url_mun)
            requisicao_mun = requisicao_mun.json()

            for candidato in requisicao_mun["abr"][0]["cand"]:

                lista_candidatos.append({
                    "uf": sigla_uf,
                    "estado": estado,
                    "nome_mun": nome_mun,
                    "cod_tse": cod_tse,
                    "cod_ibge": cod_ibge,
                    "posicao_canditato": candidato["seq"],
                    "num_canditato": candidato["n"],
                    "situacao": candidato["st"],
                    "votos_totais": candidato["vap"],
                    "perc_votos_totais": candidato["pvap"],
                })


100%|██████████| 28/28 [22:36<00:00, 48.46s/it]


In [61]:
print(len(lista_candidatos))

63261


In [32]:
df_dados = pd.DataFrame(lista_candidatos)
df_dados.to_csv("dados/votos_presidente_municipios_2022.csv")