Dados extraídos de: https://www.tse.jus.br/eleicoes/estatisticas/repositorio-de-dados-eleitorais-1/repositorio-de-dados-eleitorais

Acesso em: 10/12/2020.

# Bibliotecas e configurações iniciais

In [1]:
import pandas as pd
import numpy as np
from tqdm import tqdm

pd.options.display.float_format = '{:.2f}'.format
pd.set_option('display.max_columns', None)

# Importando Dados

## Colunas

In [2]:
colunasFederal1 = [
    'DT_GERACAO', 'HH_GERACAO', 'ANO_ELEICAO', 'NR_TURNO', 'DS_ELEICAO',
    'SG_UF', 'NM_MUNICIPIO', 'NUM1', 'NR_CANDIDATO', 'NUM3', 'NM_CANDIDATO',
    'NM_URNA_CANDIDATO', 'DS_CARGO', 'NUM4', 'UNIND', 'NUM5',
    'DS_DETALHE_SITUACAO_CAND', 'NUM6', 'DS_SIT_TOT_TURNO', 'NR_PARTIDO',
    'SG_PARTIDO', 'NM_PARTIDO', 'NUM7', 'NM_COLIGACAO',
    'DS_COMPOSICAO_COLIGACAO', 'QT_VOTOS_NOMINAIS'
]

colunasFederal2 = [
    'DT_GERACAO', 'HH_GERACAO', 'ANO_ELEICAO', 'NR_TURNO', 'DS_ELEICAO',
    'SG_UF', 'NUM1', 'CD_MUNICIPIO', 'NM_MUNICIPIO', 'NUM3', 'NUM4', 'NR_CANDIDATO', 'NUM6',
    'NM_CANDIDATO', 'NM_URNA_CANDIDATO', 'DS_CARGO', 'NUM7', 'UNIND', 'NUM8',
    'DS_DETALHE_SITUACAO_CAND', 'NUM10', 'DS_SIT_TOT_TURNO', 'NR_PARTIDO', 'SG_PARTIDO',
    'NM_PARTIDO', 'NUM11', 'NM_COLIGACAO', 'DS_COMPOSICAO_COLIGACAO',
    'QT_VOTOS_NOMINAIS'
]

## 1989 - Federal

In [3]:
df_1989 = pd.read_csv('dados_nominal/VOTACAO_CANDIDATO_UF_1989.txt',
                      sep=';',
                      encoding='ISO-8859-1',
                      header=None,
                      names=colunasFederal1)

## 1990 - Estadual e Municipal

In [4]:
datasets = [
    'VOTACAO_CANDIDATO_UF_1990_AL.txt', 'VOTACAO_CANDIDATO_UF_1990_AM.txt',
    'VOTACAO_CANDIDATO_UF_1990_AP.txt', 'VOTACAO_CANDIDATO_UF_1990_BA.txt',
    'VOTACAO_CANDIDATO_UF_1990_CE.txt', 'VOTACAO_CANDIDATO_UF_1990_DF.txt',
    'VOTACAO_CANDIDATO_UF_1990_ES.txt', 'VOTACAO_CANDIDATO_UF_1990_GO.txt',
    'VOTACAO_CANDIDATO_UF_1990_MA.txt', 'VOTACAO_CANDIDATO_UF_1990_MG.txt',
    'VOTACAO_CANDIDATO_UF_1990_MS.txt', 'VOTACAO_CANDIDATO_UF_1990_MT.txt',
    'VOTACAO_CANDIDATO_UF_1990_PA.txt', 'VOTACAO_CANDIDATO_UF_1990_PB.txt',
    'VOTACAO_CANDIDATO_UF_1990_PE.txt', 'VOTACAO_CANDIDATO_UF_1990_PI.txt',
    'VOTACAO_CANDIDATO_UF_1990_PR.txt', 'VOTACAO_CANDIDATO_UF_1990_RJ.txt',
    'VOTACAO_CANDIDATO_UF_1990_RN.txt', 'VOTACAO_CANDIDATO_UF_1990_RO.txt',
    'VOTACAO_CANDIDATO_UF_1990_RR.txt', 'VOTACAO_CANDIDATO_UF_1990_RS.txt',
    'VOTACAO_CANDIDATO_UF_1990_SC.txt', 'VOTACAO_CANDIDATO_UF_1990_SE.txt',
    'VOTACAO_CANDIDATO_UF_1990_SP.txt', 'VOTACAO_CANDIDATO_UF_1990_TO.txt'
]

df_1990 = pd.read_csv('dados_nominal/VOTACAO_CANDIDATO_UF_1990_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal1)
for data in datasets:
    df = pd.read_csv('dados_nominal/' + data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal1)
    df_1990 = pd.concat([df_1990, df])

## 1994 - Federal/Estadual

In [5]:
datasets = [
    'votacao_candidato_munzona_1994_AL.txt',
    'votacao_candidato_munzona_1994_AM.txt',
    'votacao_candidato_munzona_1994_AP.txt',
    'votacao_candidato_munzona_1994_BA.txt',
    'votacao_candidato_munzona_1994_BR.txt',
    'votacao_candidato_munzona_1994_GO.txt',
    'votacao_candidato_munzona_1994_MA.txt',
    'votacao_candidato_munzona_1994_MS.txt',
    'votacao_candidato_munzona_1994_PI.txt',
    'votacao_candidato_munzona_1994_RR.txt',
    'votacao_candidato_munzona_1994_RS.txt',
    'votacao_candidato_munzona_1994_SC.txt',
    'votacao_candidato_munzona_1994_SE.txt',
    'votacao_candidato_munzona_1994_SP.txt',
    'votacao_candidato_munzona_1994_TO.txt'
]

df_1994 = pd.read_csv('dados_nominal/votacao_candidato_munzona_1994_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_1994 = pd.concat([df_1994, df])

## 1996 - Municipal

In [6]:
datasets = [
    'votacao_candidato_munzona_1996_AL.txt',
    'votacao_candidato_munzona_1996_AM.txt',
    'votacao_candidato_munzona_1996_AP.txt',
    'votacao_candidato_munzona_1996_BA.txt',
    'votacao_candidato_munzona_1996_CE.txt',
    'votacao_candidato_munzona_1996_ES.txt',
    'votacao_candidato_munzona_1996_GO.txt',
    'votacao_candidato_munzona_1996_MA.txt',
    'votacao_candidato_munzona_1996_MG.txt',
    'votacao_candidato_munzona_1996_MS.txt',
    'votacao_candidato_munzona_1996_PA.txt',
    'votacao_candidato_munzona_1996_PB.txt',
    'votacao_candidato_munzona_1996_PE.txt',
    'votacao_candidato_munzona_1996_PI.txt',
    'votacao_candidato_munzona_1996_RN.txt',
    'votacao_candidato_munzona_1996_RO.txt',
    'votacao_candidato_munzona_1996_RR.txt',
    'votacao_candidato_munzona_1996_RS.txt',
    'votacao_candidato_munzona_1996_SE.txt',
    'votacao_candidato_munzona_1996_SP.txt',
    'votacao_candidato_munzona_1996_TO.txt'
]

df_1996 = pd.read_csv('dados_nominal/votacao_candidato_munzona_1996_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_1996 = pd.concat([df_1996, df])

## 1998 - Federal/Estadual

In [7]:
datasets = [
    'votacao_candidato_munzona_1998_AL.txt',
    'votacao_candidato_munzona_1998_AM.txt',
    'votacao_candidato_munzona_1998_AP.txt',
    'votacao_candidato_munzona_1998_BA.txt',
    'votacao_candidato_munzona_1998_BR.txt',
    'votacao_candidato_munzona_1998_CE.txt',
    'votacao_candidato_munzona_1998_DF.txt',
    'votacao_candidato_munzona_1998_ES.txt',
    'votacao_candidato_munzona_1998_GO.txt',
    'votacao_candidato_munzona_1998_MA.txt',
    'votacao_candidato_munzona_1998_MG.txt',
    'votacao_candidato_munzona_1998_MS.txt',
    'votacao_candidato_munzona_1998_MT.txt',
    'votacao_candidato_munzona_1998_PA.txt',
    'votacao_candidato_munzona_1998_PB.txt',
    'votacao_candidato_munzona_1998_PE.txt',
    'votacao_candidato_munzona_1998_PI.txt',
    'votacao_candidato_munzona_1998_PR.txt',
    'votacao_candidato_munzona_1998_RJ.txt',
    'votacao_candidato_munzona_1998_RN.txt',
    'votacao_candidato_munzona_1998_RO.txt',
    'votacao_candidato_munzona_1998_RR.txt',
    'votacao_candidato_munzona_1998_RS.txt',
    'votacao_candidato_munzona_1998_SC.txt',
    'votacao_candidato_munzona_1998_SE.txt',
    'votacao_candidato_munzona_1998_SP.txt',
    'votacao_candidato_munzona_1998_TO.txt',
    'votacao_candidato_munzona_1998_ZZ.txt'
]

df_1998 = pd.read_csv('dados_nominal/votacao_candidato_munzona_1998_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_1998 = pd.concat([df_1998, df])

  has_raised = await self.run_ast_nodes(code_ast.body, cell_name,


## 2000 - Municipal

In [8]:
datasets = [
    'votacao_candidato_munzona_2000_AL.txt',
    'votacao_candidato_munzona_2000_AM.txt',
    'votacao_candidato_munzona_2000_AP.txt',
    'votacao_candidato_munzona_2000_BA.txt',
    'votacao_candidato_munzona_2000_CE.txt',
    'votacao_candidato_munzona_2000_ES.txt',
    'votacao_candidato_munzona_2000_GO.txt',
    'votacao_candidato_munzona_2000_MA.txt',
    'votacao_candidato_munzona_2000_MG.txt',
    'votacao_candidato_munzona_2000_MS.txt',
    'votacao_candidato_munzona_2000_MT.txt',
    'votacao_candidato_munzona_2000_PA.txt',
    'votacao_candidato_munzona_2000_PB.txt',
    'votacao_candidato_munzona_2000_PE.txt',
    'votacao_candidato_munzona_2000_PI.txt',
    'votacao_candidato_munzona_2000_PR.txt',
    'votacao_candidato_munzona_2000_RJ.txt',
    'votacao_candidato_munzona_2000_RN.txt',
    'votacao_candidato_munzona_2000_RO.txt',
    'votacao_candidato_munzona_2000_RR.txt',
    'votacao_candidato_munzona_2000_RS.txt',
    'votacao_candidato_munzona_2000_SC.txt',
    'votacao_candidato_munzona_2000_SE.txt',
    'votacao_candidato_munzona_2000_SP.txt',
    'votacao_candidato_munzona_2000_TO.txt'
]

df_2000 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2000_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2000 = pd.concat([df_2000, df])

  has_raised = await self.run_ast_nodes(code_ast.body, cell_name,


## 2002 - Federal/Estadual

In [9]:
datasets = [
    'votacao_candidato_munzona_2002_AL.txt',
    'votacao_candidato_munzona_2002_AM.txt',
    'votacao_candidato_munzona_2002_AP.txt',
    'votacao_candidato_munzona_2002_BA.txt',
    'votacao_candidato_munzona_2002_BR.txt',
    'votacao_candidato_munzona_2002_CE.txt',
    'votacao_candidato_munzona_2002_DF.txt',
    'votacao_candidato_munzona_2002_ES.txt',
    'votacao_candidato_munzona_2002_GO.txt',
    'votacao_candidato_munzona_2002_MA.txt',
    'votacao_candidato_munzona_2002_MG.txt',
    'votacao_candidato_munzona_2002_MS.txt',
    'votacao_candidato_munzona_2002_MT.txt',
    'votacao_candidato_munzona_2002_PA.txt',
    'votacao_candidato_munzona_2002_PB.txt',
    'votacao_candidato_munzona_2002_PE.txt',
    'votacao_candidato_munzona_2002_PI.txt',
    'votacao_candidato_munzona_2002_PR.txt',
    'votacao_candidato_munzona_2002_RJ.txt',
    'votacao_candidato_munzona_2002_RN.txt',
    'votacao_candidato_munzona_2002_RO.txt',
    'votacao_candidato_munzona_2002_RR.txt',
    'votacao_candidato_munzona_2002_RS.txt',
    'votacao_candidato_munzona_2002_SC.txt',
    'votacao_candidato_munzona_2002_SE.txt',
    'votacao_candidato_munzona_2002_SP.txt',
    'votacao_candidato_munzona_2002_TO.txt',
    'votacao_candidato_munzona_2002_ZZ.txt'
]

df_2002 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2002_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2002 = pd.concat([df_2002, df])

## 2004 - Municipal

In [10]:
datasets = [
    'votacao_candidato_munzona_2004_AL.txt',
    'votacao_candidato_munzona_2004_AM.txt',
    'votacao_candidato_munzona_2004_AP.txt',
    'votacao_candidato_munzona_2004_BA.txt',
    'votacao_candidato_munzona_2004_CE.txt',
    'votacao_candidato_munzona_2004_ES.txt',
    'votacao_candidato_munzona_2004_GO.txt',
    'votacao_candidato_munzona_2004_MA.txt',
    'votacao_candidato_munzona_2004_MG.txt',
    'votacao_candidato_munzona_2004_MS.txt',
    'votacao_candidato_munzona_2004_MT.txt',
    'votacao_candidato_munzona_2004_PA.txt',
    'votacao_candidato_munzona_2004_PB.txt',
    'votacao_candidato_munzona_2004_PE.txt',
    'votacao_candidato_munzona_2004_PI.txt',
    'votacao_candidato_munzona_2004_PR.txt',
    'votacao_candidato_munzona_2004_RJ.txt',
    'votacao_candidato_munzona_2004_RN.txt',
    'votacao_candidato_munzona_2004_RO.txt',
    'votacao_candidato_munzona_2004_RR.txt',
    'votacao_candidato_munzona_2004_RS.txt',
    'votacao_candidato_munzona_2004_SC.txt',
    'votacao_candidato_munzona_2004_SE.txt',
    'votacao_candidato_munzona_2004_SP.txt',
    'votacao_candidato_munzona_2004_TO.txt'
]

df_2004 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2004_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2004 = pd.concat([df_2004, df])

## 2006 - Estadual/Federal

In [11]:
datasets = [
    'votacao_candidato_munzona_2006_AL.txt',
    'votacao_candidato_munzona_2006_AM.txt',
    'votacao_candidato_munzona_2006_AP.txt',
    'votacao_candidato_munzona_2006_BA.txt',
    'votacao_candidato_munzona_2006_BR.txt',
    'votacao_candidato_munzona_2006_CE.txt',
    'votacao_candidato_munzona_2006_DF.txt',
    'votacao_candidato_munzona_2006_ES.txt',
    'votacao_candidato_munzona_2006_GO.txt',
    'votacao_candidato_munzona_2006_MA.txt',
    'votacao_candidato_munzona_2006_MG.txt',
    'votacao_candidato_munzona_2006_MS.txt',
    'votacao_candidato_munzona_2006_MT.txt',
    'votacao_candidato_munzona_2006_PA.txt',
    'votacao_candidato_munzona_2006_PB.txt',
    'votacao_candidato_munzona_2006_PE.txt',
    'votacao_candidato_munzona_2006_PI.txt',
    'votacao_candidato_munzona_2006_PR.txt',
    'votacao_candidato_munzona_2006_RJ.txt',
    'votacao_candidato_munzona_2006_RN.txt',
    'votacao_candidato_munzona_2006_RO.txt',
    'votacao_candidato_munzona_2006_RR.txt',
    'votacao_candidato_munzona_2006_RS.txt',
    'votacao_candidato_munzona_2006_SC.txt',
    'votacao_candidato_munzona_2006_SE.txt',
    'votacao_candidato_munzona_2006_SP.txt',
    'votacao_candidato_munzona_2006_TO.txt',
    'votacao_candidato_munzona_2006_ZZ.txt'
]
df_2006 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2006_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2006 = pd.concat([df_2006, df])

## 2008 - Municipal

In [12]:
datasets = [
    'votacao_candidato_munzona_2008_AL.txt',
    'votacao_candidato_munzona_2008_AM.txt',
    'votacao_candidato_munzona_2008_AP.txt',
    'votacao_candidato_munzona_2008_BA.txt',
    'votacao_candidato_munzona_2008_CE.txt',
    'votacao_candidato_munzona_2008_ES.txt',
    'votacao_candidato_munzona_2008_GO.txt',
    'votacao_candidato_munzona_2008_MA.txt',
    'votacao_candidato_munzona_2008_MG.txt',
    'votacao_candidato_munzona_2008_MS.txt',
    'votacao_candidato_munzona_2008_MT.txt',
    'votacao_candidato_munzona_2008_PA.txt',
    'votacao_candidato_munzona_2008_PB.txt',
    'votacao_candidato_munzona_2008_PE.txt',
    'votacao_candidato_munzona_2008_PI.txt',
    'votacao_candidato_munzona_2008_PR.txt',
    'votacao_candidato_munzona_2008_RJ.txt',
    'votacao_candidato_munzona_2008_RN.txt',
    'votacao_candidato_munzona_2008_RO.txt',
    'votacao_candidato_munzona_2008_RR.txt',
    'votacao_candidato_munzona_2008_RS.txt',
    'votacao_candidato_munzona_2008_SC.txt',
    'votacao_candidato_munzona_2008_SE.txt',
    'votacao_candidato_munzona_2008_SP.txt',
    'votacao_candidato_munzona_2008_TO.txt'
]

df_2008 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2008_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2008 = pd.concat([df_2008, df])

## 2010 - Federal/Estadual

In [13]:
datasets = [
    'votacao_candidato_munzona_2010_AL.txt',
    'votacao_candidato_munzona_2010_AM.txt',
    'votacao_candidato_munzona_2010_AP.txt',
    'votacao_candidato_munzona_2010_BA.txt',
    'votacao_candidato_munzona_2010_BR.txt',
    'votacao_candidato_munzona_2010_CE.txt',
    'votacao_candidato_munzona_2010_DF.txt',
    'votacao_candidato_munzona_2010_ES.txt',
    'votacao_candidato_munzona_2010_GO.txt',
    'votacao_candidato_munzona_2010_MA.txt',
    'votacao_candidato_munzona_2010_MG.txt',
    'votacao_candidato_munzona_2010_MS.txt',
    'votacao_candidato_munzona_2010_MT.txt',
    'votacao_candidato_munzona_2010_PA.txt',
    'votacao_candidato_munzona_2010_PB.txt',
    'votacao_candidato_munzona_2010_PE.txt',
    'votacao_candidato_munzona_2010_PI.txt',
    'votacao_candidato_munzona_2010_PR.txt',
    'votacao_candidato_munzona_2010_RJ.txt',
    'votacao_candidato_munzona_2010_RN.txt',
    'votacao_candidato_munzona_2010_RO.txt',
    'votacao_candidato_munzona_2010_RR.txt',
    'votacao_candidato_munzona_2010_RS.txt',
    'votacao_candidato_munzona_2010_SC.txt',
    'votacao_candidato_munzona_2010_SE.txt',
    'votacao_candidato_munzona_2010_SP.txt',
    'votacao_candidato_munzona_2010_TO.txt',
    'votacao_candidato_munzona_2010_VT.txt',
    'votacao_candidato_munzona_2010_ZZ.txt'
]

df_2010 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2010_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2010 = pd.concat([df_2010, df])

## 2012 - Municipal

In [14]:
datasets = [
    'votacao_candidato_munzona_2012_AL.txt',
    'votacao_candidato_munzona_2012_AM.txt',
    'votacao_candidato_munzona_2012_AP.txt',
    'votacao_candidato_munzona_2012_BA.txt',
    'votacao_candidato_munzona_2012_CE.txt',
    'votacao_candidato_munzona_2012_ES.txt',
    'votacao_candidato_munzona_2012_GO.txt',
    'votacao_candidato_munzona_2012_MA.txt',
    'votacao_candidato_munzona_2012_MG.txt',
    'votacao_candidato_munzona_2012_MS.txt',
    'votacao_candidato_munzona_2012_MT.txt',
    'votacao_candidato_munzona_2012_PA.txt',
    'votacao_candidato_munzona_2012_PB.txt',
    'votacao_candidato_munzona_2012_PE.txt',
    'votacao_candidato_munzona_2012_PI.txt',
    'votacao_candidato_munzona_2012_PR.txt',
    'votacao_candidato_munzona_2012_RJ.txt',
    'votacao_candidato_munzona_2012_RN.txt',
    'votacao_candidato_munzona_2012_RO.txt',
    'votacao_candidato_munzona_2012_RR.txt',
    'votacao_candidato_munzona_2012_RS.txt',
    'votacao_candidato_munzona_2012_SC.txt',
    'votacao_candidato_munzona_2012_SE.txt',
    'votacao_candidato_munzona_2012_SP.txt',
    'votacao_candidato_munzona_2012_TO.txt'
]

df_2012 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2012_AC.txt',
                      error_bad_lines=False,
                      header=None,
                      sep=';',
                      encoding="ISO-8859-1",
                      names=colunasFederal2)
for data in datasets:
    df = pd.read_csv('dados_nominal/'+data,
                     error_bad_lines=False,
                     header=None,
                     sep=';',
                     encoding="ISO-8859-1",
                     names=colunasFederal2)
    df_2012 = pd.concat([df_2012, df])

## 2014 - Federal/Estadual

In [15]:
df_2014 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2014_BRASIL.csv',
                      error_bad_lines=False,
                      sep=';',
                      encoding="ISO-8859-1")

## 2016 - Municipal

In [16]:
df_2016 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2016_BRASIL.csv',
                      error_bad_lines=False,
                      sep=';',
                      encoding="ISO-8859-1")

## 2018 - Federal/Estadual

In [17]:
df_2018 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2018_BRASIL.csv',
                      error_bad_lines=False,
                      sep=';',
                      encoding="ISO-8859-1")

## 2020 - Municipal

In [18]:
df_2020 = pd.read_csv('dados_nominal/votacao_candidato_munzona_2020_BRASIL.csv',
                      error_bad_lines=False,
                      sep=';',
                      encoding="ISO-8859-1")

# Tratamento dos dados

In [19]:
def transform(df):
    features = ['NM_CANDIDATO', 'SG_PARTIDO', 'DS_CARGO', 'DS_SIT_TOT_TURNO', 'SG_UF']
    df1 = df[features]
    cond1 = (df1['DS_SIT_TOT_TURNO'] == 'ELEITO')
    cond2 = (df1['DS_SIT_TOT_TURNO'] == 'ELEITO POR QP')
    cond3 = (df1['DS_SIT_TOT_TURNO'] == 'ELEITO POR MÉDIA')
    cond4 = (df1['DS_SIT_TOT_TURNO'] == 'MÉDIA')
    df1 = df1[cond1 | cond2 | cond3 | cond4]
    df1 = df1.groupby(['NM_CANDIDATO', 'DS_CARGO', 'SG_PARTIDO', 'SG_UF', 'DS_SIT_TOT_TURNO']).sum()
    df1 = df1.reset_index(drop=False)
    df1.drop('DS_SIT_TOT_TURNO', axis=1, inplace=True)
    df1['Eleito'] = 1
    df1['DS_CARGO'] = df1['DS_CARGO'].str.upper()
    df1['ANO_ELEICAO'] = df['ANO_ELEICAO'].iloc[0]
    df2 = df1[df1['DS_CARGO'] == 'PRESIDENTE'].groupby(['NM_CANDIDATO', 'DS_CARGO', 'SG_PARTIDO', 'ANO_ELEICAO']).last().reset_index()
    df2['SG_UF'] = 'BR'
    df1 = df1[df1['DS_CARGO'] != 'PRESIDENTE']
    df1 = pd.concat([df1, df2])
    return df1

In [20]:
final = pd.concat([
    transform(df_2020),
    transform(df_2018),
    transform(df_2016),
    transform(df_2014),
    transform(df_2012),
    transform(df_2010),
    transform(df_2008),
    transform(df_2006),
    transform(df_2004),
    transform(df_2002),
    transform(df_2000),
    transform(df_1998),
    transform(df_1996),
    transform(df_1994),
    transform(df_1990),
    transform(df_1989)
],
                  ignore_index=True)
final

Unnamed: 0,NM_CANDIDATO,DS_CARGO,SG_PARTIDO,SG_UF,Eleito,ANO_ELEICAO
0,AAVA SANTIAGO AGUIAR,VEREADOR,PSDB,GO,1,2020.00
1,ABADIAS SOUZA DO NASCIMENTO DAMASCENO,VEREADOR,DEM,GO,1,2020.00
2,ABADIO RIBEIRO DA ROCHA,VEREADOR,PSD,MS,1,2020.00
3,ABDALA DA COSTA SOUSA FILHO,VEREADOR,PDT,MA,1,2020.00
4,ABDENOR TAHAN MALUF,VEREADOR,PL,SP,1,2020.00
...,...,...,...,...,...,...
383173,ÁLVARO MOREIRA ROMERO,DEPUTADO ESTADUAL,PDS,AC,1,1990.00
383174,ÁLVARO PINHEIRO DOS SANTOS,DEPUTADO ESTADUAL,PRN,BA,1,1990.00
383175,ÁTILA FREITAS LIRA,DEPUTADO FEDERAL,PFL,PI,1,1990.00
383176,ÂNGELO MARIO PEIXOTO DE MAGALHÃES,DEPUTADO FEDERAL,PFL,BA,1,1990.00


In [21]:
final['DS_CARGO'].value_counts()

VEREADOR                                                                                337382
PREFEITO                                                                                 33701
DEPUTADO ESTADUAL                                                                         7647
DEPUTADO FEDERAL                                                                          3760
SENADOR                                                                                    304
GOVERNADOR                                                                                 206
DEPUTADO DISTRITAL                                                                         168
PRESIDENTE                                                                                   8
VOCÊ É A FAVOR | DA CRIAÇÃO DO MUNICÍPIO DE | EXTREMA DE RONDÔNIA?                           1
VOCÊ É A FAVOR DA | ALTERAÇÃO DO NOME | DA CIDADE DE EMBU" | PARA "EMBU DAS ARTES"?"         1
Name: DS_CARGO, dtype: int64

In [22]:
final['DS_CARGO'].replace(
    'VOCÊ É A FAVOR DA | ALTERAÇÃO DO NOME | DA CIDADE DE EMBU" | PARA "EMBU DAS ARTES"?"',
    np.nan,
    inplace=True)
final['DS_CARGO'].replace(
    'VOCÊ É A FAVOR | DA CRIAÇÃO DO MUNICÍPIO DE | EXTREMA DE RONDÔNIA?',
    np.nan,
    inplace=True)
final.dropna(inplace=True)
final.reset_index(drop=True, inplace=True)
final['ANO_ELEICAO'] = final['ANO_ELEICAO'].astype(int)

In [23]:
def padronizar_dados(df):
    # Partidos que mudaram de nome:
    # https://pt.wikipedia.org/wiki/Predefini%C3%A7%C3%A3o:Partidos_pol%C3%ADticos_no_Brasil_que_mudaram_de_nome_ap%C3%B3s_a_crise_pol%C3%ADtica_de_2014
    df['SG_PARTIDO'] = df['SG_PARTIDO'].str.upper()
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PR', 'PL')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PTN', 'PODE')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PT DO B', 'AVANTE')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PEN', 'PATRIOTA')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PMDB', 'MDB')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PSDC', 'DC')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PRB', 'REPUBLICANOS')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PPS', 'CIDADANIA')
    df['SG_PARTIDO'] = df['SG_PARTIDO'].replace('PFL', 'DEM')
    
#     df['DS_SIT_TOT_TURNO'] = df['DS_SIT_TOT_TURNO'].replace('RENÚNCIA/FALECIMENTO COM SUBSTITUIÇÃO', 'RENÚNCIA/FALECIMENTO/CASSAÇÃO ANTES DA ELEIÇÃO')
#     df['DS_SIT_TOT_TURNO'] = df['DS_SIT_TOT_TURNO'].replace('2.O TURNO', '2º TURNO')
#     df['DS_SIT_TOT_TURNO'] = df['DS_SIT_TOT_TURNO'].replace('2O. TURNO', '2º TURNO')
#     df['DS_SIT_TOT_TURNO'] = df['DS_SIT_TOT_TURNO'].replace('NAO ELEITO', 'NÃO ELEITO')
#     df['DS_SIT_TOT_TURNO'] = df['DS_SIT_TOT_TURNO'].replace('ELEITO POR QUOCIENTE PARTIDÁRIO', 'ELEITO POR QP')
#     df['DS_SIT_TOT_TURNO'] = df['DS_SIT_TOT_TURNO'].replace('MEDIA', 'MÉDIA')

padronizar_dados(final)

In [24]:
final

Unnamed: 0,NM_CANDIDATO,DS_CARGO,SG_PARTIDO,SG_UF,Eleito,ANO_ELEICAO
0,AAVA SANTIAGO AGUIAR,VEREADOR,PSDB,GO,1,2020
1,ABADIAS SOUZA DO NASCIMENTO DAMASCENO,VEREADOR,DEM,GO,1,2020
2,ABADIO RIBEIRO DA ROCHA,VEREADOR,PSD,MS,1,2020
3,ABDALA DA COSTA SOUSA FILHO,VEREADOR,PDT,MA,1,2020
4,ABDENOR TAHAN MALUF,VEREADOR,PL,SP,1,2020
...,...,...,...,...,...,...
383171,ÁLVARO MOREIRA ROMERO,DEPUTADO ESTADUAL,PDS,AC,1,1990
383172,ÁLVARO PINHEIRO DOS SANTOS,DEPUTADO ESTADUAL,PRN,BA,1,1990
383173,ÁTILA FREITAS LIRA,DEPUTADO FEDERAL,DEM,PI,1,1990
383174,ÂNGELO MARIO PEIXOTO DE MAGALHÃES,DEPUTADO FEDERAL,DEM,BA,1,1990


In [25]:
final.to_csv('exports/eleitos.csv', sep=';', decimal=',')