# Tratamento da base de dados para criação do Dashboard sobre a votação de São Paulo nas Eleições 2022 em primeiro turno

O TSE disponibiliza a votação presidencial para cada município/zona/seção em uma base de dados, então precisamos isolar nesta base de dados apenas os dados referentes aos municípios do Estado de São Paulo.
Para tanto, usaremos a base de dados do TSE para a votação dos demais cargos, identificando todos os municípios do estado e filtrando na base de votos presidenciais nacional.
ao final teremos duas bases que nos permitirão construir o Dashboard, uma com os votos para o cargo de presidente e outra com os votos para os demais cargos, identificadas para cada município/zona/seção do estado de São Paulo.

Fonte:https://dadosabertos.tse.jus.br/dataset/resultados-2022

link para dowload das bases de dados:    
https://cdn.tse.jus.br/estatistica/sead/odsele/votacao_secao/votacao_secao_2022_BR.zip
https://cdn.tse.jus.br/estatistica/sead/odsele/votacao_secao/votacao_secao_2022_SP.zip


In [54]:
import pandas as pd

Importado a base de dados de votação disponibilizada pelo TSE, por cada zona/seção/município , para o cargo de Presidente da República.      
(Selecionando apenas as colunas que interessam)

In [8]:
colunas=['NR_TURNO','DT_ELEICAO','NM_MUNICIPIO','NR_ZONA','NR_SECAO','DS_CARGO','NR_VOTAVEL', 'NM_VOTAVEL', 'QT_VOTOS', 'NR_LOCAL_VOTACAO']
df_base=pd.read_csv('votacao_secao_2022_BR.csv', encoding='cp1252', sep=';',usecols=colunas)

In [7]:
df_base.head()

Unnamed: 0,NR_TURNO,DT_ELEICAO,NM_MUNICIPIO,NR_ZONA,NR_SECAO,DS_CARGO,NR_VOTAVEL,NM_VOTAVEL,QT_VOTOS,NR_LOCAL_VOTACAO
0,1,02/10/2022,EUNÁPOLIS,188,319,PRESIDENTE,15,SIMONE NASSAR TEBET,6,1694
1,1,02/10/2022,CHAPADINHA,42,169,PRESIDENTE,15,SIMONE NASSAR TEBET,1,1864
2,1,02/10/2022,SANTO ANTÔNIO DA PLATINA,22,93,PRESIDENTE,15,SIMONE NASSAR TEBET,8,1074
3,1,02/10/2022,CRISTALÂNDIA,13,71,PRESIDENTE,15,SIMONE NASSAR TEBET,9,1066
4,1,02/10/2022,CAMPOS DOS GOYTACAZES,129,101,PRESIDENTE,15,SIMONE NASSAR TEBET,20,1236


In [9]:
df_base.to_csv('Votação Presidencial por município.csv',index=False)

Importado a base de dados de votação disponibilizada pelo TSE, por cada zona/seção/município, apenas no estado de São Paulo, para os cargos de Dep.Estadual,Dep.Federal,Senador e Governador.     
(Selecionando apenas as colunas que interessam)

In [14]:
colunas=['NR_TURNO','DT_ELEICAO','NM_MUNICIPIO','NR_ZONA','NR_SECAO','DS_CARGO','NR_VOTAVEL','NM_VOTAVEL','QT_VOTOS','NR_LOCAL_VOTACAO' ]
df_base_SP=pd.read_csv('votacao_secao_2022_SP.csv', encoding='cp1252', sep=';', usecols=colunas)

In [13]:
df_base_SP.head()

Unnamed: 0,NR_TURNO,DT_ELEICAO,NM_MUNICIPIO,NR_ZONA,NR_SECAO,DS_CARGO,NR_VOTAVEL,NM_VOTAVEL,QT_VOTOS,NR_LOCAL_VOTACAO
0,1,02/10/2022,LIMEIRA,66,225,GOVERNADOR,80,CAROLINA REJAILI VIGLIAR,1,1023
1,1,02/10/2022,SUZANO,181,368,GOVERNADOR,80,CAROLINA REJAILI VIGLIAR,1,1619
2,1,02/10/2022,SÃO PAULO,349,20,GOVERNADOR,80,CAROLINA REJAILI VIGLIAR,1,1023
3,1,02/10/2022,RANCHARIA,106,51,GOVERNADOR,80,CAROLINA REJAILI VIGLIAR,1,1040
4,1,02/10/2022,DIADEMA,222,441,GOVERNADOR,80,CAROLINA REJAILI VIGLIAR,2,1392


In [15]:
df_base_SP.to_csv('Votação Estadual_SP por município.csv',index=False)

# Criando uma lista com todos os municípios de São Paulo

In [43]:
df_municipios_SP=df_base_SP.NM_MUNICIPIO.unique()

In [45]:
df_municipios_SP

array(['LIMEIRA', 'SUZANO', 'SÃO PAULO', 'RANCHARIA', 'DIADEMA',
       'JUNDIAÍ', 'JAÚ', 'PIRASSUNUNGA', 'SANTANA DE PARNAÍBA',
       'MOGI MIRIM', 'RIO CLARO', 'SÃO JOSÉ DOS CAMPOS', 'OSASCO',
       'CUNHA', 'SÃO MANUEL', 'SÃO VICENTE', 'CAMPINAS', 'MIRASSOL',
       'MARÍLIA', 'FRANCA', 'FRANCISCO MORATO', 'ATIBAIA', 'MAUÁ',
       'PRAIA GRANDE', 'SÃO BERNARDO DO CAMPO', 'DRACENA', 'CAIEIRAS',
       'MOCOCA', 'SOROCABA', 'SÃO JOÃO DA BOA VISTA', 'BARRA BONITA',
       'CARAGUATATUBA', 'MOGI DAS CRUZES', 'INDAIATUBA', 'SANTO ANDRÉ',
       'HORTOLÂNDIA', 'MONTE AZUL PAULISTA', 'VARGEM GRANDE PAULISTA',
       'BARUERI', 'ITAPECERICA DA SERRA', 'FRANCO DA ROCHA', 'SUMARÉ',
       'BAURU', 'SALTO', 'CAJAMAR', 'GUARULHOS', 'PRESIDENTE PRUDENTE',
       'PIRACICABA', 'CAMPO LIMPO PAULISTA', 'MATÃO', 'SÃO ROQUE',
       'VERA CRUZ', 'IGARAÇU DO TIETÊ', 'ITATIBA', 'SÃO CAETANO DO SUL',
       'MONTE MOR', 'ARARAQUARA', 'RIBEIRÃO PRETO', 'SÃO CARLOS',
       'SÃO JOSÉ DO RIO PRETO', 'SA

# Filtrando a votação presidencial apenas para os municípios de São Paulo

In [48]:
df_presidencial_SP_municipios=df_base[df_base['NM_MUNICIPIO'].isin(df_municipios_SP)]

In [51]:
df_presidencial_SP_municipios.tail(15)

Unnamed: 0,NR_TURNO,DT_ELEICAO,NM_MUNICIPIO,NR_ZONA,NR_SECAO,DS_CARGO,NR_VOTAVEL,NM_VOTAVEL,QT_VOTOS,NR_LOCAL_VOTACAO
3529734,1,02/10/2022,IARAS,205,20,PRESIDENTE,95,VOTO BRANCO,6,1023
3529736,1,02/10/2022,OSASCO,277,29,PRESIDENTE,95,VOTO BRANCO,6,1031
3529743,1,02/10/2022,LINS,67,84,PRESIDENTE,95,VOTO BRANCO,5,1120
3529759,1,02/10/2022,SÃO PAULO,254,472,PRESIDENTE,95,VOTO BRANCO,11,1511
3529764,1,02/10/2022,SALTO,221,60,PRESIDENTE,95,VOTO BRANCO,12,1120
3529770,1,02/10/2022,SANTA RITA DO PASSA QUATRO,116,47,PRESIDENTE,95,VOTO BRANCO,5,1066
3529771,1,02/10/2022,SÃO PAULO,375,419,PRESIDENTE,95,VOTO BRANCO,7,1783
3529773,1,02/10/2022,SÃO PAULO,326,396,PRESIDENTE,95,VOTO BRANCO,9,1295
3529777,1,02/10/2022,ITAPIRA,54,151,PRESIDENTE,95,VOTO BRANCO,5,1201
3529778,1,02/10/2022,ARARAS,14,36,PRESIDENTE,95,VOTO BRANCO,2,1040


In [52]:
df_presidencial_SP_municipios.to_csv('Presidencial_SP_municipios.csv', index=False)

As bases de dados a serem útilizadas são: 'Presidencial_SP_municipios.csv', 'Votação Estadual_SP por município.csv'. 