# Análise de Dados Eleitorais 

Victor dos Santos Salles e Ana Clara Marques Portes/ 2DSM

ATENÇÃO: na primeira tela de instalação do Python, habilite a opção PATH, note que **não** é o padrão.

Instalar o Python 3.6 ou superior (sugerimos não usar Anaconda) <br>
https://python.org.br/instalacao-windows/ <br>
https://python.org.br/instalacao-linux/ <br>
https://python.org.br/instalacao-mac/ <br>

Após instalar o Python, abra o terminal (Linha de Comando) e instale as bibliotecas necessárias:<br>
<br>
**pip install pandas matplotlib jupyter numpy**

Arquivo necessário:<br> 
https://cdn.tse.jus.br/estatistica/sead/eleicoes/eleicoes2022/buweb/bweb_1t_SP_051020221321.zip<br>
<br>
**Descompactar em c:\users\seunome**<br>
<br>

# Análise dos boletins de urna do 1o turno
<br>
<br>

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

In [4]:
estado = pd.read_csv("bweb_1t_SP_051020221321.csv", 
                 usecols = '''NR_ZONA NR_SECAO NM_MUNICIPIO QT_COMPARECIMENTO QT_APTOS QT_COMPARECIMENTO 
                 QT_ABSTENCOES NR_VOTAVEL NM_VOTAVEL QT_VOTOS DS_CARGO_PERGUNTA'''.split(),
                 sep=";", on_bad_lines = 'skip', encoding='Latin 1')
municipio = estado.query('NM_MUNICIPIO == "SÃO PAULO" and DS_CARGO_PERGUNTA == "Presidente"')
municipio = municipio.drop(columns = 'NM_MUNICIPIO DS_CARGO_PERGUNTA'.split())
municipio.sample(20)
print(estado)

             NM_MUNICIPIO  NR_ZONA  NR_SECAO  DS_CARGO_PERGUNTA  QT_APTOS  \
0               SÃO PAULO        1         1         Presidente       370   
1               SÃO PAULO        1         1         Presidente       370   
2               SÃO PAULO        1         1         Presidente       370   
3               SÃO PAULO        1         1         Presidente       370   
4               SÃO PAULO        1         1         Presidente       370   
...                   ...      ...       ...                ...       ...   
19167368  SANTA ALBERTINA      427        75  Deputado Estadual       289   
19167369  SANTA ALBERTINA      427        75  Deputado Estadual       289   
19167370  SANTA ALBERTINA      427        75  Deputado Estadual       289   
19167371  SANTA ALBERTINA      427        75  Deputado Estadual       289   
19167372  SANTA ALBERTINA      427        75  Deputado Estadual       289   

          QT_COMPARECIMENTO  QT_ABSTENCOES  NR_VOTAVEL        NM_VOTAVEL  \

In [5]:
resultado = municipio.groupby('NM_VOTAVEL')['QT_VOTOS'].sum().sort_values(ascending=False)
print(resultado)

NM_VOTAVEL
LULA                   3276512
JAIR BOLSONARO         2618593
SIMONE TEBET            558748
CIRO GOMES              297973
Nulo                    294142
Branco                  152752
FELIPE D'AVILA           67714
SORAYA THRONICKE         51000
LÉO PÉRICLES              8443
SOFIA MANZANO             5009
PADRE KELMON              4281
VERA                      2676
CONSTITUINTE EYMAEL       1689
Name: QT_VOTOS, dtype: int64


In [6]:
votacao = {}
for zona in municipio.NR_ZONA.unique():
    result = municipio.query('NR_ZONA == @zona').groupby('NM_VOTAVEL')['QT_VOTOS'].sum()
    total = sum(result)
    votacao[zona] = {'Jair Bolsonaro': round(result["JAIR BOLSONARO"] / total * 100, 1),
                     'Lula': round(result["LULA"] / total * 100, 1), 
                     'Simone Tebet': round(result['SIMONE TEBET'] / total * 100, 1),
                     'Nulos':round(result['Nulo'] / total * 100, 1), 
                     'Brancos':round(result['Branco'] / total * 100, 1)
                    }
votacao = pd.DataFrame(votacao).transpose()
votacao

Unnamed: 0,Jair Bolsonaro,Lula,Simone Tebet,Nulos,Brancos
1,28.5,54.3,7.8,2.5,1.4
2,34.2,44.9,11.5,2.1,1.1
3,37.5,46.1,5.7,3.3,1.8
4,46.4,33.0,9.1,3.3,1.6
5,40.9,34.9,15.2,1.6,0.9
6,37.4,39.8,12.2,2.4,1.3
20,26.1,57.0,5.1,4.0,2.4
246,43.0,32.3,12.9,2.7,1.3
247,36.3,44.9,6.0,4.6,2.6
248,35.1,45.3,6.0,5.1,2.6


In [8]:
print(votacao['Jair Bolsonaro'].sort_values(ascending=False))

249    46.5
4      46.4
253    46.2
348    46.2
258    44.7
254    44.6
257    43.8
420    43.2
246    43.0
252    42.2
256    41.6
250    41.2
347    40.9
5      40.9
325    40.6
349    40.0
350    40.0
255    39.8
422    39.6
327    39.3
390    39.1
346    38.8
259    38.4
392    37.8
260    37.6
3      37.5
6      37.4
326    36.8
413    36.7
247    36.3
398    36.0
417    35.9
248    35.1
280    34.8
2      34.2
403    34.2
397    33.8
320    33.8
352    33.6
421    33.6
374    32.8
351    32.8
376    32.5
375    32.2
251    31.9
405    31.4
389    31.4
418    31.1
353    31.0
328    30.8
408    30.0
1      28.5
373    28.4
404    26.8
381    26.5
20     26.1
371    25.5
372    25.1
Name: Jair Bolsonaro, dtype: float64


In [9]:
print(votacao['Lula'].sort_values(ascending=False))

372    57.9
371    57.6
20     57.0
404    56.4
381    56.0
1      54.3
373    53.4
353    51.5
408    51.4
389    51.3
328    50.5
375    50.4
418    49.4
376    49.3
421    48.9
397    48.8
405    48.6
352    48.5
374    47.5
351    47.4
403    46.9
3      46.1
398    45.6
251    45.6
248    45.3
326    45.3
280    45.0
320    45.0
2      44.9
247    44.9
417    44.0
260    42.9
413    42.3
392    41.8
390    41.1
350    40.7
327    40.3
349    40.3
422    40.1
6      39.8
255    39.3
346    39.2
256    38.6
347    38.3
325    38.2
420    37.0
254    36.6
252    36.6
250    36.4
259    35.8
257    35.2
5      34.9
4      33.0
348    32.7
246    32.3
253    32.2
249    31.9
258    30.4
Name: Lula, dtype: float64
