# Análise de Dados Eleitorais de Parnamirim no 1o turno


### Conhecendo as bibliotecas do projeto

Para esse projeto será necessária a instalação das bibliotecas:
- pandas ([leia a documentação](https://pandas.pydata.org/docs/))
- matplotlib ([leia a documentação](https://matplotlib.org/stable/index.html))
- numpy ([leia a documentação](https://numpy.org/doc/stable/))

**ATENÇÃO**: Para entender melhor sobre os dados expressos na base de dados utilizada para a primeira parte, realize a leitura do arquivo .pdf intitulado, [leia-me](leiame.pdf). E para os dados utilizados na segunda parte, realize a leitura do arquivo .pdf intitulado, [leiame_boletim](leiame_boletim.pdf).

Para realizar a instalação das mesmas utilize o comando abaixo:

```pip install pandas matplotlib jupyter numpy```


### Instalando as bibliotecas que serão usadas

In [1]:
!pip install pandas matplotlib jupyter numpy




[notice] A new release of pip available: 22.2.2 -> 22.3
[notice] To update, run: python.exe -m pip install --upgrade pip




## Parte 2: Análise dos boletins de urna do 1° turno

In [226]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

In [227]:
# Importando e visualizando todos os campos disponíveis para análise

estado_RN = pd.read_csv("boletim_urna_RN.csv", encoding='Latin 1',sep=";" )
estado_RN.sample(10)

Unnamed: 0,DT_GERACAO,HH_GERACAO,ANO_ELEICAO,CD_TIPO_ELEICAO,NM_TIPO_ELEICAO,CD_PLEITO,DT_PLEITO,NR_TURNO,CD_ELEICAO,DS_ELEICAO,...,CD_FLASHCARD_URNA_EFETIVADA,DT_CARGA_URNA_EFETIVADA,DS_CARGO_PERGUNTA_SECAO,DS_AGREGADAS,DT_ABERTURA,DT_ENCERRAMENTO,QT_ELEITORES_BIOMETRIA_NH,DT_EMISSAO_BU,NR_JUNTA_APURADORA,NR_TURMA_APURADORA
527180,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,3E1A76B4,21/09/2022 10:49:00,7 - 20,#NULO#,02/10/2022 08:00:01,02/10/2022 17:00:56,31,02/10/2022 17:03:05,-1,-1
314224,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,5E776FAA,27/09/2022 14:28:00,6 - 40,#NULO#,02/10/2022 08:00:01,02/10/2022 17:00:57,26,02/10/2022 17:02:59,-1,-1
546171,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,57F13D88,22/09/2022 09:18:00,7 - 213,#NULO#,02/10/2022 08:00:01,02/10/2022 17:28:09,67,02/10/2022 17:31:42,-1,-1
725639,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,5AE182DE,19/09/2022 15:47:00,7 - 43,#NULO#,02/10/2022 08:00:01,02/10/2022 18:15:40,20,02/10/2022 18:18:28,-1,-1
370469,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,DB713AA3,20/09/2022 16:07:00,7 - 6,#NULO#,02/10/2022 08:00:01,02/10/2022 17:23:03,43,02/10/2022 17:26:01,-1,-1
169241,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,4476E543,23/09/2022 08:56:00,7 - 275,#NULO#,02/10/2022 08:00:01,02/10/2022 17:00:53,15,02/10/2022 17:03:50,-1,-1
526003,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,3E1A76B4,21/09/2022 09:37:00,7 - 5,#NULO#,02/10/2022 08:00:01,02/10/2022 17:01:20,33,02/10/2022 17:05:23,-1,-1
454011,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,E8E5F6E0,21/09/2022 17:18:00,7 - 43,#NULO#,02/10/2022 08:00:01,02/10/2022 17:10:26,19,02/10/2022 17:13:04,-1,-1
720488,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,D6923620,28/09/2022 09:25:00,7 - 574,#NULO#,02/10/2022 08:04:12,02/10/2022 17:25:54,0,02/10/2022 17:28:12,-1,-1
201135,05/10/2022,15:19:40,2022,0,Eleição Ordinária,406,02/10/2022,1,546,Eleições Gerais Estaduais 2022,...,FDFA870E,20/09/2022 10:15:00,6 - 136,#NULO#,02/10/2022 08:00:01,02/10/2022 17:01:19,12,02/10/2022 17:03:38,-1,-1


In [228]:
# Selecionando os campos necessários para análise de votos

estado = pd.read_csv("boletim_urna_RN.csv", 
                 usecols = '''NR_ZONA NR_SECAO NM_MUNICIPIO QT_COMPARECIMENTO QT_APTOS QT_COMPARECIMENTO 
                 QT_ABSTENCOES NR_VOTAVEL NM_VOTAVEL QT_VOTOS DS_CARGO_PERGUNTA'''.split(),
                 sep=";", on_bad_lines = 'skip', encoding='Latin 1')


municipio = estado.query('NM_MUNICIPIO == "PARNAMIRIM" and DS_CARGO_PERGUNTA == "Presidente"')
municipio = municipio.drop(columns = 'NM_MUNICIPIO DS_CARGO_PERGUNTA'.split())


municipio.sample(15)  # visualizando 15 amostras

Unnamed: 0,NR_ZONA,NR_SECAO,QT_APTOS,QT_COMPARECIMENTO,QT_ABSTENCOES,NR_VOTAVEL,NM_VOTAVEL,QT_VOTOS
688806,50,356,338,284,54,15,SIMONE TEBET,9
681538,50,286,397,322,75,80,LÉO PÉRICLES,1
687786,50,349,347,281,66,22,JAIR BOLSONARO,127
681534,50,286,397,322,75,15,SIMONE TEBET,16
675419,50,206,323,267,56,13,LULA,110
674055,50,195,394,323,71,95,Branco,3
668689,50,120,268,231,37,22,JAIR BOLSONARO,120
707690,50,487,315,258,57,15,SIMONE TEBET,10
693892,50,388,396,324,72,12,CIRO GOMES,18
673289,50,182,364,298,66,15,SIMONE TEBET,3


## Agrupando os votos por candidato

Para conseguirmos ter idéia da quantidade de votos recebidos por cada candidato temos que agrupar e somar as colunas que contem os nomes dos mesmos e a quantidade de votos.

In [229]:
municipio.groupby('NM_VOTAVEL')['QT_VOTOS'].sum().sort_values(ascending = False)

NM_VOTAVEL
JAIR BOLSONARO         53530
LULA                   48084
CIRO GOMES              4583
SIMONE TEBET            2849
Nulo                    2840
Branco                  1481
SORAYA THRONICKE         350
FELIPE D'AVILA           339
SOFIA MANZANO             53
LÉO PÉRICLES              50
PADRE KELMON              50
VERA                      29
CONSTITUINTE EYMAEL       19
Name: QT_VOTOS, dtype: int64

## Porcentagem de votos dos candidatos por seção

In [None]:
votacao = {}
for secao in municipio.NR_SECAO.unique():
    result = municipio.query('NR_SECAO == @secao').groupby('NM_VOTAVEL')['QT_VOTOS'].sum()
    total = sum(result)
    votacao[secao] = {'Jair Bolsonaro': round(result["JAIR BOLSONARO"] / total * 100, 1),
                     'Lula': round(result["LULA"] / total * 100, 1), 
                     'Simone Tebet': round(result['SIMONE TEBET'] / total * 100, 1),
                     'Nulos':round(result['Nulo'] / total * 100, 1), 
                     'Brancos':round(result['Branco'] / total * 100, 1)
                    }
votacao = pd.DataFrame(votacao).transpose()
votacao

## Visualizando a porcentagem de votos por seção(ascendente) - Jair Bolsonaro

In [None]:
votacao['Jair Bolsonaro'].sort_values(ascending = False)

## Visualizando a porcentagem de votos por seção(ascendente) - Lula

In [None]:
votacao['Lula'].sort_values(ascending = False)

In [None]:
print (f"Porcentagem de comparecimento {municipio['QT_COMPARECIMENTO'].sum()/municipio['QT_APTOS'].sum()*100:.2f}%")