<a href="https://www.kaggle.com/code/jonasaacampos/an-lise-explorat-ria-do-sistema-de-vota-o-2022?scriptVersionId=121364851" target="_blank"><img align="left" alt="Kaggle" title="Open in Kaggle" src="https://kaggle.com/static/images/open-in-kaggle.svg"></a>

[//]: # (Title: An√°lise explorat√≥ria do sistema de vota√ß√£o 2022)
[//]: # (Author: Jonas Campos)
[//]: # (Date: March 06, 2023)
[//]: # (Comment: Recontagem dos votos de uma urna para verificar a confiabilidade da urna eletr√¥nica) 
[//]: # (Tags: #python, #eleicoes, #tse)  

[![](https://img.shields.io/badge/feito%20com%20%E2%9D%A4%20por-jaac-cyan)](https://github.com/jonasaacampos)
[![LinkedIn Badge](https://img.shields.io/badge/LinkedIn-Profile-informational?style=flat&logo=linkedin&logoColor=white&color=0D76A8)](https://www.linkedin.com/in/jonasaacampos)

# An√°lise explorat√≥ria do sistema de vota√ß√£o 2022

> Atividade desenvolvida durante o Deafio Data Science da Escola de Brit√¢nica de Artes Criativas e Tecnologias - EBAC, ministrada por Andr√© Perez




## Contexto e motiva√ß√£o

Diversas teorias conspirat√≥rias, fake news, documentos sem embasamento e laudos fraudados foram massivamente disseminados ao longo dos √∫ltimos anos.

Afinal, os dados apresentados pelo TSE s√£o confi√°veis? 

Neste estudo, faremos a recontagem de votos de uma √∫nica urna, a fim de determinarmos se os resultados do TSE podem ser replicados.

![](https://www.infomoney.com.br/wp-content/uploads/2019/06/urna-eletronica-3.jpg)




## Obten√ß√£o e upload dos dados

Os dados foram disponiblizados pelo TSE, e est√£o dispon√≠veis [neste link](https://resultados.tse.jus.br/oficial/app/index.html#/eleicao;e=e545;uf=sp;ufbu=sp;mubu=70831;zn=0122;se=0009/dados-de-urna/rdv).

Estes dados cont√©m registros criptografados de uma √∫nica urna.
Ap√≥s o download, foi realizado o upload para um diret√≥rio virtual para futuras an√°lises.

In [None]:
# comandos necess√°rios para permitir o acesso do notebook aos dados armazenados no goole drive
from google.colab import drive
drive.mount('/content/drive')

## Descriptografia dos dados (Criptografia Reversa)

Os dados brutos da urna s√£o criptografados por seguran√ßa. Caso houver algum acesso malicioso √† urna, os dados obtidos n√£o poderiam ser lidos, e se caso lidos e alterados, a urna rejeitaria sua inser√ß√£o em seus dados.



In [None]:
# para descriptrografar dados
!pip install asn1crypto==1.5.1

In [None]:
arquivo_rdv_raw_criptografado = "/content/drive/MyDrive/02-ESTUDOS/Data-Science/eleicoes-2022/data/raw/o00407-7083101220009.rdv"
arquivo_rdv_raw_criptografia_reversa = "/content/drive/MyDrive/02-ESTUDOS/Data-Science/eleicoes-2022/data/work/rdv.txt"

In [None]:
# carga para descritografar os dados e armazenar em um arquivo *.txt
!python /content/drive/MyDrive/02-ESTUDOS/Data-Science/eleicoes-2022/data/raw/rdv_resumo.py -r /content/drive/MyDrive/02-ESTUDOS/Data-Science/eleicoes-2022/data/raw/o00407-7083101220009.rdv > /content/drive/MyDrive/02-ESTUDOS/Data-Science/eleicoes-2022/data/work/rdv.txt

## Limpeza dos dados

Vamos considerar apenas a vota√ß√£o para presidente. Abaixo temos um la√ßo que percorre todo nosso arquivo e considera apenas os votos para presidente.


In [None]:
dados = []

with open(file=arquivo_rdv_raw_criptografia_reversa, mode = "r") as writer:
  for line in writer.readlines():
    if "Governador" in line:
      break
    else:
      dados.append(line)

In [None]:
len(dados)

In [None]:
for line in dados[0:10]:
  print(line)

## Extra√ß√£o

Obter somente os dados referente aos votos
- nominal
- brancos
- nulos

In [None]:
import re

In [None]:
# padr√£o para retornar qualquer valor que esteja entre colchetes
pattern = re.compile(pattern="\[(.*?)\]")

votos = []

# como todos os votos s√£o √∫nicos, ser√° inserido uma unidade para cada voto detectado

In [None]:
for line in dados:
  
  if "branco" in line:
    votos.append({"voto": "nulo", "quantidade": 1})
  if "nulo" in line:
    votos.append({"voto": "nulo", "quantidade": 1})
  if "nominal" in line:
    voto = re.findall(pattern=pattern, string=line)[0]
    votos.append({"voto": f"{voto}", "quantidade": 1})

  

In [None]:
len(votos)

In [None]:
for voto in votos[0:10]:
  print(voto)

## Processamento

Agora que temos os dados limpos e com uma estrutura organizada, vamos agregar os dados que extra√≠dos do boletim da urna

In [None]:
import pandas as pd

In [None]:
votos_df = pd.DataFrame(votos)
votos_df

In [None]:
# fazendo backup do arquivo raw

arquivo_limpo = "/content/drive/MyDrive/02-ESTUDOS/Data-Science/eleicoes-2022/data/clean/rdv.csv"

votos_df.to_csv(arquivo_limpo, header=True, index=False)

## An√°lises

Como sistema base para trabalhar com tabelas, usarei o pandas.

### Agrega√ß√£o

In [None]:
votos_agregados = votos_df.groupby("voto").agg("sum").reset_index()

In [None]:
votos_agregados

### Ordena√ß√£o

In [None]:
votos_agregados = votos_agregados.sort_values(by="quantidade", ascending=False)

In [None]:
votos_agregados

In [None]:
votos_agregados["percentual"] = round ( 100 * votos_agregados["quantidade"] / votos_agregados["quantidade"].sum(), 2)

In [None]:
votos_agregados

## Visualiza√ß√£o

Como ferramenta base para visualiza√ß√£o, usarei o seaborn.

In [None]:
import seaborn as sns

In [None]:
URNA = "S√£o Jo√£o da Boa Vista, SP - Zona 122 | Se√ß√£o 9"

In [None]:
x_column = "voto"
y_column = "quantidade"

In [None]:
title = f"Apura√ß√£o de votos para Presidente da Rep√∫blica 2022 | Segundo Turno Urna: {URNA}"
x_label = "Voto"
y_label = "Quantidade"

In [None]:
with sns.axes_style("whitegrid"):
  chart = sns.barplot(data=votos_agregados, x=x_column, y=y_column)
  chart.set(title=title, xlabel=x_label, ylabel=y_label)

In [None]:
x_column = "voto"
y_column = "percentual"
x_label = "Voto"
y_label = "percentual"

In [None]:
with sns.axes_style("whitegrid"):
  chart = sns.barplot(data=votos_agregados, x=x_column, y=y_column)
  chart.set(title=title, xlabel=x_label, ylabel=y_label)

## Conclus√£o

Os dados obtidos de uma √∫nica urna foram recontados e apresentaram os mesmos dados apresentados pelo TSE.

Este mesmo projeto pode ser utilizado para fazer a an√°lise de toda uma se√ß√£o eleitoral, ou mesmo de todas as urnas to pa√≠s, para verificar-se a lisura do processo. Todavia, como esta an√°lise foi um exerc√≠cio did√°tico com dados reais, considerar todos os dados fogem ao escopo e motiva√ß√£o atuais deste autor.

Este c√≥digo pode ser utilizado para quaisquer finalidades que n√£o comerciais. 

## Refer√™ncias

- [Documenta√ß√£o t√©cnica do software da urna eletr√¥nica](https://www.tre-mt.jus.br/eleicoes/eleicoes-2022/documentacao-tecnica-do-software-da-urna-eletronica)
- [Resultados Oficiais das Elei√ß√µes 2022](https://resultados.tse.jus.br/oficial/app/index.html#/eleicao;e=e545/resultados)
- [Dados da Se√ß√£o analizada de S√£o Jo√£o da Boa Vista, SP (urna √∫nica)](https://resultados.tse.jus.br/oficial/app/index.html#/eleicao;e=e545;uf=sp;ufbu=sp;mubu=70831;zn=0122;se=0009/dados-de-urna/rdv)

## Cont(r)ate-me üì´:

<p align='center'>
  <a href='https://github.com/jonasaacampos'>
    <img src='https://img.shields.io/badge/GitHub-100000?style=for-the-badge&logo=github&logoColor=white'/>
  </a>
  <a href='https://www.linkedin.com/in/jonasaacampos/'>
    <img src='https://img.shields.io/badge/LinkedIn-0077B5?style=for-the-badge&logo=linkedin&logoColor=white'/>
  </a>
   <a href='https://dev.to/jonasaacampos'>
    <img src='https://img.shields.io/badge/dev.to-0A0A0A?style=for-the-badge&logo=devdotto&logoColor=white'/>
  </a>
    <a href='https://www.buymeacoffee.com/jaac.dev'>
    <img src='https://img.shields.io/badge/Buy_Me_A_Coffee-FFDD00?style=for-the-badge&logo=buy-me-a-coffee&logoColor=black'/>
  </a>
</p>
