# **Especialização em Ciência de Dados - INF/UFRGS e SERPRO**
# **Análise Visual e Interativa Sobre o Discurso de Ódio nas Redes Sociais e Influência nas Eleições Brasileiras**
#### *Prof <sup>as</sup>. Viviane P. Moreira e Lisiane Selau*
<br>

---

***Trabalho de Conclusão de Curso – Turma 03***

*Aluno:*

* Antonio Fagner Santos de Oliveira 576637
---

_Este notebook trabalha análise exploratória dos dados das eleições gerais brasileiras de 2018 e 2022._

_Na análise exploratória devem-se usar técnicas estatísticas e visualização, seão identificadas tendências, padrões, relações e insights iniciais que podem orientar as próximas etapas do processo._

https://www.linkedin.com/pulse/criando-mapas-com-python-de-uma-forma-bastante-simples-mauro-ferreira/

https://medium.com/@maurynho/coletando-dados-de-regi%C3%B5es-e-estados-com-python-c7b965fa7694

https://www.pluralsight.com/tech-blog/synthwave-styling-data-visualizations-in-python-with-altair/

## 1 Carga dos Dados Pré-processados

In [None]:
import polars as pl
import os
import altair as alt
import numpy as np
import standards as sdt_f

In [None]:
root:str = "../Dados/Eleicoes/"
poll_18:str = "eleicao18_turno_01.parquet"
poll_22:str = "eleicao22_turno_01.parquet"
parties:str = "partidos_br.parquet"
cities:str = "municipios.parquet"

In [None]:
#carga dos partidos políticos
df_partidos:pl.DataFrame = sdt_f.load_parquet(os.path.join(root, parties))

In [None]:
#carga dos municípios
df_municipios = sdt_f.load_parquet(os.path.join(root, cities))

In [None]:
#Carregas dados das eleições de 2018 e 2022 já ajustados
df_poll_18 = sdt_f.load_parquet(os.path.join(root, poll_18))
df_poll_22 = sdt_f.load_parquet(os.path.join(root, poll_22))

## 2 Análise Exploratória

Entender e explorar os dados por meio de técnicas estatísticas e visualização. Tendências, padrões, relações e insights iniciais que podem orientar as próximas etapas do processo.

https://ebaconline.com.br/blog/analise-exploratoria-de-dados-o-que-e

---

### 2.1 UNIÃO

Análise do comportamento do voto no UNIÃO entre 2018 e 2022

---

In [None]:
#disabilita o limite de 5.000 para processamento imposto pelo altair
alt.data_transformers.disable_max_rows()

#### 2.1.1 Para o cargo de deputado estadual

In [None]:
#define o partido em análise
partido:str="UNIÃO"

#cargo a ser analisado em relação ao partido
cargo:list[int]=list([7,8])

titulo:str= f"% Votos Dep. Estadual/Distrital ({partido})"
df_poll_18_tmp, df_poll_22_tmp = sdt_f.filter_choropleth_votting(df_poll_18, df_poll_22, df_municipios, cargo, partido)

In [None]:
sdt_f.choropleth_votting(df_poll_18_tmp, df_poll_22_tmp, titulo)

In [None]:
#juntando os dois datasets para apresentarmos box plots por eleição
df_tmp = pl.concat([df_poll_18_tmp, df_poll_22_tmp])

In [None]:
sdt_f.box_plots_votting_by_region(df_tmp, titulo)

In [None]:
sdt_f.box_plots_votting_by_uf(df_tmp, titulo)

In [None]:
df_tmp = df_poll_18_tmp.join(df_poll_22_tmp, on="CD_MUNICIPIO")
df_tmp = df_tmp.rename({"PCT_VOTOS_MUNIC":"PCT_VOTOS_18", "PCT_VOTOS_MUNIC_right": "PCT_VOTOS_22", "TOTAL_VOTOS_MUNIC":"TOTAL_VOTOS_18", "TOTAL_VOTOS_MUNIC_right": "TOTAL_VOTOS_22"})

In [None]:
sdt_f.scatter_votting_by_regions(df_tmp, titulo)

In [None]:
sdt_f.scatter_facet_votting_by_regions(df_tmp, titulo)

#### 2.1.2 Para o cargo de deputado federal

In [None]:
#cargo a ser analisado em relação ao partido
cargo:list[int]=list([6])

titulo:str= f"% Votos Dep. Federal ({partido})"

df_poll_18_tmp, df_poll_22_tmp = sdt_f.filter_choropleth_votting(df_poll_18, df_poll_22, df_municipios, cargo, partido)

In [None]:
sdt_f.choropleth_votting(df_poll_18_tmp, df_poll_22_tmp, titulo)

In [None]:
#juntando os dois datasets para apresentarmos box plots por eleição
df_tmp = pl.concat([df_poll_18_tmp, df_poll_22_tmp])

In [None]:
sdt_f.box_plots_votting_by_region(df_tmp, titulo)

In [None]:
sdt_f.box_plots_votting_by_uf(df_tmp, titulo)

In [None]:
df_tmp = df_poll_18_tmp.join(df_poll_22_tmp, on="CD_MUNICIPIO")
df_tmp = df_tmp.rename({"PCT_VOTOS_MUNIC":"PCT_VOTOS_18", "PCT_VOTOS_MUNIC_right": "PCT_VOTOS_22", "TOTAL_VOTOS_MUNIC":"TOTAL_VOTOS_18", "TOTAL_VOTOS_MUNIC_right": "TOTAL_VOTOS_22"})

In [None]:
sdt_f.scatter_votting_by_regions(df_tmp, titulo)

In [None]:
sdt_f.scatter_facet_votting_by_regions(df_tmp, titulo)

#### 2.1.3 Para o cargo de presidente

In [None]:
#cargo a ser analisado em relação ao partido
cargo:list[int]=list([1])
titulo:str= f"% Votos Presidente ({partido})"
df_poll_18_tmp, df_poll_22_tmp = sdt_f.filter_choropleth_votting(df_poll_18, df_poll_22, df_municipios, cargo, partido)

In [None]:
sdt_f.choropleth_votting(df_poll_18_tmp, df_poll_22_tmp, titulo)

In [None]:
#juntando os dois datasets para apresentarmos box plots por eleição
df_tmp = pl.concat([df_poll_18_tmp, df_poll_22_tmp])

In [None]:
sdt_f.box_plots_votting_by_region(df_tmp, titulo)

In [None]:
sdt_f.box_plots_votting_by_uf(df_tmp, titulo)

In [None]:
df_tmp = df_poll_18_tmp.join(df_poll_22_tmp, on="CD_MUNICIPIO")
df_tmp = df_tmp.rename({"PCT_VOTOS_MUNIC":"PCT_VOTOS_18", "PCT_VOTOS_MUNIC_right": "PCT_VOTOS_22", "TOTAL_VOTOS_MUNIC":"TOTAL_VOTOS_18", "TOTAL_VOTOS_MUNIC_right": "TOTAL_VOTOS_22"})

In [None]:
sdt_f.scatter_votting_by_regions(df_tmp, titulo)

In [None]:
sdt_f.scatter_facet_votting_by_regions(df_tmp, titulo)