<h1 align="center">Análise de Dados Eleitorais</h1>
______________________________________________________________________________________________________________________________

## Introdução
Bem vindo(a) ao nosso Jupyter Notebook! É ele que vai nos auxiliar na análise de dados eleitorais, com foco particularmente no perfil que o eleitorado de diversas cidades de São Paulo apresentam. Mas... Antes de colocarmos a mão na massa, é preciso definir alguns conceitos, como por exemplo o que é e como funciona o Jupyter Notebook, além do mais importante, como usar. 
<br>
- Primeiramente, o Jupyter Notebook é uma aplicação web que gera o ambiente em que estamos, possibilitando usar linguagem Markdown, que gera textos como este que você está lendo agora, e ao mesmo tempo permite o acionamento de células específicas com códigos de diversas linguagens de programação. A usada neste projeto foi o Python!
  - Para experimentar o acionamento das células, dê um clique, para selecioná-la, e então, no menu do Jupyter, aperte o botão "▶️ Run". Tente com essa:

In [8]:
print("É isso aí! Você acabou de acionar uma célula, parabéns ✨ ")

É isso aí! Você acabou de acionar uma célula, parabéns ✨ 


Agora que sabemos que exitem tipos de células diferentes e que podemos acionar elas para ver o resultado dos códigos, podemos continuar. 
<br>
Neste Jupyter Notebook temos a análise de características específicas do eleitorado, não de todas. Por isso, aqui vai uma tabela demonstrando que tipos de estatísticas você pode se deparar: 

CARACTERÍSTICA     | TIPO                                           |
:------------------|:-----------------------------------------------|
Escolaridade       | Quantidade de pessoas por grau de escolaridade |
Estado Civil       | Quantidade de pessoas por estado civil         |
Faixa Etária       | Quantidade de pessoas por faixa de idade       |
Uso de nome social | Quantidade de pessoas por município            |

Certo, agora que estamos cientes do que podemos analisar em relação ao eleitorado, precisamos definir algumas coisas...

## Qual ano eleitoral escolher?
Por enquanto, temos à disposição os dados das eleições de 2018 e 2020, mas antes de escolher um ano, veja as características das eleições que ocorreram nestes anos:

ANO  | TIPO DE ELEIÇÃO    | CARGOS                  |
:----|:-------------------|:------------------------|
2018 | Federal e Estadual | Presidente e Governador |
2020 | Municipal          | Prefeito                |

Abaixo temos uma variável chamada `eleicao_ano`, ela que irá se lembrar do ano que você escolheu! Se quiser, pode alterar '2018' por '2020', por exemplo <br>
**OBS.:** Não se esqueça de acionar a célula depois, só assim o programa é executado!

In [13]:
eleicao_ano = 2018                      #  <-- Insira o ano da eleição aqui
print(f"Ano escolhido: {eleicao_ano}")

Ano escolhido: 2018


## Lista de municípios
Caso você se oriente por macro regiões para escolher uma cidade, confira a lista abaixo, ela vai te ajudar!<br>
**OBS.:** Clique nas setas "▶" para expandir a respectivas listas: <br> <br>

<details>
    <summary><b>▶ Vale do Paraíba</b></summary>
        • APARECIDA <br>
        • CAÇAPAVA <br>
        • CACHOEIRA PAULISTA <br>
        • CANAS <br>
        • CUNHA <br>
        • GUARATINGUETÁ <br>
        • IGARATÁ <br>
        • JACAREÍ <br>
        • JAMBEIRO <br>
        • LAGOINHA <br>
        • LORENA <br>
        • NATIVIDADE DA SERRA <br>
        • PARAIBUNA <br>
        • PINDAMONHANGABA <br>
        • PIQUETE <br>
        • POTIM <br>
        • REDENÇÃO DA SERRA <br>
        • ROSEIRA <br>
        • SANTA BRANCA <br>
        • SÃO JOSÉ DOS CAMPOS <br>
        • SÃO LUÍS DO PARAITINGA <br>
        • TAUBATÉ <br>
        • TREMEMBÉ <br> <br>
</details>

<details>
    <summary><b>▶ Vale Histórico</b></summary>
        • ARAPEÍ <br>
        • AREIAS <br>
        • BANANAL <br>
        • CRUZEIRO <br>
        • LAVRINHAS <br>
        • QUELUZ <br>
        • SÃO JOSÉ DO BARREIRO <br>
        • SILVEIRAS <br> <br>
</details>
    
<details>
    <summary><b>▶ Litoral Norte</b></summary>
        • CARAGUATATUBA <br>
        • ILHABELA <br>
        • SÃO SEBASTIÃO <br>
        • UBATUBA <br> <br>
</details>    
    
<details>
    <summary><b>▶ Serra da Mantiqueira</b></summary>
        • CAMPOS DO JORDÃO <br>
        • MONTEIRO LOBATO <br>
        • SANTO ANTÔNIO DO PINHAL <br>
        • SÃO BENTO DO SAPUCAÍ <br> <br>
</details>
    
<details>
    <summary><b>▶ Região Bragantina</b></summary>
        • ATIBAIA <br>
        • BOM JESUS DOS PERDÕES <br>
        • BRAGANÇA PAULISTA <br>
        • JOANÓPOLIS <br>
        • NAZARÉ PAULISTA <br>
        • PIRACAIA <br>
        • VARGEM <br> <br>
</details>

Agora temos uma variável chamada `eleicao_municipio`, ela guardará o nome da cidade que você escolheu. Mas tome cuidado com a escrita do nome do município: ele deve estar com a **acentuação e espaçamento corretos**, além de **entre aspas**! E não se esqueça de acionar a célula depois de modificar o código ✨

In [9]:
eleicao_municipio = "São José dos Campos"   #  <-- Insira o nome do município aqui
print(f"Município escolhido: {eleicao_municipio.upper()}")

Município escolhido: SÃO JOSÉ DOS CAMPOS


## Configurando o ambiente
Para conseguirmos de fato realizar a análise dos dados, nossos códigos precisam de uma ajudinha extra, e por isso vamos precisar usar um artifício das linguagens de programação chamado de "biblioteca". Basicamente, elas dão super poderes específicos para o nosso código, e é exatamente o que precisamos, então acione a célula abaixo para importar as bibliotecas e configurar nosso ambiente!

In [6]:
import pandas as pd
low_memory=False
import plotly.express as px
print('Importações e configurações concluídas ✔️ ')

Importações e configurações concluídas ✔️ 


## Que dados vamos usar?
Para deixar o processo mais rápido, vamos carregar apenas as informações que vamos utilizar. <br>
**OBS.:** Se não souber quais informações escolher, não precisa alterar o código, mas acione a célula!

In [7]:
col_eleitorado = ["ANO_ELEICAO", "SG_UF", "NM_MUNICIPIO", 
                  "DS_ESTADO_CIVIL", "DS_FAIXA_ETARIA", "DS_GRAU_ESCOLARIDADE", 
                  "QT_ELEITORES_PERFIL", "QT_ELEITORES_INC_NM_SOCIAL"]

col_candidatos = ["NR_TURNO", "NM_UE", "DS_CARGO", 
                  "NM_CANDIDATO", "SG_PARTIDO", 
                  "DS_SIT_TOT_TURNO", "ST_REELEICAO"]

print("Dados escolhidos com sucesso ✔️")

Dados escolhidos com sucesso ✔️


## Carregando os dados...
Os dados que vamos utilizar aqui são obtidos a partir do [TSE - Tribunal Superior Eleitoral](https://www.tse.jus.br/eleicoes/estatisticas/repositorio-de-dados-eleitorais-1/repositorio-de-dados-eleitorais). <br>
Esses dados estarão em arquivos no formato <i>.csv</i> e, caso ainda os não tenha na sua máquina, faça o download: <br>

**Arquivos do eleitorado:** <br>
- [Dados do eleitorado de 2018](https://cdn.tse.jus.br/estatistica/sead/odsele/perfil_eleitorado/perfil_eleitorado_2018.zip)<br>
- [Dados do eleitorado de 2020](https://cdn.tse.jus.br/estatistica/sead/odsele/perfil_eleitorado/perfil_eleitorado_2020.zip)<br>

**Arquivos dos candidatos:** <br>
- [Dados dos candidatos de 2018](https://cdn.tse.jus.br/estatistica/sead/odsele/consulta_cand/consulta_cand_2018.zip)<br>
- [Dados dos candidatos de 2020](https://cdn.tse.jus.br/estatistica/sead/odsele/consulta_cand/consulta_cand_2020.zip)<br>

**OBS.:** As pastas <b>.zip</b> que foram baixadas precisam ser descompactadas dentro da pasta <b>data</b>, localizada na mesma pasta onde este notebook está armazenado. Se estiver tudo ok, vamos adiante!

In [15]:
if eleicao_ano == 2018:
    filename_eleitorado = r'./data/perfil_eleitorado_2018.csv'
    filename_candidatos = r'./data/consulta_cand_2018_BRASIL.csv'
    
    dfe = pd.read_csv(filename_eleitorado, 
                 usecols=col_eleitorado,    
                 delimiter=';', 
                 encoding='iso-8859-1',
                 error_bad_lines=False)
    dfc = pd.read_csv(filename_candidatos, 
                 usecols=col_candidatos,    
                 delimiter=';', 
                 encoding='iso-8859-1',
                 error_bad_lines=False)
    print("Dados carregados com sucesso ✔️")

elif eleicao_ano == 2020:
    filename_eleitorado = r'./data/perfil_eleitorado_2020.csv'
    filename_candidatos = r'./data/consulta_cand_2020_SP.csv'
    
    dfe = pd.read_csv(filename_eleitorado, 
                 usecols=col_eleitorado, 
                 delimiter=';', 
                 encoding='iso-8859-1',
                 error_bad_lines=False)
    dfc = pd.read_csv(filename_candidatos, 
                 usecols=col_candidatos,    
                 delimiter=';', 
                 encoding='iso-8859-1',
                 error_bad_lines=False)
    print("Dados carregados com sucesso ✔️")

else:
    print("Escolha um ano válido! Volte ao início do notebook, altere o ano e rode aquela e esta célula novamente")

Dados carregados com sucesso ✔️


## Filtrando o candidato
Na célula abaixo, o programa irá filtrar dentro do <i>.csv</i> que baixamos os candidatos eleitos no ano que você escolheu e guardar nas variáveis correspondentes que serão utilizadas lá na frente para a visualização dos dados.

In [18]:
if eleicao_ano == 2018:
    presidente_candidatos = ( ( dfc.query('NM_UE == "BRASIL"') ).query('DS_CARGO == "PRESIDENTE"') ).query('DS_SIT_TOT_TURNO == "ELEITO"')
    governador_candidatos = ( ( dfc.query('NM_UE == "SÃO PAULO"') ).query('DS_CARGO == "GOVERNADOR"') ).query('DS_SIT_TOT_TURNO == "ELEITO"')
    print("Candidatos eleitos guardados na memória ✔️")
elif eleicao_ano == 2020:
    prefeito_candidatos = ( ( dfc.query('NM_UE == "' + eleicao_municipio.upper() + '"') ).query('DS_CARGO == "PREFEITO"') ).query('DS_SIT_TOT_TURNO == "ELEITO"')
    print("Candidato eleito guardado na memória ✔️")

Candidatos eleitos guardados na memória ✔️


## Filtrando o município
Agora o programa vai buscar os dados dos eleitores com base na cidade escolhida anteriormente.

In [19]:
municipio_eleitores = dfe.query('NM_MUNICIPIO == "' + eleicao_municipio.upper() + '"')
print(f'Dados dos eleitores de {eleicao_municipio} carregados ✔️')

Dados dos eleitores de São José dos Campos carregados ✔️


## Os dados
Só pra ter uma ideia de quais são os dados que o TSE disponibilizou do município que vamos analisar, veja uma pequena amostra na tabela abaixo. Lembrando que a descrição e significado de cada variável do cabeçalho pode ser encontrada neste arquivo: [leiame.pdf](https://drive.google.com/file/d/1NoDVa7BMaPAfybyJdqCtT9MvrKj1TD1L/view).

In [20]:
municipio_eleitores.sample(10)

Unnamed: 0,ANO_ELEICAO,SG_UF,NM_MUNICIPIO,DS_ESTADO_CIVIL,DS_FAIXA_ETARIA,DS_GRAU_ESCOLARIDADE,QT_ELEITORES_PERFIL,QT_ELEITORES_INC_NM_SOCIAL
2328117,2018,SP,SÃO JOSÉ DOS CAMPOS,DIVORCIADO,60 a 64 anos,SUPERIOR COMPLETO,232,0
3149882,2018,SP,SÃO JOSÉ DOS CAMPOS,SOLTEIRO,85 a 89 anos,ENSINO MÉDIO COMPLETO,1,0
414692,2018,SP,SÃO JOSÉ DOS CAMPOS,SOLTEIRO,95 a 99 anos,ENSINO MÉDIO COMPLETO,2,0
3047392,2018,SP,SÃO JOSÉ DOS CAMPOS,VIÚVO,30 a 34 anos,SUPERIOR INCOMPLETO,1,0
3721398,2018,SP,SÃO JOSÉ DOS CAMPOS,VIÚVO,55 a 59 anos,ENSINO FUNDAMENTAL COMPLETO,3,0
1778461,2018,SP,SÃO JOSÉ DOS CAMPOS,SEPARADO JUDICIALMENTE,95 a 99 anos,ANALFABETO,1,0
414734,2018,SP,SÃO JOSÉ DOS CAMPOS,SEPARADO JUDICIALMENTE,75 a 79 anos,LÊ E ESCREVE,12,0
413239,2018,SP,SÃO JOSÉ DOS CAMPOS,SOLTEIRO,55 a 59 anos,ENSINO FUNDAMENTAL INCOMPLETO,1,0
1647202,2018,SP,SÃO JOSÉ DOS CAMPOS,CASADO,95 a 99 anos,ANALFABETO,13,0
3497298,2018,SP,SÃO JOSÉ DOS CAMPOS,CASADO,65 a 69 anos,SUPERIOR COMPLETO,71,0


## Visualização dos dados
Agora sim, depois de configurar o ambiente, as variáveis e fazer todas as escolhas, podemos nos divertir gerando gráficos com os dados que foram filtrados.

### Candidato eleito
Acionando a célula abaixo vamos descobri o(s) candidato(s) eleito(s) e para quais cargos no ano que escolhemos, além de informações adicionais como o partido (entre parênteses) e o turno em que foi eleito!

In [22]:
if eleicao_ano == 2018:
    presidente_eleito = presidente_candidatos['NM_CANDIDATO'].iloc[0]
    presidente_eleito_partido = presidente_candidatos['SG_PARTIDO'].iloc[0]
    presidente_eleito_turno = presidente_candidatos['NR_TURNO'].iloc[0]
    
    governador_eleito = governador_candidatos['NM_CANDIDATO'].iloc[0]
    governador_eleito_partido = governador_candidatos['SG_PARTIDO'].iloc[0]
    governador_eleito_turno = governador_candidatos['NR_TURNO'].iloc[0]
    
    print(f"Em 2018, foi eleito para Presidente da República o candidato {presidente_eleito} ({presidente_eleito_partido}), no {presidente_eleito_turno}º turno das eleições.")
    print(f"Neste mesmo ano, foi eleito para Governador do Estado de SP o candidato {governador_eleito} ({governador_eleito_partido}), no {governador_eleito_turno}º turno das eleições.")

elif eleicao_ano == 2020:
    prefeito_eleito = prefeito_candidatos['NM_CANDIDATO'].iloc[0]
    prefeito_eleito_partido = prefeito_candidatos['SG_PARTIDO'].iloc[0]
    prefeito_eleito_turno = prefeito_candidatos['NR_TURNO'].iloc[0]
    
    print(f"Em 2020, foi eleito para prefeito da cidade de {eleicao_municipio} o candidato {prefeito_eleito}, do partido {prefeito_eleito_partido}, no {prefeito_eleito_turno}º turno.")

Em 2018, foi eleito para Presidente da República o candidato JAIR MESSIAS BOLSONARO (PSL), no 2º turno das eleições.
Neste mesmo ano, foi eleito para Governador do Estado de SP o candidato JOÃO AGRIPINO DA COSTA DORIA JUNIOR (PSDB), no 2º turno das eleições.


### Grau de Escolaridade
Da mesma forma, acionando a próxima célula, vamos poder observar um gráfico que corresponde à percentagem de eleitores que tem determinado grau de escolaridade. <br>
**OBS.:** O gráfico é interativo, passando o mouse por cima é possível obter mais informações!

In [25]:
total_eleitores_escolaridade = municipio_eleitores.groupby('DS_GRAU_ESCOLARIDADE')['QT_ELEITORES_PERFIL'].sum()
fig=px.bar(total_eleitores_escolaridade, x= total_eleitores_escolaridade.index, y=total_eleitores_escolaridade.values,
          title="GRAU DE ESCOLARIDADE DO ELEITORADO - " + eleicao_municipio.upper() + " / " + str(eleicao_ano), 
          labels={'y':'Eleitores', 'DS_GRAU_ESCOLARIDADE':'Escolaridade'})

fig.show()

### Estado Civil
Com o código abaixo, o gráfico gerado irá ilustrar a quantidade de pessoas de acordo com seu estado civil:

In [30]:
total_eleitores_estadocivil = municipio_eleitores.groupby('DS_ESTADO_CIVIL')['QT_ELEITORES_PERFIL'].sum().sort_values(ascending=False)
fig=px.bar(total_eleitores_estadocivil, x= total_eleitores_estadocivil.index, y=total_eleitores_estadocivil.values,
          title="ESTADO CIVIL DO ELEITORADO - " + eleicao_municipio.upper() + " / " + str(eleicao_ano), 
          labels={'y':'Eleitores', 'DS_ESTADO_CIVIL':'Estado Civil'})

fig.show()

### Faixa Etária
Para faixa etária, observamos um gráfico que relaciona a quantidade de pessoas com o intervalo de idade que elas se encaixam:

In [32]:
total_eleitores_faixaetaria = municipio_eleitores.groupby('DS_FAIXA_ETARIA')['QT_ELEITORES_PERFIL'].sum()
fig=px.bar(total_eleitores_faixaetaria, x= total_eleitores_faixaetaria.index, y=total_eleitores_faixaetaria.values,
          title='FAIXA ETÁRIA DO ELEITORADO - ' + eleicao_municipio.upper() + " / " + str(eleicao_ano), 
          labels={'y':'Eleitores', 'DS_FAIXA_ETARIA':'Faixa Etária'})

fig.show()

### Quantidade de eleitores inscritos com nome social
Abaixo podemos ver quantas pessoas declararam o uso de nome social na cidade toda:

In [34]:
total_eleitores_nomesocial = 0 # Iniciando a variável
df_nomesocial = municipio_eleitores.groupby('QT_ELEITORES_INC_NM_SOCIAL')['QT_ELEITORES_INC_NM_SOCIAL'].sum()

# Somando a quantidade de eleitores com nome social em cada grupo
for index_nomesocial in range(len(df_nomesocial)):
    total_eleitores_nomesocial += df_nomesocial.index[index_nomesocial] * df_nomesocial.values[index_nomesocial]

# Exibindo resultado na tela
if total_eleitores_nomesocial > 1:
    print(f"Em {eleicao_municipio}, foram inscritos {total_eleitores_nomesocial} eleitores com nome social.")
elif total_eleitores_nomesocial == 1:
    print(f"Em {eleicao_municipio}, foi inscrito {total_eleitores_nomesocial} eleitor com nome social.")
else:
    print(f"Em {eleicao_municipio}, não foi inscrito nenhum eleitor com nome social.")

Em São José dos Campos, foram inscritos 34 eleitores com nome social.


## E agora?
Bom, esses foram os dados que pudemos analisar, e agora que já sabe o que pode fazer e como fazer, fique a vontade para analisar os dados de outras cidades e anos, mas claro, que estejam dentro do nosso alcance. Para isso, consulte as tabelas e listas que estão no começo nesse notebook ✨