# Eleições 2020
## Analise de dados dos candidatos a prefeito e vereador

Este é um trabalho de análise de dados das eleições municipais de 2020, feito por aluno(s) da faculdade de Tecnologia de São José dos Campos, Fatec Jessem Vidal, do curso de Análise e Desenvolvimento de Sistemas para a disciplina de Estrutura de Dados do Profº Fernando Masanori.
A fonte dos dados pode ser acessada em http://www.tse.jus.br/eleicoes/estatisticas/repositorio-de-dados-eleitorais-1
O conteúdo desde notebook serve apenas para aprendizado e não deve ser utilizado para fins de propaganda politico-partidaria de qualquer natureza. 

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [2]:
## importando os dados
file = r'consulta_cand_2020_SP.csv'
lst = ['DS_ELEICAO', 'SG_UF', 'NM_UE', 'DS_CARGO', 'DS_SITUACAO_CANDIDATURA', 'DS_DETALHE_SITUACAO_CAND', 
       'SG_PARTIDO', 'SG_UF_NASCIMENTO', 'NM_MUNICIPIO_NASCIMENTO', 'DS_GENERO', 'DS_GRAU_INSTRUCAO',
       'DS_COR_RACA', 'DS_OCUPACAO']
df = pd.read_csv(file, delimiter=';',usecols= lst, encoding='Latin 1')
df.shape

(93692, 13)

In [3]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93692 entries, 0 to 93691
Data columns (total 13 columns):
DS_ELEICAO                  93692 non-null object
SG_UF                       93692 non-null object
NM_UE                       93692 non-null object
DS_CARGO                    93692 non-null object
DS_SITUACAO_CANDIDATURA     93692 non-null object
DS_DETALHE_SITUACAO_CAND    93692 non-null object
SG_PARTIDO                  93692 non-null object
SG_UF_NASCIMENTO            93692 non-null object
NM_MUNICIPIO_NASCIMENTO     93692 non-null object
DS_GENERO                   93692 non-null object
DS_GRAU_INSTRUCAO           93692 non-null object
DS_COR_RACA                 93692 non-null object
DS_OCUPACAO                 93692 non-null object
dtypes: object(13)
memory usage: 9.3+ MB


In [4]:
df.sample(5)

Unnamed: 0,DS_ELEICAO,SG_UF,NM_UE,DS_CARGO,DS_SITUACAO_CANDIDATURA,DS_DETALHE_SITUACAO_CAND,SG_PARTIDO,SG_UF_NASCIMENTO,NM_MUNICIPIO_NASCIMENTO,DS_GENERO,DS_GRAU_INSTRUCAO,DS_COR_RACA,DS_OCUPACAO
70643,Eleições Municipais 2020,SP,TAUBATÉ,VEREADOR,APTO,DEFERIDO,CIDADANIA,SP,TAUBATÉ,MASCULINO,SUPERIOR COMPLETO,BRANCA,OUTROS
3652,Eleições Municipais 2020,SP,CAMPOS NOVOS PAULISTA,VEREADOR,APTO,DEFERIDO,CIDADANIA,SP,BOTUCATU,MASCULINO,ENSINO FUNDAMENTAL INCOMPLETO,BRANCA,MOTORISTA DE VEÍCULOS DE TRANSPORTE COLETIVO D...
86191,Eleições Municipais 2020,SP,BARUERI,VICE-PREFEITO,APTO,DEFERIDO,PROS,SP,OSASCO,FEMININO,SUPERIOR INCOMPLETO,BRANCA,SERVIDOR PÚBLICO MUNICIPAL
82839,Eleições Municipais 2020,SP,ATIBAIA,VEREADOR,APTO,DEFERIDO,PATRIOTA,SP,SÃO PAULO,MASCULINO,SUPERIOR COMPLETO,PARDA,GERENTE
11592,Eleições Municipais 2020,SP,BEBEDOURO,VEREADOR,APTO,DEFERIDO,DEM,SP,BEBEDOURO,MASCULINO,ENSINO MÉDIO COMPLETO,BRANCA,VEREADOR


Primeiro farei uma analise apenas dos candidatos do municipio de São José dos Campos.
Usaremos as seguintes colunas: DS_ELEICAO, SG_UF, NM_UE, DS_CARGO, DS_CARGO, DS_SITUACAO_CANDIDATURA, DS_DETALHE_SITUACAO_CAND, SG_PARTIDO, DS_NACIONALIDADE, SG_UF_NASCIMENTO, NM_MUNICIPIO_NASCIMENTO, DS_GENERO, DS_GRAU_INSTRUCAO, DS_COR_RACA, DS_OCUPACAO, VR_DESPESA_MAX_CAMPANHA e ST_REELEICAO, uma vez que o arquivo original tem 63 colunas.

In [5]:
df_sjc = df.query('NM_UE == "SÃO JOSÉ DOS CAMPOS"')
df_sjc.shape

(621, 13)

In [6]:
df_sjc.sample(5)

Unnamed: 0,DS_ELEICAO,SG_UF,NM_UE,DS_CARGO,DS_SITUACAO_CANDIDATURA,DS_DETALHE_SITUACAO_CAND,SG_PARTIDO,SG_UF_NASCIMENTO,NM_MUNICIPIO_NASCIMENTO,DS_GENERO,DS_GRAU_INSTRUCAO,DS_COR_RACA,DS_OCUPACAO
1220,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,VEREADOR,APTO,DEFERIDO,PSD,SP,CAMPINAS,FEMININO,SUPERIOR COMPLETO,BRANCA,OUTROS
65428,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,VEREADOR,APTO,DEFERIDO,PSC,SP,SÃO JOSÉ DOS CAMPOS,MASCULINO,SUPERIOR COMPLETO,BRANCA,APOSENTADO (EXCETO SERVIDOR PÚBLICO)
64179,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,VEREADOR,APTO,DEFERIDO,PSDB,SP,SÃO JOSÉ DOS CAMPOS,MASCULINO,SUPERIOR COMPLETO,BRANCA,VEREADOR
57536,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,VEREADOR,APTO,DEFERIDO,PC do B,MG,INHAPIM,MASCULINO,SUPERIOR COMPLETO,BRANCA,ADVOGADO
73933,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,VEREADOR,APTO,DEFERIDO,PSD,BA,SALVADOR,FEMININO,ENSINO MÉDIO COMPLETO,PARDA,APOSENTADO (EXCETO SERVIDOR PÚBLICO)


In [7]:
df_sjc.query('DS_CARGO == "PREFEITO"')

Unnamed: 0,DS_ELEICAO,SG_UF,NM_UE,DS_CARGO,DS_SITUACAO_CANDIDATURA,DS_DETALHE_SITUACAO_CAND,SG_PARTIDO,SG_UF_NASCIMENTO,NM_MUNICIPIO_NASCIMENTO,DS_GENERO,DS_GRAU_INSTRUCAO,DS_COR_RACA,DS_OCUPACAO
593,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PSL,SP,APARECIDA,MASCULINO,SUPERIOR COMPLETO,BRANCA,ADMINISTRADOR
22681,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PL,SP,SÃO PAULO,FEMININO,SUPERIOR COMPLETO,BRANCA,POLICIAL MILITAR
28479,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PSB,SP,SÃO PAULO,MASCULINO,SUPERIOR COMPLETO,BRANCA,MÉDICO
32239,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PC do B,SP,CRUZEIRO,MASCULINO,SUPERIOR COMPLETO,PRETA,APOSENTADO (EXCETO SERVIDOR PÚBLICO)
33548,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PTC,SP,SERTÃOZINHO,MASCULINO,SUPERIOR COMPLETO,BRANCA,ADMINISTRADOR
45254,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PSOL,SP,SÃO PAULO,FEMININO,ENSINO MÉDIO COMPLETO,BRANCA,ELETRICISTA E ASSEMELHADOS
52462,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,NOVO,RO,PORTO VELHO,MASCULINO,SUPERIOR COMPLETO,PARDA,PROFESSOR DE ENSINO SUPERIOR
61593,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PSD,SP,TAUBATÉ,FEMININO,SUPERIOR COMPLETO,BRANCA,ADVOGADO
70808,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PSDB,SP,SÃO PAULO,MASCULINO,SUPERIOR COMPLETO,BRANCA,PREFEITO
85011,Eleições Municipais 2020,SP,SÃO JOSÉ DOS CAMPOS,PREFEITO,APTO,DEFERIDO,PT,SP,SÃO JOSÉ DOS CAMPOS,MASCULINO,SUPERIOR COMPLETO,BRANCA,VEREADOR


In [8]:
df_sjc['SG_PARTIDO'].value_counts()

PT               34
PSL              34
PSDB             34
PSD              34
PL               33
DEM              32
PRTB             32
PTB              32
CIDADANIA        32
PTC              32
PATRIOTA         31
PP               30
PSC              29
MDB              29
AVANTE           28
PC do B          27
SOLIDARIEDADE    27
REPUBLICANOS     25
PODE             20
NOVO             11
PSOL             11
PSTU              9
PSB               8
REDE              7
Name: SG_PARTIDO, dtype: int64

In [9]:
c = 0
for candidato in df_sjc['DS_CARGO']:
    if candidato == 'PREFEITO':
        c += 1

print(f'Temos {len(df_sjc)} candidados em São José dos Campos, destes, {c} são para prefeito')

Temos 621 candidados em São José dos Campos, destes, 11 são para prefeito


In [10]:
df_sjc.isnull().sum()

DS_ELEICAO                  0
SG_UF                       0
NM_UE                       0
DS_CARGO                    0
DS_SITUACAO_CANDIDATURA     0
DS_DETALHE_SITUACAO_CAND    0
SG_PARTIDO                  0
SG_UF_NASCIMENTO            0
NM_MUNICIPIO_NASCIMENTO     0
DS_GENERO                   0
DS_GRAU_INSTRUCAO           0
DS_COR_RACA                 0
DS_OCUPACAO                 0
dtype: int64

## Proporção de generos em geral

In [11]:
df_sjc['DS_GENERO'].value_counts('DS_GENERO')

MASCULINO    0.673108
FEMININO     0.326892
Name: DS_GENERO, dtype: float64

In [12]:
df_sjc['DS_GENERO'].value_counts()

MASCULINO    418
FEMININO     203
Name: DS_GENERO, dtype: int64

## Grau de escolaridade

In [13]:
df_sjc['DS_GRAU_INSTRUCAO'].value_counts()

SUPERIOR COMPLETO                240
ENSINO MÉDIO COMPLETO            227
ENSINO FUNDAMENTAL COMPLETO       48
SUPERIOR INCOMPLETO               45
ENSINO FUNDAMENTAL INCOMPLETO     31
ENSINO MÉDIO INCOMPLETO           20
LÊ E ESCREVE                      10
Name: DS_GRAU_INSTRUCAO, dtype: int64

In [19]:
df_sjc['DS_GRAU_INSTRUCAO'].value_counts('DS_GRAU_INSTRUCAO') * 100

SUPERIOR COMPLETO                38.647343
ENSINO MÉDIO COMPLETO            36.553945
ENSINO FUNDAMENTAL COMPLETO       7.729469
SUPERIOR INCOMPLETO               7.246377
ENSINO FUNDAMENTAL INCOMPLETO     4.991948
ENSINO MÉDIO INCOMPLETO           3.220612
LÊ E ESCREVE                      1.610306
Name: DS_GRAU_INSTRUCAO, dtype: float64