## Trabalho Final - Tratamento e Análise de Dados Eleitorais

Este notebook tem como objetivo realizar o tratamento e análise exploratória dos dados eleitorais disponibilizados pelo TSE. 

### Etapas:
1. Carregamento e inspeção inicial dos dados.
2. Tratamento de inconsistências e valores faltantes.
3. Integração das bases de dados.
4. Análise exploratória e visualizações.
5. Preparação do dataset final para análise.

**Ferramentas Utilizadas:**
- Python (pandas, matplotlib, seaborn)
- Visual Studio Code


In [543]:
# Importando as bibliotecas necessárias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import chardet

In [544]:
# Lista com os caminhos dos arquivos CSV
arquivos_csv = [
    "candidatos\\consulta_cand_2012_RS.csv",
    "candidatos\\consulta_cand_2016_RS.csv",
    "candidatos\\consulta_cand_2020_RS.csv",
    "resultados\\votacao_candidato_munzona_2012_RS.csv",
    "resultados\\votacao_candidato_munzona_2016_RS.csv",
    "resultados\\votacao_candidato_munzona_2020_RS.csv"
]

# Função para transformar um arquivo CSV em UTF-8
def transformar_para_utf8(caminho_arquivo):
    # Detectar a codificação do arquivo
    with open(caminho_arquivo, "rb") as f:
        result = chardet.detect(f.read(10000))
        encoding_detectada = result['encoding']
        print(f"Codificação detectada para {caminho_arquivo}: {encoding_detectada}")

    # Ler o arquivo com a codificação detectada
    with open(caminho_arquivo, "r", encoding=encoding_detectada, errors="replace") as infile:
        conteudo = infile.read()

    # Sobrescrever o arquivo em UTF-8
    with open(caminho_arquivo, "w", encoding="utf-8") as outfile:
        outfile.write(conteudo)
    print(f"Arquivo {caminho_arquivo} transformado para UTF-8.")

# Transformar todos os arquivos na lista
for arquivo in arquivos_csv:
    transformar_para_utf8(arquivo)

print("Todos os arquivos foram transformados para UTF-8 com sucesso.")

Codificação detectada para candidatos\consulta_cand_2012_RS.csv: utf-8
Arquivo candidatos\consulta_cand_2012_RS.csv transformado para UTF-8.
Codificação detectada para candidatos\consulta_cand_2016_RS.csv: utf-8
Arquivo candidatos\consulta_cand_2016_RS.csv transformado para UTF-8.
Codificação detectada para candidatos\consulta_cand_2020_RS.csv: utf-8
Arquivo candidatos\consulta_cand_2020_RS.csv transformado para UTF-8.
Codificação detectada para resultados\votacao_candidato_munzona_2012_RS.csv: utf-8
Arquivo resultados\votacao_candidato_munzona_2012_RS.csv transformado para UTF-8.
Codificação detectada para resultados\votacao_candidato_munzona_2016_RS.csv: utf-8
Arquivo resultados\votacao_candidato_munzona_2016_RS.csv transformado para UTF-8.
Codificação detectada para resultados\votacao_candidato_munzona_2020_RS.csv: utf-8
Arquivo resultados\votacao_candidato_munzona_2020_RS.csv transformado para UTF-8.
Todos os arquivos foram transformados para UTF-8 com sucesso.


In [545]:
# # Configurando o estilo dos gráficos
# sns.set(style="whitegrid")

# # Configuração para exibição de tabelas mais largas no notebook
# pd.set_option('display.max_columns', None)
# pd.set_option('display.max_rows', 100)

In [546]:
# Definindo os caminhos dos arquivos
path_cand_2012 = "candidatos\\consulta_cand_2012_RS.csv"
path_cand_2016 = "candidatos\\consulta_cand_2016_RS.csv"
path_cand_2020 = "candidatos\\consulta_cand_2020_RS.csv"

path_votos_2012 = "resultados\\votacao_candidato_munzona_2012_RS.csv"
path_votos_2016 = "resultados\\votacao_candidato_munzona_2016_RS.csv"
path_votos_2020 = "resultados\\votacao_candidato_munzona_2020_RS.csv"

# Carregando os dados
cand_2012 = pd.read_csv(path_cand_2012, sep=";", encoding="utf-8-sig")
cand_2016 = pd.read_csv(path_cand_2016, sep=";", encoding="utf-8-sig")
cand_2020 = pd.read_csv(path_cand_2020, sep=";", encoding="utf-8")

votos_2012 = pd.read_csv(path_votos_2012, sep=";", encoding="utf-8")
votos_2016 = pd.read_csv(path_votos_2016, sep=";", encoding="utf-8")
votos_2020 = pd.read_csv(path_votos_2020, sep=";", encoding="utf-8")

  cand_2012 = pd.read_csv(path_cand_2012, sep=";", encoding="utf-8-sig")


In [547]:
# Exibindo as primeiras linhas de cada dataset para inspeção inicial

# print("Candidatos 2012:")
# display(cand_2012.head())
# len(cand_2012)

# print("\nCandidatos 2016:")
# display(cand_2016.head())
# len(cand_2016)

# print("\nCandidatos 2020:")
# display(cand_2020.head())
# len(cand_2020)

# print("\nVotação 2012:")
# display(votos_2012.head())
# len(votos_2012)

# print("\nVotação 2016:")
# display(votos_2016.head())
# len(votos_2016)

# print("\nVotação 2020:")
# display(votos_2020.head())
# len(votos_2020)

In [548]:
# # Função auxiliar para inspecionar as bases de dados
# def resumo_dataset(nome, dataset):
#     print(f"Resumo do dataset: {nome}")
#     print("-" * 50)
#     print(f"Dimensões: {dataset.shape}")
#     print("\nTipos de dados:")
#     print(dataset.dtypes)
#     print("\nDados faltantes:")
#     print(dataset.isnull().sum())
#     print("\nAmostra:")

# # Inspecionando cada dataset
# resumo_dataset("Candidatos 2012", cand_2012)
# resumo_dataset("Candidatos 2016", cand_2016)
# resumo_dataset("Candidatos 2020", cand_2020)

# resumo_dataset("Votação 2012", votos_2012)
# resumo_dataset("Votação 2016", votos_2016)
# resumo_dataset("Votação 2020", votos_2020)

In [549]:
# Selecionando colunas relevantes dos datasets de candidatos
colunas_candidatos = [
    "SQ_CANDIDATO",      # Número sequencial da candidato(a)  
    "ANO_ELEICAO",       # Ano da eleição
    "SG_UE",             # Sigla da Unidade Eleitoral
    "NM_UE",             # Nome da Unidade Eleitoral
    "CD_CARGO",          # Código do cargo
    "DS_CARGO",          # Descrição do cargo
    "NM_CANDIDATO",      # Nome completo do candidato
    "CD_GENERO",         # Código do gênero
    "DS_GENERO",         # Descrição do gênero
    "CD_GRAU_INSTRUCAO", # Código do grau de instrução
    "DS_GRAU_INSTRUCAO", # Descrição do grau de instrução
    "CD_COR_RACA",       # Código da cor/raça 1:BRANCA 2:PRETA 3:PARDA 4:AMARELA 5:INDIGENA 6:NAO INFORMADO
    "DS_COR_RACA"        # Descrição da cor/raça da candidata ou candidato
]

cand_2012 = cand_2012[colunas_candidatos]
cand_2016 = cand_2016[colunas_candidatos]
cand_2020 = cand_2020[colunas_candidatos]

# Exibindo as dimensões após a seleção
print(f"Candidatos 2012: {cand_2012.shape}")
print(f"Candidatos 2016: {cand_2016.shape}")
print(f"Candidatos 2020: {cand_2020.shape}")

Candidatos 2012: (29079, 13)
Candidatos 2016: (28934, 13)
Candidatos 2020: (33611, 13)


In [550]:
# Selecionando colunas relevantes dos datasets de votação
colunas_votacao = [
    "SQ_CANDIDATO",     # Número sequencial da candidato(a) 
    "ANO_ELEICAO",      # Ano da eleição
    "SG_UE",            # Sigla da Unidade Eleitoral
    "NM_UE",            # Nome da Unidade Eleitoral
    "CD_CARGO",         # Código do cargo
    "DS_CARGO",         # Descrição do cargo
    "SQ_CANDIDATO",     # Sequencial do candidato
    "NM_CANDIDATO",     # Nome completo do candidato
    "QT_VOTOS_NOMINAIS" # Quantidade de votos nominais
]

votos_2012 = votos_2012[colunas_votacao]
votos_2016 = votos_2016[colunas_votacao]
votos_2020 = votos_2020[colunas_votacao]


print(f"Votação 2012: {votos_2012.shape}")
print(f"Votação 2016: {votos_2016.shape}")
print(f"Votação 2020: {votos_2020.shape}")


Votação 2012: (37468, 9)
Votação 2016: (37234, 9)
Votação 2020: (44541, 9)


In [551]:
# Função para verificar valores nulos em um DataFrame
def tratar_valores_nulos(dataset, nome, colunas_essenciais):
    print(f"Tratando valores nulos no dataset: {nome}")
    print("-" * 50)
    
    # Contando valores nulos por coluna
    print("Quantidade de valores nulos por coluna:")
    print(dataset.isnull().sum())
    
    # Remover linhas com valores nulos nas colunas essenciais
    dataset = dataset.dropna(subset=colunas_essenciais)
    print(f"\nApós remoção de valores nulos, dimensões: {dataset.shape}")
    print("=" * 50, "\n")
    
    return dataset

# Colunas essenciais para os datasets de votação
colunas_essenciais_votacao = ["SQ_CANDIDATO", "DS_CARGO", "NM_CANDIDATO", "QT_VOTOS_NOMINAIS"]

# Colunas essenciais para os datasets de candidatos
colunas_essenciais_candidatos = ["SQ_CANDIDATO", "DS_CARGO", "NM_CANDIDATO", "DS_GRAU_INSTRUCAO"]

# Aplicando a função para os datasets de votação
votos_2012 = tratar_valores_nulos(votos_2012, "Votação 2012", colunas_essenciais_votacao)
votos_2016 = tratar_valores_nulos(votos_2016, "Votação 2016", colunas_essenciais_votacao)
votos_2020 = tratar_valores_nulos(votos_2020, "Votação 2020", colunas_essenciais_votacao)

# Aplicando a função para os datasets de candidatos
cand_2012 = tratar_valores_nulos(cand_2012, "Candidatos 2012", colunas_essenciais_candidatos)
cand_2016 = tratar_valores_nulos(cand_2016, "Candidatos 2016", colunas_essenciais_candidatos)
cand_2020 = tratar_valores_nulos(cand_2020, "Candidatos 2020", colunas_essenciais_candidatos)


Tratando valores nulos no dataset: Votação 2012
--------------------------------------------------
Quantidade de valores nulos por coluna:
SQ_CANDIDATO         0
ANO_ELEICAO          0
SG_UE                0
NM_UE                0
CD_CARGO             0
DS_CARGO             0
SQ_CANDIDATO         0
NM_CANDIDATO         0
QT_VOTOS_NOMINAIS    0
dtype: int64

Após remoção de valores nulos, dimensões: (37468, 9)

Tratando valores nulos no dataset: Votação 2016
--------------------------------------------------
Quantidade de valores nulos por coluna:
SQ_CANDIDATO         0
ANO_ELEICAO          0
SG_UE                0
NM_UE                0
CD_CARGO             0
DS_CARGO             0
SQ_CANDIDATO         0
NM_CANDIDATO         0
QT_VOTOS_NOMINAIS    0
dtype: int64

Após remoção de valores nulos, dimensões: (37234, 9)

Tratando valores nulos no dataset: Votação 2020
--------------------------------------------------
Quantidade de valores nulos por coluna:
SQ_CANDIDATO         0
ANO_ELEICA

In [552]:
# Função para transformar todo o DataFrame em maiúsculas
def converter_para_upper(df):
    return df.applymap(lambda x: x.upper() if isinstance(x, str) else x)

# Convertendo todos os DataFrames para maiúsculas
cand_2012 = converter_para_upper(cand_2012)
cand_2016 = converter_para_upper(cand_2016)
cand_2020 = converter_para_upper(cand_2020)

votos_2012 = converter_para_upper(votos_2012)
votos_2016 = converter_para_upper(votos_2016)
votos_2020 = converter_para_upper(votos_2020)

  return df.applymap(lambda x: x.upper() if isinstance(x, str) else x)


In [553]:
# Filtrando os dados para o município de Porto Alegre e os cargos Vereador e Prefeito
municipio = "PORTO ALEGRE"
cargos = ["VEREADOR", "PREFEITO"]

# Aplicando os filtros nos datasets de candidatos
cand_2012 = cand_2012[(cand_2012["NM_UE"] == municipio) & (cand_2012["DS_CARGO"].isin(cargos))]
cand_2016 = cand_2016[(cand_2016["NM_UE"] == municipio) & (cand_2016["DS_CARGO"].isin(cargos))]
cand_2020 = cand_2020[(cand_2020["NM_UE"] == municipio) & (cand_2020["DS_CARGO"].isin(cargos))]

# Aplicando os filtros nos datasets de votação
votos_2012 = votos_2012[(votos_2012["NM_UE"] == municipio) & (votos_2012["DS_CARGO"].isin(cargos))]
votos_2016 = votos_2016[(votos_2016["NM_UE"] == municipio) & (votos_2016["DS_CARGO"].isin(cargos))]
votos_2020 = votos_2020[(votos_2020["NM_UE"] == municipio) & (votos_2020["DS_CARGO"].isin(cargos))]

# Exibindo as dimensões após o filtro
print(f"Candidatos 2012: {cand_2012.shape}")
print(f"Candidatos 2016: {cand_2016.shape}")
print(f"Candidatos 2020: {cand_2020.shape}")

print(f"Votação 2012: {votos_2012.shape}")
print(f"Votação 2016: {votos_2016.shape}")
print(f"Votação 2020: {votos_2020.shape}")

Candidatos 2012: (607, 13)
Candidatos 2016: (611, 13)
Candidatos 2020: (881, 13)
Votação 2012: (5760, 9)
Votação 2016: (5620, 9)
Votação 2020: (8470, 9)


In [554]:
print(f"Duplicatas em candidatos 2012: {cand_2012.duplicated(subset='SQ_CANDIDATO').sum()}")
print(f"Duplicatas em candidatos 2016: {cand_2016.duplicated(subset='SQ_CANDIDATO').sum()}")
print(f"Duplicatas em candidatos 2020: {cand_2020.duplicated(subset='SQ_CANDIDATO').sum()}")

Duplicatas em candidatos 2012: 0
Duplicatas em candidatos 2016: 2
Duplicatas em candidatos 2020: 2


In [555]:
# Função para identificar e exibir linhas duplicadas
def exibir_duplicatas(df, nome):
    duplicatas = df[df.duplicated(keep=False)]  # Mantém todas as duplicatas, incluindo a primeira ocorrência
    print(f"\nDuplicatas no DataFrame {nome}:")
    if duplicatas.empty:
        print("Nenhuma duplicata encontrada.")
    else:
        display(duplicatas)
    return duplicatas

# Verificando duplicatas em candidatos
duplicatas_cand_2012 = exibir_duplicatas(cand_2012, "Candidatos 2012")
duplicatas_cand_2016 = exibir_duplicatas(cand_2016, "Candidatos 2016")
duplicatas_cand_2020 = exibir_duplicatas(cand_2020, "Candidatos 2020")


Duplicatas no DataFrame Candidatos 2012:
Nenhuma duplicata encontrada.

Duplicatas no DataFrame Candidatos 2016:


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,NM_CANDIDATO,CD_GENERO,DS_GENERO,CD_GRAU_INSTRUCAO,DS_GRAU_INSTRUCAO,CD_COR_RACA,DS_COR_RACA
8063,210000011191,2016,88013,PORTO ALEGRE,11,PREFEITO,SEBASTIÃO DE ARAUJO MELO,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA
16803,210000029381,2016,88013,PORTO ALEGRE,11,PREFEITO,NELSON MARCHEZAN JUNIOR,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA
24188,210000029381,2016,88013,PORTO ALEGRE,11,PREFEITO,NELSON MARCHEZAN JUNIOR,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA
24582,210000011191,2016,88013,PORTO ALEGRE,11,PREFEITO,SEBASTIÃO DE ARAUJO MELO,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA



Duplicatas no DataFrame Candidatos 2020:


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,NM_CANDIDATO,CD_GENERO,DS_GENERO,CD_GRAU_INSTRUCAO,DS_GRAU_INSTRUCAO,CD_COR_RACA,DS_COR_RACA
3451,210000668382,2020,88013,PORTO ALEGRE,11,PREFEITO,SEBASTIÃO DE ARAÚJO MELO,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA
7692,210000729170,2020,88013,PORTO ALEGRE,11,PREFEITO,MANUELA PINTO VIEIRA D AVILA,4,FEMININO,8,SUPERIOR COMPLETO,1,BRANCA
28608,210000729170,2020,88013,PORTO ALEGRE,11,PREFEITO,MANUELA PINTO VIEIRA D AVILA,4,FEMININO,8,SUPERIOR COMPLETO,1,BRANCA
32854,210000668382,2020,88013,PORTO ALEGRE,11,PREFEITO,SEBASTIÃO DE ARAÚJO MELO,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA


In [556]:
# Removendo duplicatas nos datasets de candidatos (baseado na coluna SQ_CANDIDATO)
cand_2012 = cand_2012.drop_duplicates(subset="SQ_CANDIDATO", keep="first")  # Mantém a primeira ocorrência
cand_2016 = cand_2016.drop_duplicates(subset="SQ_CANDIDATO", keep="first")  # Mantém a primeira ocorrência
cand_2020 = cand_2020.drop_duplicates(subset="SQ_CANDIDATO", keep="first")  # Mantém a primeira ocorrência

# Exibindo as dimensões após a remoção de duplicatas
print(f"Candidatos 2012 após remoção de duplicatas: {cand_2012.shape}")
print(f"Candidatos 2016 após remoção de duplicatas: {cand_2016.shape}")
print(f"Candidatos 2020 após remoção de duplicatas: {cand_2020.shape}")


Candidatos 2012 após remoção de duplicatas: (607, 13)
Candidatos 2016 após remoção de duplicatas: (609, 13)
Candidatos 2020 após remoção de duplicatas: (879, 13)


In [560]:
# Exibindo algumas linhas dos datasets de candidatos filtrados
print("Candidatos 2012 (amostra):")
display(cand_2012)

print("\nCandidatos 2016 (amostra):")
display(cand_2016.head())

print("\nCandidatos 2020 (amostra):")
display(cand_2020.head())

# Exibindo algumas linhas dos datasets de votação filtrados
print("\nVotação 2012 (amostra):")
display(votos_2012.head())

print("\nVotação 2016 (amostra):")
display(votos_2016.head())

print("\nVotação 2020 (amostra):")
display(votos_2020.head())

Candidatos 2012 (amostra):


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,NM_CANDIDATO,CD_GENERO,DS_GENERO,CD_GRAU_INSTRUCAO,DS_GRAU_INSTRUCAO,CD_COR_RACA,DS_COR_RACA
17,210000017170,2012,88013,PORTO ALEGRE,13,VEREADOR,JOEL FRANCISCO SOARES VIEIRA JUNIOR,2,MASCULINO,5,ENSINO MÉDIO INCOMPLETO,-3,#NE#
42,210000000379,2012,88013,PORTO ALEGRE,13,VEREADOR,ELIZABETH DOS SANTOS MASERA,4,FEMININO,8,SUPERIOR COMPLETO,-3,#NE#
46,210000000393,2012,88013,PORTO ALEGRE,13,VEREADOR,LUÍS ANDRÉ BLANCO MACHADO,2,MASCULINO,6,ENSINO MÉDIO COMPLETO,-3,#NE#
77,210000029793,2012,88013,PORTO ALEGRE,13,VEREADOR,LUCIANO VIEIRA BATISTA,2,MASCULINO,7,SUPERIOR INCOMPLETO,-3,#NE#
98,210000010626,2012,88013,PORTO ALEGRE,13,VEREADOR,MARCELO FRANCISCO CHIODO,2,MASCULINO,6,ENSINO MÉDIO COMPLETO,-3,#NE#
...,...,...,...,...,...,...,...,...,...,...,...,...,...
28984,210000035751,2012,88013,PORTO ALEGRE,13,VEREADOR,MARIA DA CONCEIÇÃO CASTRO FAGUNDES,4,FEMININO,8,SUPERIOR COMPLETO,-3,#NE#
29019,210000010186,2012,88013,PORTO ALEGRE,11,PREFEITO,JOSÉ ALBERTO REUS FORTUNATI,2,MASCULINO,8,SUPERIOR COMPLETO,-3,#NE#
29043,210000000439,2012,88013,PORTO ALEGRE,13,VEREADOR,CATARINA DE FÁTIMA OLIVEIRA,4,FEMININO,8,SUPERIOR COMPLETO,-3,#NE#
29065,210000017194,2012,88013,PORTO ALEGRE,13,VEREADOR,PERICLES MACHADO DA SILVA,2,MASCULINO,4,ENSINO FUNDAMENTAL COMPLETO,-3,#NE#



Candidatos 2016 (amostra):


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,NM_CANDIDATO,CD_GENERO,DS_GENERO,CD_GRAU_INSTRUCAO,DS_GRAU_INSTRUCAO,CD_COR_RACA,DS_COR_RACA
86,210000024710,2016,88013,PORTO ALEGRE,13,VEREADOR,LUIZ FERNANDO NOBIA MARTINS,2,MASCULINO,6,ENSINO MÉDIO COMPLETO,1,BRANCA
212,210000031600,2016,88013,PORTO ALEGRE,13,VEREADOR,DANIEL FORTES VELASQUES,2,MASCULINO,4,ENSINO FUNDAMENTAL COMPLETO,1,BRANCA
264,210000024649,2016,88013,PORTO ALEGRE,13,VEREADOR,MARISE DE OLIVEIRA GOMES,4,FEMININO,8,SUPERIOR COMPLETO,2,PRETA
267,210000024695,2016,88013,PORTO ALEGRE,13,VEREADOR,VINICIUS KASTER,2,MASCULINO,8,SUPERIOR COMPLETO,1,BRANCA
284,210000031068,2016,88013,PORTO ALEGRE,13,VEREADOR,SERGIO DA SILVA FALCAO,2,MASCULINO,7,SUPERIOR INCOMPLETO,1,BRANCA



Candidatos 2020 (amostra):


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,NM_CANDIDATO,CD_GENERO,DS_GENERO,CD_GRAU_INSTRUCAO,DS_GRAU_INSTRUCAO,CD_COR_RACA,DS_COR_RACA
8,210001183571,2020,88013,PORTO ALEGRE,13,VEREADOR,MARCIO RENATO REGINATTO,2,MASCULINO,5,ENSINO MÉDIO INCOMPLETO,1,BRANCA
22,210000961013,2020,88013,PORTO ALEGRE,13,VEREADOR,SIMONE DA CUNHA PEIXOTO,4,FEMININO,2,LÊ E ESCREVE,1,BRANCA
24,210000728292,2020,88013,PORTO ALEGRE,13,VEREADOR,RAQUEL FRAGA FERREIRA,4,FEMININO,6,ENSINO MÉDIO COMPLETO,1,BRANCA
29,210000961042,2020,88013,PORTO ALEGRE,13,VEREADOR,SIMON JONATHAN WOLK,2,MASCULINO,2,LÊ E ESCREVE,1,BRANCA
353,210000668051,2020,88013,PORTO ALEGRE,13,VEREADOR,CINTIA ELISABETE DOS SANTOS FERREIRA,4,FEMININO,6,ENSINO MÉDIO COMPLETO,3,PARDA



Votação 2012 (amostra):


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,SQ_CANDIDATO.1,NM_CANDIDATO,QT_VOTOS_NOMINAIS
20736,210000032915,2012,88013,PORTO ALEGRE,11,PREFEITO,210000032915,ÉRICO RONI MASLINKIEWICZ CORRÊA,601
20737,210000010186,2012,88013,PORTO ALEGRE,11,PREFEITO,210000010186,JOSÉ ALBERTO REUS FORTUNATI,53077
20738,210000029973,2012,88013,PORTO ALEGRE,11,PREFEITO,210000029973,JOCELIN AZAMBUJA,785
20739,210000000258,2012,88013,PORTO ALEGRE,11,PREFEITO,210000000258,MANUELA PINTO VIEIRA D AVILA,12416
20740,210000018590,2012,88013,PORTO ALEGRE,11,PREFEITO,210000018590,CARLOS ROBERTO DE SOUZA ROBAINA,4660



Votação 2016 (amostra):


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,SQ_CANDIDATO.1,NM_CANDIDATO,QT_VOTOS_NOMINAIS
20618,210000025583,2016,88013,PORTO ALEGRE,11,PREFEITO,210000025583,FABIO MAIA OSTERMANN,825
20619,210000027920,2016,88013,PORTO ALEGRE,11,PREFEITO,210000027920,JOÃO CARLOS MENDONÇA RODRIGUES,67
20620,210000018056,2016,88013,PORTO ALEGRE,11,PREFEITO,210000018056,JULIO CEZAR LEIRIAS FLORES,255
20621,210000006927,2016,88013,PORTO ALEGRE,11,PREFEITO,210000006927,LUCIANA KREBS GENRO,10598
20622,210000030973,2016,88013,PORTO ALEGRE,11,PREFEITO,210000030973,MARCELO FRANCISCO CHIODO,647



Votação 2020 (amostra):


Unnamed: 0,SQ_CANDIDATO,ANO_ELEICAO,SG_UE,NM_UE,CD_CARGO,DS_CARGO,SQ_CANDIDATO.1,NM_CANDIDATO,QT_VOTOS_NOMINAIS
154,210000729106,2020,88013,PORTO ALEGRE,13,VEREADOR,210000729106,DIONÊS GABANA DE SOUZA,31
155,210000729106,2020,88013,PORTO ALEGRE,13,VEREADOR,210000729106,DIONÊS GABANA DE SOUZA,18
156,210000729106,2020,88013,PORTO ALEGRE,13,VEREADOR,210000729106,DIONÊS GABANA DE SOUZA,215
157,210000729106,2020,88013,PORTO ALEGRE,13,VEREADOR,210000729106,DIONÊS GABANA DE SOUZA,19
158,210000729106,2020,88013,PORTO ALEGRE,13,VEREADOR,210000729106,DIONÊS GABANA DE SOUZA,11


In [558]:
import os

# Criando a estrutura de pastas: dados_tratados/candidatos_tratados e dados_tratados/resultados_tratados
os.makedirs("dados_tratados/candidatos_tratados", exist_ok=True)
os.makedirs("dados_tratados/resultados_tratados", exist_ok=True)

# Salvando os dados de candidatos na subpasta 'candidatos_tratados'
cand_2012.to_csv("dados_tratados/candidatos_tratados/cand_votos_2012_tratado.csv", index=False, encoding="utf-8")
cand_2016.to_csv("dados_tratados/candidatos_tratados/cand_votos_2016_tratado.csv", index=False, encoding="utf-8")
cand_2020.to_csv("dados_tratados/candidatos_tratados/cand_votos_2020_tratado.csv", index=False, encoding="utf-8")

# Salvando os dados de votação na subpasta 'resultados_tratados'
votos_2012.to_csv("dados_tratados/resultados_tratados/votos_2012_tratado.csv", index=False, encoding="utf-8")
votos_2016.to_csv("dados_tratados/resultados_tratados/votos_2016_tratado.csv", index=False, encoding="utf-8")
votos_2020.to_csv("dados_tratados/resultados_tratados/votos_2020_tratado.csv", index=False, encoding="utf-8")

print("Arquivos CSV salvos com sucesso na estrutura 'dados_tratados/candidatos_tratados' e 'dados_tratados/resultados_tratados'!")

Arquivos CSV salvos com sucesso na estrutura 'dados_tratados/candidatos_tratados' e 'dados_tratados/resultados_tratados'!
