# Análise de dados eleições Camaragibe 2024
Esse pequeno projeto tem o objetivo de auxiliar no tratamento de dados na pesquisa eleitoral do município de Camaragibe 2024. O tratamento de dados era feito, diariamente, por meio de aplicações de filtros manuais em diversas planilhas, esse projeto tem objetivo de melhorar essa feitoria, automatizando a filtragem e tratamento desses dados referente as perguntas e respostas adequadas. Observe que o dataset usado é em formato .xlsx (excel), formato fornecido pelo ambiente da pesquisa.

## Base de dados
A base de dados usada é composta por cerca de 24 perguntas, posteriomente processadas, como resultados temos um resultado indicando a quantidade e porcentagem de cada variável do bloco relacionado a pesquisa.

In [207]:
import pandas as pd
df = pd.read_excel("src/CAMARAGIBE - INABI - 06.09.xlsx", sheet_name="DADOS")

### 1. Sexo
Pergunta relacionada ao sexo do entrevistado. Feminino ou Masculino.

In [208]:
#1. Sexo
def sexo(coluna="1. SEXO"):
  # Tratamento geral das linhas vazias
  sexo = df[coluna].value_counts()
  valor_mais_frequente = sexo.idxmax()
  df[coluna] = df[coluna].fillna(valor_mais_frequente)

  contagem_sexo = df[coluna].value_counts()
  porcentagem_sexo = (df[coluna].value_counts(normalize = True) * 100).round(2)
  
  # Exibição em tabela
  resultado = pd.DataFrame({
      'Contagem': contagem_sexo,
      'Porcentagem': porcentagem_sexo.astype(str) + '%'
  })
    
  # Adicionar a linha do total
  total_contagem = contagem_sexo.sum()
  total_porcentagem = porcentagem_sexo.sum()

  if (total_porcentagem != 100.00):
    ajuste = 100.00 - total_porcentagem
    total_porcentagem += ajuste

  resultado.loc['Total'] = [total_contagem, f'{total_porcentagem:.2f}%']

  return resultado

sexo()

Unnamed: 0_level_0,Contagem,Porcentagem
1. SEXO,Unnamed: 1_level_1,Unnamed: 2_level_1
FEMININO,33,58.93%
MASCULINO,23,41.07%
Total,56,100.00%


### 2. Faixa etaria
Pergunta referente a faixa etária do entrevistado. Faixas etárias:
- 16 a 24 anos
- 25 a 34 anos
- 35 a 44 anos
- 45 a 59 anos
- 60 a 69 anos
- mais de 70 anos

In [209]:
def faixa_etaria(coluna = "2. FAIXA ETÁRIA"):
  # Tratamento geral das linhas vazias
  faixa_etaria = df[coluna].value_counts()
  valor_mais_frequente = faixa_etaria.idxmax()
  df[coluna] = df[coluna].fillna(valor_mais_frequente)

  contagem_faixa_etaria = df[coluna].value_counts()
  porcentagem_faixa_etaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

  # Exibir Tabela
  resultado = pd.DataFrame({
      "contagem": contagem_faixa_etaria,
      "porcentagem": porcentagem_faixa_etaria.astype(str) + "%"
  })

  # Adiciona a linha do total
  total_contagem = contagem_faixa_etaria.sum()
  total_porcentagem = porcentagem_faixa_etaria.sum()

  if (total_porcentagem != 100.00):
    ajuste = 100.00 - total_porcentagem
    total_porcentagem += ajuste

  resultado.loc['Total'] = [total_contagem, f'{total_porcentagem:.2f}%']

  return resultado

faixa_etaria()

Unnamed: 0_level_0,contagem,porcentagem
2. FAIXA ETÁRIA,Unnamed: 1_level_1,Unnamed: 2_level_1
45 A 59 ANOS,15,26.79%
MAIS DE 70 ANOS,13,23.21%
60 A 69 ANOS,9,16.07%
25 A 34 ANOS,7,12.5%
16 A 24 ANOS,7,12.5%
35 A 44 ANOS,5,8.93%
Total,56,100.00%


### 3. Escolaridade
Pergunta referente a escolaridade do entrevistado. Respostas:


In [210]:
def escolaridade(coluna = "3. ESCOLARIDADE"):
  # Tratamento geral das linhas vazias
  escolaridade = df[coluna].value_counts()
  valor_mais_frequente = escolaridade.idxmax()
  df[coluna] = df[coluna].fillna(valor_mais_frequente)

  contagem_escolaridade = df[coluna].value_counts()
  porcentagem_escolaridade = (df[coluna].value_counts(normalize = True) * 100).round(2)

  # Exibir Tabela
  resultado = pd.DataFrame({
      "contagem": contagem_escolaridade,
      "porcentagem": porcentagem_escolaridade.astype(str) + "%"
  })

  # Adiciona a linha do total
  total_contagem = contagem_escolaridade.sum()
  total_porcentagem = porcentagem_escolaridade.sum()
    
  if (total_porcentagem != 100.00):
    ajuste = 100.00 - total_porcentagem
    total_porcentagem += ajuste

  resultado.loc['Total'] = [total_contagem, f'{total_porcentagem:.2f}%']

  return resultado

escolaridade()

Unnamed: 0_level_0,contagem,porcentagem
3. ESCOLARIDADE,Unnamed: 1_level_1,Unnamed: 2_level_1
MÉDIO INCOMPLETO/COMPLETO,31,55.36%
FUNDAMENTAL INCOMPLETO/COMPLETO,15,26.79%
SUPERIOR INCOMPLETO/COMPLETO,8,14.29%
ANALFABETO/LÊ E ESCREVE,2,3.57%
Total,56,100.00%


### 4. COMO VOCÊ CLASSIFICARIA O SEU INTERESSE NAS ELEIÇÕES MUNICIPAIS DESTE ANO?

In [211]:
def classificacao_interesse(coluna = "4. COMO VOCÊ CLASSIFICARIA O SEU INTERESSE NAS ELEIÇÕES MUNICIPAIS DESTE ANO? (RU ESTIMULADA)"):
    # Tratamento geral das linhas vazias
    interesse = df[coluna].value_counts()
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_interesse = df[coluna].value_counts()
    porcentagem_interesse = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibir tabela 
    resultado = pd.DataFrame({
        "contagem": contagem_interesse,
        "porcentagem": porcentagem_interesse.astype(str) + "%"
    })

    # Linha Total
    total_contagem = contagem_interesse.sum()
    total_porcentagem = porcentagem_interesse.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

classificacao_interesse()

Unnamed: 0_level_0,contagem,porcentagem
4. COMO VOCÊ CLASSIFICARIA O SEU INTERESSE NAS ELEIÇÕES MUNICIPAIS DESTE ANO? (RU ESTIMULADA),Unnamed: 1_level_1,Unnamed: 2_level_1
INTERESSADO,17,30.36%
POUCO INTERESSADO,15,26.79%
DESINTERESSADO,11,19.64%
MUITO INTERESSADO,10,17.86%
NÃO SABE/NÃO RESPONDEU,3,5.36%
Total,56,100.00%


### 5. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSE HOJE, EM QUAL CANDIDATO VOCÊ VOTARIA?

In [212]:
def eleicoes_prefeito_hoje_votaria(coluna = "5. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSE HOJE, EM QUAL CANDIDATO VOCÊ VOTARIA? (RU ESPONTÂNEA)"):
    # Tratamento de variáveis
    substituicoes = {
        "DIEGO CABRAL": ["diego", "cabral", "diego cabral", "diego alves"],
        "JORGE ALEXANDRE": ["jorge", "jorge alexandre", "alexandre"],
        "FELIPE DANTAS": ["felipe", "dantas", "felipe dantas"],
        "BOSCO": ["bosco"],
        "NENHUM": ["não", "nulo", "NENHUM"],
        "NÃO SABE": ["não sabe", "nao opnou", "nao opinou"]
    }
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NENHUM")

    # Aplicando a substituição
    for candidato in df[coluna]:
        if (candidato.lower().strip() in substituicoes["DIEGO CABRAL"]):
            df[coluna] = df[coluna].replace(candidato, "DIEGO CABRAL")

        elif (candidato.lower().strip() in substituicoes["JORGE ALEXANDRE"]):
            df[coluna] = df[coluna].replace(candidato, "JORGE ALEXANDRE")

        elif (candidato.lower().strip() in substituicoes["FELIPE DANTAS"]):
            df[coluna] = df[coluna].replace(candidato, "FELIPE DANTAS")

        elif (candidato.lower().strip() in substituicoes["BOSCO"]):
            df[coluna] = df[coluna].replace(candidato, "BOSCO")

        elif (candidato.lower().strip() in substituicoes["NENHUM"]):
            df[coluna] = df[coluna].replace(candidato, "NENHUM")

        elif (candidato.lower().strip() in substituicoes["NÃO SABE"]):
            df[coluna] = df[coluna].replace(candidato, "NÃO SABE/NÃO RESPONDEU")
        
    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

eleicoes_prefeito_hoje_votaria()

Unnamed: 0_level_0,contagem,porcentagem
"5. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSE HOJE, EM QUAL CANDIDATO VOCÊ VOTARIA? (RU ESPONTÂNEA)",Unnamed: 1_level_1,Unnamed: 2_level_1
DIEGO CABRAL,22,39.29%
JORGE ALEXANDRE,14,25.0%
NENHUM,7,12.5%
FELIPE DANTAS,7,12.5%
NÃO SABE/NÃO RESPONDEU,6,10.71%
Total,56,100.00%


### 6. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUAIS DESSES CANDIDATOS VOCÊ VOTARIA?

In [213]:
def eleicoes_hoje_prefeito(coluna = "6. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUAIS DESSES CANDIDATOS VOCÊ VOTARIA? (RU ESTIMULADA)"):
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste


    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

eleicoes_hoje_prefeito()

Unnamed: 0_level_0,contagem,porcentagem
"6. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUAIS DESSES CANDIDATOS VOCÊ VOTARIA? (RU ESTIMULADA)",Unnamed: 1_level_1,Unnamed: 2_level_1
DIEGO CABRAL,24,42.86%
JORGE ALEXANDRE,14,25.0%
NÃO SABE/NÃO RESPONDEU,7,12.5%
FELIPE DANTAS,6,10.71%
NENHUM DELES,4,7.14%
BOSCO,1,1.79%
Total,56,100.00%


### 7. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE ESTEJA MAIS PREPARADO PARA SER PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)

In [214]:
def quem_acredita_mais_preparado(coluna = "7. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE ESTEJA MAIS PREPARADO PARA SER PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)"):
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()

    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste


    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

quem_acredita_mais_preparado()

Unnamed: 0_level_0,contagem,porcentagem
"7. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE ESTEJA MAIS PREPARADO PARA SER PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)",Unnamed: 1_level_1,Unnamed: 2_level_1
DIEGO CABRAL,24,42.86%
JORGE ALEXANDRE,13,23.21%
NÃO SABE/NÃO RESPONDEU,7,12.5%
FELIPE DANTAS,7,12.5%
NENHUM DELES,4,7.14%
BOSCO,1,1.79%
Total,56,100.00%


### 8. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE GANHARÁ A ELEIÇÃO PARA PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)

In [215]:
def quem_acredita_vai_ganhar(coluna = "8. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE GANHARÁ A ELEIÇÃO PARA PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)"):
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()

    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste


    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

quem_acredita_vai_ganhar()

Unnamed: 0_level_0,contagem,porcentagem
"8. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE GANHARÁ A ELEIÇÃO PARA PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)",Unnamed: 1_level_1,Unnamed: 2_level_1
DIEGO CABRAL,24,42.86%
JORGE ALEXANDRE,13,23.21%
FELIPE DANTAS,7,12.5%
NÃO SABE/NÃO RESPONDEU,6,10.71%
NENHUM DELES,5,8.93%
BOSCO,1,1.79%
Total,56,100.00%


### 9. EM RELAÇÃO A SUA INTENÇÃO DE VOTO PARA PREFEITO DE CAMARAGIBE, HOJE VOCÊ DIRIA QUE: (RU ESTIMULADA)

In [216]:
def relacao_intencao (coluna = "9. EM RELAÇÃO A SUA INTENÇÃO DE VOTO PARA PREFEITO DE CAMARAGIBE, HOJE VOCÊ DIRIA QUE: (RU ESTIMULADA)"):
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()

    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste


    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

relacao_intencao()

Unnamed: 0_level_0,contagem,porcentagem
"9. EM RELAÇÃO A SUA INTENÇÃO DE VOTO PARA PREFEITO DE CAMARAGIBE, HOJE VOCÊ DIRIA QUE: (RU ESTIMULADA)",Unnamed: 1_level_1,Unnamed: 2_level_1
"É DEFINITIVA, NÃO MUDAREI DE OPINIÃO",47,83.93%
NÃO SABE/NÃO RESPONDEU,4,7.14%
"NÃO É DEFINITIVA, MUDAREI DE OPINIÃO",4,7.14%
TALVEZ MUDAREI DE OPINIÃO,1,1.79%
Total,56,100.00%


### 10. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE DIEGO CABRAL, VOCÊ DIRIA QUE: (RU ESTIMULADA)

In [217]:
def sobre_candidatura_diego_cabral(coluna = "10. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE DIEGO CABRAL, VOCÊ DIRIA QUE: (RU ESTIMULADA)"):
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()

    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste


    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

sobre_candidatura_diego_cabral()

Unnamed: 0_level_0,contagem,porcentagem
"10. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE DIEGO CABRAL, VOCÊ DIRIA QUE: (RU ESTIMULADA)",Unnamed: 1_level_1,Unnamed: 2_level_1
VOTARIA COM CERTEZA,22,39.29%
NÃO SABE/NÃO RESPONDEU,15,26.79%
TALVEZ VOTARIA,7,12.5%
NÃO O CONHECE O SUFICIENTE PARA OPINAR,6,10.71%
NÃO VOTARIA DE JEITO NENHUM,6,10.71%
Total,56,100.00%


### 11. (EXCETO PARA QUEM NÃO CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE DIEGO CABRAL: (RU ESTIMULADA){

In [218]:
def imagem_possitiva_negativa_diego_cabral(coluna = "11. (EXCETO PARA QUEM NÃO CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE DIEGO CABRAL: (RU ESTIMULADA)"):
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem_votaria = df[coluna].value_counts()
    porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem_votaria,
        "porcentagem": porcentagem_votaria.astype(str) + "%"
    })

    # Total
    total_contagem = contagem_votaria.sum()
    total_porcentagem = porcentagem_votaria.sum()

    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste


    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    
    return resultado

imagem_possitiva_negativa_diego_cabral()

Unnamed: 0_level_0,contagem,porcentagem
11. (EXCETO PARA QUEM NÃO CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE DIEGO CABRAL: (RU ESTIMULADA),Unnamed: 1_level_1,Unnamed: 2_level_1
POSITIVA,24,42.86%
NEM POSITIVA NEM NEGATIVA,18,32.14%
NÃO SABE/NÃO RESPONDEU,12,21.43%
NEGATIVA,2,3.57%
Total,56,100.00%
