# Análise de dados eleições Camaragibe 2024
Esse pequeno projeto tem o objetivo de auxiliar no tratamento de dados na pesquisa eleitoral do município de Camaragibe 2024. O tratamento de dados era feito, diariamente, por meio de aplicações de filtros manuais em diversas planilhas, esse projeto tem objetivo de melhorar essa feitoria, automatizando a filtragem e tratamento desses dados referente as perguntas e respostas adequadas. Observe que o dataset usado é em formato .xlsx (excel), formato fornecido pelo ambiente da pesquisa.

## Base de dados
A base de dados usada é composta por cerca de 24 perguntas, posteriomente processadas, como resultados temos um resultado indicando a quantidade e porcentagem de cada variável do bloco relacionado a pesquisa.

In [714]:
import os
import pandas as pd

nomeArquivo = "CAMARAGIBE - SANTANA - 10.09.xlsx"
df = pd.read_excel(f"src/{nomeArquivo}", sheet_name = "DADOS")

substituicoes = {
        "DIEGO CABRAL": ["diego", "cabral", "diego cabral", "diego alves"],
        "JORGE ALEXANDRE": ["jorge", "jorge alexandre", "alexandre"],
        "FELIPE DANTAS": ["felipe", "dantas", "felipe dantas"],
        "BOSCO": ["bosco"],
        "NENHUM": ["não", "nulo", "nenhum"],
        "NÃO SABE": ["não sabe", "nao opnou", "nao opinou", "ñ sei"]
    }

ordem_candidatos = [
      "DIEGO CABRAL",
      "JORGE ALEXANDRE",
      "BOSCO",
      "FELIPE DANTAS",
      "NÃO SABE/NÃO RESPONDEU",
      "NENHUM DELES"
  ]

ordem_interesse = [
    "INTERESSADO",
    "MUITO INTERESSADO",
    "DESINTERESSADO",
    "POUCO INTERESSADO",
    "NÃO SABE/NÃO RESPONDEU"
    ]

ordem_diria_sobre = [
    "VOTARIA COM CERTEZA", 
    "TALVEZ VOTARIA", 
    "NÃO O CONHECE O SUFICIENTE PARA OPINAR", 
    "NÃO VOTARIA DE JEITO NENHUM", 
    "NÃO SABE/NÃO RESPONDEU"

]

ordem_avaliacao_imagem = [
    "POSITIVA",
    "NEGATIVA", 
    "NEM POSITIVA/NEM NEGATIVA", 
    "NÃO SABE/NÃO RESPONDEU"

]

### 1. Sexo
Embora tenha comportamento RU Estimulada, deve-se sempre ter uma resposta válida (feminino/masculino), logo considera os itens vazios como a resposta com maior mostragem.

In [715]:
def sexo():
  coluna = "1. SEXO"
  # Tratamento geral das linhas vazias
  sexo = df[coluna].value_counts()
  valor_mais_frequente = sexo.idxmax()
  df[coluna] = df[coluna].fillna(valor_mais_frequente)

  contagem_sexo = df[coluna].value_counts()
  porcentagem_sexo = (df[coluna].value_counts(normalize = True) * 100).round(2)
  
  # Exibição em tabela
  resultado = pd.DataFrame({
      'Contagem': contagem_sexo,
      'Porcentagem': porcentagem_sexo.astype(str) + '%'
  })
    
  # Adicionar a linha do total
  total_contagem = contagem_sexo.sum()
  total_porcentagem = porcentagem_sexo.sum()

  if (total_porcentagem != 100.00):
    ajuste = 100.00 - total_porcentagem
    total_porcentagem += ajuste

  resultado.loc['Total'] = [total_contagem, f'{total_porcentagem:.2f}%']
  print(resultado)

  return resultado

### 2. Faixa etaria
Embora também apresente comportamento RU Estimulada, deve-se também sempre se manter com respostas válidas (de acordo com as faixas etárias válidas), logo, considera-se a faixa etária das linhas vazias como a faixa de maior mostragem.

In [716]:
def faixa_etaria(coluna = "2. FAIXA ETÁRIA"):
  # Tratamento geral das linhas vazias
  faixa_etaria = df[coluna].value_counts()
  valor_mais_frequente = faixa_etaria.idxmax()
  df[coluna] = df[coluna].fillna(valor_mais_frequente)

  contagem_faixa_etaria = df[coluna].value_counts()
  porcentagem_faixa_etaria = (df[coluna].value_counts(normalize = True) * 100).round(2)
    
  # Exibir Tabela
  resultado = pd.DataFrame({
      "contagem": contagem_faixa_etaria,
      "porcentagem": porcentagem_faixa_etaria.astype(str) + "%"
  })

  # Ordem Faixas
  ordem_faixas = [
      "16 A 24 ANOS",
      "25 A 34 ANOS",
      "35 A 44 ANOS",
      "45 A 59 ANOS",
      "60 A 69 ANOS",
      "MAIS DE 70 ANOS"
  ]
    
  resultado = resultado.reindex(ordem_faixas).dropna()
    
  # Adiciona a linha do total
  total_contagem = resultado["contagem"].sum()
  total_porcentagem = resultado["porcentagem"].str.rstrip('%').astype(float).sum()

  if (total_porcentagem != 100.00):
    ajuste = 100.00 - total_porcentagem
    total_porcentagem += ajuste

  resultado.loc['Total'] = [total_contagem, f'{total_porcentagem:.2f}%']
  print(resultado)

  return resultado

### 3. Escolaridade
Pergunta referente a escolaridade do entrevistado. Respostas:


In [717]:
def escolaridade():
  coluna = "3. ESCOLARIDADE"
    
  # Tratamento geral das linhas vazias
  escolaridade = df[coluna].value_counts()
  valor_mais_frequente = escolaridade.idxmax()
  df[coluna] = df[coluna].fillna(valor_mais_frequente)

  contagem_escolaridade = df[coluna].value_counts()
  porcentagem_escolaridade = (df[coluna].value_counts(normalize = True) * 100).round(2)

  # Exibir Tabela
  resultado = pd.DataFrame({
      "contagem": contagem_escolaridade,
      "porcentagem": porcentagem_escolaridade.astype(str) + "%"
  })

  # Adiciona a linha do total
  total_contagem = contagem_escolaridade.sum()
  total_porcentagem = porcentagem_escolaridade.sum()

  # Ordem Faixas
  ordem_faixas = [
      "ANALFABETO/LÊ E ESCREVE",
      "FUNDAMENTAL INCOMPLETO/COMPLETO",
      "MÉDIO INCOMPLETO/COMPLETO",
      "SUPERIOR INCOMPLETO/COMPLETO",
      "PÓS-GRADUADO INCOMPLETO/COMPLETO"
  ]
    
  resultado = resultado.reindex(ordem_faixas).dropna()
    
  if (total_porcentagem != 100.00):
    ajuste = 100.00 - total_porcentagem
    total_porcentagem += ajuste

  resultado.loc['Total'] = [total_contagem, f'{total_porcentagem:.2f}%']
  print(resultado)

  return resultado

### 4. COMO VOCÊ CLASSIFICARIA O SEU INTERESSE NAS ELEIÇÕES MUNICIPAIS DESTE ANO? (RU ESTIMULADA)

In [718]:
def classificacao_interesse(ordem_interesse):
    coluna = "4. COMO VOCÊ CLASSIFICARIA O SEU INTERESSE NAS ELEIÇÕES MUNICIPAIS DESTE ANO? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_interesse).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 5. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSE HOJE, EM QUAL CANDIDATO VOCÊ VOTARIA? (RU ESPONTÂNEA)

In [719]:
def eleicoes_hoje_prefeito(substituicoes, ordem_candidatos):
  coluna = "5. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSE HOJE, EM QUAL CANDIDATO VOCÊ VOTARIA? (RU ESPONTÂNEA)"
  # Tratamento geral dos espaços vazios e repetidos
  df[coluna] = df[coluna].fillna("NENHUM")

  # Aplicando a substituição
  for candidato in df[coluna]:
      if (candidato.lower().strip() in substituicoes["DIEGO CABRAL"]):
          df[coluna] = df[coluna].replace(candidato, "DIEGO CABRAL")

      elif (candidato.lower().strip() in substituicoes["JORGE ALEXANDRE"]):
          df[coluna] = df[coluna].replace(candidato, "JORGE ALEXANDRE")

      elif (candidato.lower().strip() in substituicoes["FELIPE DANTAS"]):
          df[coluna] = df[coluna].replace(candidato, "FELIPE DANTAS")

      elif (candidato.lower().strip() in substituicoes["BOSCO"]):
          df[coluna] = df[coluna].replace(candidato, "BOSCO")

      elif (candidato.lower().strip() in substituicoes["NENHUM"]):
          df[coluna] = df[coluna].replace(candidato, "NENHUM")

      elif (candidato.lower().strip() in substituicoes["NÃO SABE"]):
          df[coluna] = df[coluna].replace(candidato, "NÃO SABE/NÃO RESPONDEU")
        
  contagem_votaria = df[coluna].value_counts()
  porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

  # Exibição da tabela
  resultado = pd.DataFrame({
      "contagem": contagem_votaria,
      "porcentagem": porcentagem_votaria.astype(str) + "%"
  })
    
  resultado = resultado.reindex(ordem_candidatos).dropna()

  # Total
  total_contagem = contagem_votaria.sum()
  total_porcentagem = porcentagem_votaria.sum()
    
  if (total_porcentagem != 100.00):
      ajuste = 100.00 - total_porcentagem
      total_porcentagem += ajuste

  resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]

  print(resultado)
  return resultado

### 6. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUAIS DESSES CANDIDATOS VOCÊ VOTARIA? (RU ESTIMULADA)

In [720]:
def eleicoes_prefeito_hoje(ordem_candidatos):
    coluna = "6. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUAIS DESSES CANDIDATOS VOCÊ VOTARIA? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_candidatos).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 7. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE ESTEJA MAIS PREPARADO PARA SER PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)

In [721]:
def independente_intencao_votos(ordem_candidatos):
    coluna = "7. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE ESTEJA MAIS PREPARADO PARA SER PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_candidatos).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 8. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE GANHARÁ A ELEIÇÃO PARA PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)

In [722]:
def independente_intencao_votos_quem_ganhara(ordem_candidatos):
    coluna = "8. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA QUE GANHARÁ A ELEIÇÃO PARA PREFEITO DE CAMARAGIBE? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })

    resultado = resultado.reindex(ordem_candidatos).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 9. EM RELAÇÃO A SUA INTENÇÃO DE VOTO PARA PREFEITO DE CAMARAGIBE, HOJE VOCÊ DIRIA QUE: (RU ESTIMULADA)

In [723]:
def em_relacao_sua_intencao():
    coluna = "9. EM RELAÇÃO A SUA INTENÇÃO DE VOTO PARA PREFEITO DE CAMARAGIBE, HOJE VOCÊ DIRIA QUE: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })

    # Ordem Faixas
    ordem_faixas_intencao = [
        "É DEFINITIVA, NÃO MUDAREI DE OPINIÃO",
        "NÃO É DEFINITIVA, MUDAREI DE OPINIÃO",
        "TALVEZ MUDAREI DE OPINIÃO",
        "NÃO SABE/NÃO RESPONDEU"
    ]
    
    resultado = resultado.reindex(ordem_faixas_intencao).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 10. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE DIEGO CABRAL, VOCÊ DIRIA QUE: (RU ESTIMULADA)

In [724]:
def sobre_diego_cabral(ordem_diria_sobre):
    coluna = "10. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE DIEGO CABRAL, VOCÊ DIRIA QUE: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_diria_sobre).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 11. (EXCETO PARA QUEM NÃO CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE DIEGO CABRAL: (RU ESTIMULADA)

In [725]:
def avaliacao_diego_cabral(ordem_avaliacao_imagem):
    coluna = "11. (EXCETO PARA QUEM NÃO CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE DIEGO CABRAL: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_avaliacao_imagem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 12. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE JORGE ALEXANDRE, VOCÊ DIRIA QUE: (RU ESTIMULADA)

In [726]:
def sobre_jorge_alexandre(ordem_diria_sobre):
    coluna = "12. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE JORGE ALEXANDRE, VOCÊ DIRIA QUE: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_diria_sobre).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 13. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE JORGE ALEXANDRE: (RU ESTIMULADA)

In [727]:
def avaliacao_jorge_alexandre(ordem_avaliacao_imagem):
    coluna = "13. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE JORGE ALEXANDRE: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_avaliacao_imagem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 14. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE BOSCO, VOCÊ DIRIA QUE: (RU ESTIMULADA)

In [728]:
def sobre_bosco(ordem_diria_sobre):
    coluna = "14. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE DE BOSCO, VOCÊ DIRIA QUE: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_diria_sobre).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 15. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE BOSCO: (RU ESTIMULADA)

In [729]:
def avaliacao_bosco(ordem_avaliacao_imagem):
    coluna = "15. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POSSUI UMA IMAGEM POSITIVA OU NEGATIVA DO PRÉ-CANDIDATO A PREFEITO DE CAMARAGIBE BOSCO: (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    resultado = resultado.reindex(ordem_avaliacao_imagem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 16. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUEM VOCÊ VOTARIA? (RU ESTIMULADA)

In [730]:
def se_eleicoes_prefeito_hoje():
    coluna = "16. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, EM QUEM VOCÊ VOTARIA? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    ordem = [
    "DIEGO CABRAL, APOIADO PELO PREFEITO DE RECIFE JOÃO CAMPOS", 
    "JORGE ALEXANDRE, APOIADO POR MARCELO GOUVEIA", 
    "FELIPE DANTAS, APOIADO POR ANDERSON FERREIRA", 
    "BOSCO, APOIADO POR DUDU DA FONTE", 
    "NÃO SABE/NÃO RESPONDEU", 
    "NENHUM DELES"
    ]
    
    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

###  17. A PREFEITA NADEGI NÃO PODERÁ SER MAIS CANDIDATA NA PRÓXIMA ELEIÇÃO. QUEM É O CANDIDATO A PREFEITO QUE ELA IRÁ APOIAR? (RU ESPONTÂNEA)

In [731]:
def prefeita_nadegi_nao_podera(substituicoes, ordem_candidatos):
  coluna = "17. A PREFEITA NADEGI NÃO PODERÁ SER MAIS CANDIDATA NA PRÓXIMA ELEIÇÃO. QUEM É O CANDIDATO A PREFEITO QUE ELA IRÁ APOIAR? (RU ESPONTÂNEA)"
  # Tratamento geral dos espaços vazios e repetidos
  df[coluna] = df[coluna].fillna("NENHUM")

  # Aplicando a substituição
  for candidato in df[coluna]:
      if (candidato.lower().strip() in substituicoes["DIEGO CABRAL"]):
          df[coluna] = df[coluna].replace(candidato, "DIEGO CABRAL")

      elif (candidato.lower().strip() in substituicoes["JORGE ALEXANDRE"]):
          df[coluna] = df[coluna].replace(candidato, "JORGE ALEXANDRE")

      elif (candidato.lower().strip() in substituicoes["FELIPE DANTAS"]):
          df[coluna] = df[coluna].replace(candidato, "FELIPE DANTAS")

      elif (candidato.lower().strip() in substituicoes["BOSCO"]):
          df[coluna] = df[coluna].replace(candidato, "BOSCO")

      elif (candidato.lower().strip() in substituicoes["NENHUM"]):
          df[coluna] = df[coluna].replace(candidato, "NENHUM")

      elif (candidato.lower().strip() in substituicoes["NÃO SABE"]):
          df[coluna] = df[coluna].replace(candidato, "NÃO SABE/NÃO RESPONDEU")
        
  contagem_votaria = df[coluna].value_counts()
  porcentagem_votaria = (df[coluna].value_counts(normalize = True) * 100).round(2)

  # Exibição da tabela
  resultado = pd.DataFrame({
      "contagem": contagem_votaria,
      "porcentagem": porcentagem_votaria.astype(str) + "%"
  })
    
  resultado = resultado.reindex(ordem_candidatos).dropna()

  # Total
  total_contagem = contagem_votaria.sum()
  total_porcentagem = porcentagem_votaria.sum()
    
  if (total_porcentagem != 100.00):
      ajuste = 100.00 - total_porcentagem
      total_porcentagem += ajuste

  resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]

  print(resultado)
  return resultado

### 18. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, VOCÊ VOTARIA EM DIEGO CABRAL SE O PRESIDENTE LULA APOIAR? (RU ESTIMULADA)

In [732]:
def apoio_lula():
    coluna = "18. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM HOJE, VOCÊ VOTARIA EM DIEGO CABRAL SE O PRESIDENTE LULA APOIAR? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    ordem = [
        "VOTARIA COM CERTEZA", 
        "TALVEZ VOTARIA", 
        "NÃO SOU INFLUENCIÁVEL PELO APOIO DE LULA", 
        "NÃO VOTARIA DE JEITO NENHUM", 
        "NÃO SABE/NÃO RESPONDEU"
    ]
    
    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 19. DE MANEIRA GERAL, COMO VOCÊ AVALIA A GESTÃO DA GOVERNADORA RAQUEL LYRA? (RU ESTIMULADA)

In [733]:
def governadora_lyra():
    coluna = "19. DE MANEIRA GERAL, COMO VOCÊ AVALIA A GESTÃO DA GOVERNADORA RAQUEL LYRA? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    ordem = [
        "APROVO", 
        "DESAPROVO", 
        "NÃO SABE/NÃO RESPONDEU"
    ]
    
    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 20. SOBRE A GESTÃO DA PREFEITA NADEGI, COMO O (A) SR. (A) AVALIA A SUA ADMINISTRAÇÃO A FRENTE DA PREFEITURA DE CAMARAGIBE? (RU ESTIMULADA)

In [734]:
def gestao_prefeitura():
    coluna = "20. SOBRE A GESTÃO DA PREFEITA NADEGI, COMO O (A) SR. (A) AVALIA A SUA ADMINISTRAÇÃO A FRENTE DA PREFEITURA DE CAMARAGIBE? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    ordem = [
        "ÓTIMA", 
        "BOA", 
        "REGULAR", 
        "RUIM", 
        "PÉSSIMA", 
        "NÃO SABE/NÃO RESPONDEU"
    ]


    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 21. DE MANEIRA GERAL, SOBRE A FORMA DE ADMINISTRAR DA PREFEITA NADEGI, O (A) SR. (A) APROVA OU DESAPROVA? (RU ESTIMULADA)

In [735]:
def administrar_prefeitura():
    coluna = "21. DE MANEIRA GERAL, SOBRE A FORMA DE ADMINISTRAR DA PREFEITA NADEGI, O (A) SR. (A) APROVA OU DESAPROVA? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })
    
    ordem = [
        "APROVO", 
        "DESAPROVO", 
        "NÃO SABE/NÃO RESPONDEU"
    ]

    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 22. EM QUAL DESSES CANDIDATOS VOCÊ NÃO VOTARIA DE MANEIRA ALGUMA? (RU ESTIMULADA)

In [736]:
def votaria_maneira_alguma(ordem_candidatos):
    coluna = "22. EM QUAL DESSES CANDIDATOS VOCÊ NÃO VOTARIA DE MANEIRA ALGUMA? (RU ESTIMULADA)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })

    resultado = resultado.reindex(ordem_candidatos).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 23. (NÃO PEA) DAS ALTERNATIVAS QUE VOU LER, QUAL MELHOR REPRESENTA A SUA SITUAÇÃO EM RELAÇÃO AO TRABALHO?

In [737]:
def trabalho():
    coluna = "23. (NÃO PEA) DAS ALTERNATIVAS QUE VOU LER, QUAL MELHOR REPRESENTA A SUA SITUAÇÃO EM RELAÇÃO AO TRABALHO?"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })

    ordem = [
        "APOSENTADO(A) OU NO SEGURO", 
        "DONA DE CASA QUE NÃO TRABALHA", 
        "ESTUDANTE QUE NÃO TRABALHA", 
        "DESEMPREGADO", 
        "NÃO SABE/NÃO RESPONDEU"
    ]

    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 24. RENDA (PESSOAL)

In [738]:
def renda():
    coluna = "24. RENDA (PESSOAL)"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })

    ordem = [
        "ATÉ 1 SALÁRIO MÍNIMO", 
        "DE 1 A 3 SALÁRIOS MÍNIMOS", 
        "DE 3 A 5 SALÁRIOS MÍNIMOS", 
        "DE 5 A 10 SALÁRIOS MÍNIMOS", 
        "MAIS DE 10 SALÁRIOS MÍNIMOS", 
        "NÃO SABE/NÃO RESPONDEU"
    ]

    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

### 25. RELIGIÃO

In [739]:
def religiao():
    coluna = "25. RELIGIÃO"
    
    # Tratamento geral dos espaços vazios e repetidos
    df[coluna] = df[coluna].fillna("NÃO SABE/NÃO RESPONDEU")

    contagem = df[coluna].value_counts()
    porcentagem = (df[coluna].value_counts(normalize = True) * 100).round(2)

    # Exibição da tabela
    resultado = pd.DataFrame({
        "contagem": contagem,
        "porcentagem": porcentagem.astype(str) + "%"
    })

    ordem = [
        "CATÓLICA", 
        "EVANGÉLICA", 
        "ESPÍRITA", 
        "UMBANDA, CANDOMBLÉ OU OUTRAS RELIGIÕES AFRO-BRASILEIRAS", 
        "ATEU", 
        "JUDÁICA", 
        "OUTRA, QUAL?", 
        "SEM RELIGIÃO"
    ]

    resultado = resultado.reindex(ordem).dropna()

    # Total
    total_contagem = contagem.sum()
    total_porcentagem = porcentagem.sum()
    
    if (total_porcentagem != 100.00):
        ajuste = 100.00 - total_porcentagem
        total_porcentagem += ajuste

    resultado.loc["Total"] = [total_contagem, f"{total_porcentagem:.2f}%"]
    print(resultado)

    return resultado

# Exportando análise

In [740]:
# Criar um novo arquivo Excel com os resultados
with pd.ExcelWriter("results/CAMARAGIBE - SANTANA - 10.09.xlsx", engine = "openpyxl") as writer:
    # Aplicando o tratamento para perguntas específicas
    sexo = sexo()
    sexo.to_excel(writer, sheet_name = "1. SEXO", index=True)

    faixa_etaria = faixa_etaria()
    faixa_etaria.to_excel(writer, sheet_name = "2. FAIXA ETÁRIA", index=True)

    escolaridade = escolaridade()
    escolaridade.to_excel(writer, sheet_name = "3. ESCOLARIDADE", index=True)

    classificacao_interesse = classificacao_interesse(ordem_interesse)
    classificacao_interesse.to_excel(writer, sheet_name = "4. COMO VOCÊ CLASSIFICARIA O SEU INTERESSE NAS EL", index=True)

    eleicoes_hoje_prefeito = eleicoes_hoje_prefeito(substituicoes, ordem_candidatos)
    eleicoes_hoje_prefeito.to_excel(writer, sheet_name = "5. SE AS ELEIÇÕES PARA PREFEITO DE", index=True)

    eleicoes_prefeito_hoje = eleicoes_prefeito_hoje(ordem_candidatos)
    eleicoes_prefeito_hoje.to_excel(writer, sheet_name = "6. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE FOSSEM", index=True)

    independente_intencao_votos = independente_intencao_votos(ordem_candidatos)
    independente_intencao_votos.to_excel(writer, sheet_name = "7. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS, QUEM VOCÊ ACREDITA", index=True)

    independente_intencao_votos_quem_ganhara = independente_intencao_votos_quem_ganhara(ordem_candidatos)
    independente_intencao_votos_quem_ganhara.to_excel(writer, sheet_name = "8. INDEPENDENTE DA SUA INTENÇÃO DE VOTOS", index=True)

    em_relacao_sua_intencao = em_relacao_sua_intencao()
    em_relacao_sua_intencao.to_excel(writer, sheet_name = "9. EM RELAÇÃO A SUA", index=True)

    sobre_diego_cabral = sobre_diego_cabral(ordem_diria_sobre)
    sobre_diego_cabral.to_excel(writer, sheet_name = "10. SOBRE A CANDIDATURA A PREFEITO", index=True)

    avaliacao_diego_cabral = avaliacao_diego_cabral(ordem_avaliacao_imagem)
    avaliacao_diego_cabral.to_excel(writer, sheet_name = "11. (EXCETO PARA QUEM NÃO CONHECE) E VOCÊ POSSUI", index=True)

    #12
    sobre_jorge_alexandre = sobre_jorge_alexandre(ordem_diria_sobre)
    sobre_jorge_alexandre.to_excel(writer, sheet_name = "12. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE", index=True)

    #13
    avaliacao_jorge_alexandre = avaliacao_jorge_alexandre(ordem_avaliacao_imagem)
    avaliacao_jorge_alexandre.to_excel(writer, sheet_name = "13. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POSSUI", index=True)

    #14
    sobre_bosco = sobre_bosco(ordem_diria_sobre)
    sobre_bosco.to_excel(writer, sheet_name = "14. SOBRE A CANDIDATURA A PREFEITO DE CAMARAGIBE", index=True)

    #15
    avaliacao_bosco = avaliacao_bosco(ordem_avaliacao_imagem)
    avaliacao_bosco.to_excel(writer, sheet_name = "15. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POSSUI UMA IMAGEM", index=True)

    #16
    se_eleicoes_prefeito_hoje = se_eleicoes_prefeito_hoje()
    se_eleicoes_prefeito_hoje.to_excel(writer, sheet_name = "16. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE", index=True)
    
    #17
    prefeita_nadegi_nao_podera = prefeita_nadegi_nao_podera(substituicoes, ordem_candidatos)
    prefeita_nadegi_nao_podera.to_excel(writer, sheet_name = "17. A PREFEITA NADEGI NÃO PODERÁ SER MAIS CANDIDATA", index=True)

    #18
    apoio_lula = apoio_lula()
    apoio_lula.to_excel(writer, sheet_name = "18. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE", index=True)

    #19
    governadora_lyra = governadora_lyra()
    governadora_lyra.to_excel(writer, sheet_name = "19. DE MANEIRA GERAL, COMO VOCÊ AVALIA A GESTÃO DA GOVERNADORA", index=True)

    #20
    gestao_prefeitura = gestao_prefeitura()
    gestao_prefeitura.to_excel(writer, sheet_name = "20. SOBRE A GESTÃO DA PREFEITA NADEGI", index=True)

    #21
    administrar_prefeitura = administrar_prefeitura()
    administrar_prefeitura.to_excel(writer, sheet_name = "21. DE MANEIRA GERAL, SOBRE A FORMA DE ADMINISTRAR", index=True)

    #22
    votaria_maneira_alguma = votaria_maneira_alguma(ordem_candidatos)
    votaria_maneira_alguma.to_excel(writer, sheet_name = "22. EM QUAL DESSES CANDIDATOS VOCÊ NÃO VOTARIA ", index=True)

    #23
    trabalho = trabalho()
    trabalho.to_excel(writer, sheet_name = "23. (NÃO PEA) DAS ALTERNATIVAs", index=True)

    #24
    renda = renda()
    renda.to_excel(writer, sheet_name = "24. RENDA (PESSOAL)", index=True)

    #25 
    religiao = religiao()
    religiao.to_excel(writer, sheet_name = "25. RELIGIÃO", index=True)

print("Processo concluído. Os resultados foram salvos em 'resultados_tratamento.xlsx'.")

           Contagem Porcentagem
1. SEXO                        
MASCULINO        89      53.61%
FEMININO         77      46.39%
Total           166     100.00%
                 contagem porcentagem
2. FAIXA ETÁRIA                      
16 A 24 ANOS           10       6.02%
25 A 34 ANOS           18      10.84%
35 A 44 ANOS           36      21.69%
45 A 59 ANOS           50      30.12%
60 A 69 ANOS           23      13.86%
MAIS DE 70 ANOS        29      17.47%
Total                 166     100.00%
                                  contagem porcentagem
3. ESCOLARIDADE                                       
ANALFABETO/LÊ E ESCREVE                 17      10.24%
FUNDAMENTAL INCOMPLETO/COMPLETO         61      36.75%
MÉDIO INCOMPLETO/COMPLETO               81       48.8%
SUPERIOR INCOMPLETO/COMPLETO             6       3.61%
PÓS-GRADUADO INCOMPLETO/COMPLETO         1        0.6%
Total                                  166     100.00%
                                                    contag



                                                    contagem porcentagem
15. (EXCETO PARA QUEM NÃO O CONHECE) E VOCÊ POS...                      
POSITIVA                                                19.0      11.45%
NEGATIVA                                                68.0      40.96%
NÃO SABE/NÃO RESPONDEU                                  47.0      28.31%
Total                                                  166.0     100.00%
                                                    contagem porcentagem
16. SE AS ELEIÇÕES PARA PREFEITO DE CAMARAGIBE ...                      
DIEGO CABRAL, APOIADO PELO PREFEITO DE RECIFE J...        59      35.54%
JORGE ALEXANDRE, APOIADO POR MARCELO GOUVEIA              50      30.12%
FELIPE DANTAS, APOIADO POR ANDERSON FERREIRA              11       6.63%
BOSCO, APOIADO POR DUDU DA FONTE                          11       6.63%
NÃO SABE/NÃO RESPONDEU                                    33      19.88%
NENHUM DELES                                       