**1. Carga do Dataset**

In [None]:
# Instalar o pacote Tidyverse e importação de outras bibliotecas
install.packages("tidyverse")
library(tidyverse)
library(ggplot2)
library(readr)
library(dplyr)


In [None]:
# RO para Roraima e TO para Tocantins
estado <- "TO"

csv <- paste0("perfil_eleitor_secao_ATUAL_", estado, ".csv")

# Carregar o arquivo CSV usando read_delim para arquivos delimitados por ponto e vírgula
dataset_eleitorado <- read_delim(csv, delim = ";", locale = locale(encoding = "latin1"))

# Calcular dimensões do dataset
linhas <- nrow(dataset_eleitorado)
colunas <- ncol(dataset_eleitorado)
celulas <- linhas * colunas

cat("Número de linhas:", linhas, "\n")
cat("Número de colunas:", colunas, "\n")
cat("Número de células:", celulas, "\n")


**2. Seleção de Colunas (Transformação - Projeção)**

In [None]:
# Selecionar apenas as colunas de interesse
colunas_interesse <- c("NM_MUNICIPIO", "CD_GENERO", "DS_GENERO", "CD_ESTADO_CIVIL",
                       "DS_ESTADO_CIVIL", "CD_FAIXA_ETARIA", "DS_FAIXA_ETARIA",
                       "CD_GRAU_ESCOLARIDADE", "DS_GRAU_ESCOLARIDADE", "QT_ELEITORES_PERFIL")

dataset_filtrado <- dataset_eleitorado %>% select(all_of(colunas_interesse))

# Comparar dimensões antes e depois
linhas_filtrado <- nrow(dataset_filtrado)
colunas_filtrado <- ncol(dataset_filtrado)
celulas_filtrado <- linhas_filtrado * colunas_filtrado

cat("Após projeção:\n")
cat("Linhas:", linhas_filtrado, "\n")
cat("Colunas:", colunas_filtrado, "\n")
cat("Células:", celulas_filtrado, "\n")

**3. Filtragem de Linhas (Transformação - Limpeza de Dados)**

In [None]:
# Filtrar linhas inválidas
dataset_limpo <- dataset_filtrado %>%
  filter(
    DS_FAIXA_ETARIA != "Inválido",
    !str_detect(DS_GENERO, "NÃO INFORMADO"),
    !str_detect(DS_ESTADO_CIVIL, "NÃO INFORMADO"),
    !str_detect(DS_GRAU_ESCOLARIDADE, "NÃO INFORMADO")
  )

# Comparar dimensões antes e depois da limpeza
linhas_limpo <- nrow(dataset_limpo)
colunas_limpo <- ncol(dataset_limpo)
celulas_limpo <- linhas_limpo * colunas_limpo

cat("Após limpeza:\n")
cat("Linhas:", linhas_limpo, "\n")
cat("Colunas:", colunas_limpo, "\n")
cat("Células:", celulas_limpo, "\n")

2.3. Calcular o Número de Células com Dados

In [None]:
# Contar o número de células com dados (ANTES E DEPOIS)
celulas_antes <- nrow(dataset_eleitorado) * ncol(dataset_eleitorado)
celulas_depois <- nrow(dataset_limpo) * ncol(dataset_limpo)

cat("Número de células antes das transformações:", celulas_antes, "\n")
cat("Número de células após as transformações:", celulas_depois, "\n")

Análises:

In [None]:
# Filtrar dados com os critérios
filtro <- dataset_limpo %>%
  filter(
    DS_GENERO == "MASCULINO",
    DS_FAIXA_ETARIA == "35 a 39 anos",
    DS_ESTADO_CIVIL == "CASADO",
    DS_GRAU_ESCOLARIDADE == "ENSINO MÉDIO COMPLETO"
  )

# Calcular total de eleitores que atendem ao critério
total_filtro <- sum(filtro$QT_ELEITORES_PERFIL)

# Calcular total geral de eleitores
total_geral <- sum(dataset_limpo$QT_ELEITORES_PERFIL)

# Comparar
cat("Total de eleitores que atendem ao critério:", total_filtro, "\n")
cat("Total geral de eleitores:", total_geral, "\n")
cat("Proporção:", round((total_filtro / total_geral) * 100, 2), "%\n")


In [None]:
# Outros critérios
filtro <- dataset_limpo %>%
  filter(
    DS_GENERO == "FEMININO",
    DS_FAIXA_ETARIA %in% c("16 anos", "17 anos")
  )

# Calcular total de eleitores que atendem ao critério
total_filtro <- sum(filtro$QT_ELEITORES_PERFIL)

# Calcular total geral de eleitores
total_geral <- sum(dataset_limpo$QT_ELEITORES_PERFIL)

# Comparar
cat("Total de eleitores que atendem ao critério:", total_filtro, "\n")
cat("Total geral de eleitores:", total_geral, "\n")
cat("Proporção:", round((total_filtro / total_geral) * 100, 2), "%\n")

In [None]:
# Contagem por sexo
contagem_sexo <- dataset_limpo %>%
  group_by(DS_GENERO) %>%
  summarise(QT_ELEITORES = sum(QT_ELEITORES_PERFIL))

print("Contagem por sexo")
print(contagem_sexo)

In [None]:
# Contagem por município
contagem_municipio <- dataset_limpo %>%
  group_by(NM_MUNICIPIO) %>%
  summarise(QT_ELEITORES = sum(QT_ELEITORES_PERFIL))

print("Contagem por município")
print(contagem_municipio)

nome_arquivo <- paste0("contagem_municipio_", estado, ".csv")

write_csv(contagem_municipio, nome_arquivo)

cat("Arquivo salvo como:", nome_arquivo, "\n")

In [None]:
# Combinação: Sexo versus Faixa Etária
sexo_vs_idade <- dataset_limpo %>%
  group_by(DS_GENERO, DS_FAIXA_ETARIA) %>%
  summarise(QT_ELEITORES = sum(QT_ELEITORES_PERFIL)) %>%
  arrange(desc(QT_ELEITORES))


print("Sexo vs Faixa Etária")
print(sexo_vs_idade)

nome_arquivo <- paste0("sexo_vs_idade_", estado, ".csv")

write_csv(sexo_vs_idade, nome_arquivo)

cat("Arquivo salvo como:", nome_arquivo, "\n")

Estatísticas básicas em relação à idade baseadas no limite inferior

In [None]:

# Sabendo que o CD_FAIXA_ETARIA segue o formato
# 2529 - 25 a 29 anos
# 1800 - 18 anos
# Faremos a extração do limite inferior e calcular as estatísticas básicas

dataset_limpo <- dataset_limpo %>%
  mutate(
    # Extraindo o limite inferior da faixa etária
    limite_inferior_idade = floor(CD_FAIXA_ETARIA / 100)
  )

# Calcular as estatísticas básicas
estatisticas_idade <- dataset_limpo %>%
  summarise(
    media_idade = mean(limite_inferior_idade, na.rm = TRUE),
    mediana_idade = median(limite_inferior_idade, na.rm = TRUE),
    desvio_padrao_idade = sd(limite_inferior_idade, na.rm = TRUE),
    minimo_idade = min(limite_inferior_idade, na.rm = TRUE),
    maximo_idade = max(limite_inferior_idade, na.rm = TRUE),
    intervalo_idade = max(limite_inferior_idade, na.rm = TRUE) - min(limite_inferior_idade, na.rm = TRUE)
  )

print(estatisticas_idade)

# Salva as estatísticas
nome_arquivo <- paste0("estatisticas_idade", estado, ".csv")

write_csv(estatisticas_idade, nome_arquivo)

cat("Arquivo salvo como:", nome_arquivo, "\n")


In [None]:
# Total de eleitores agrupados por município e grau de instrução
agrupado_municipio <- dataset_limpo %>%
  group_by(NM_MUNICIPIO, DS_GRAU_ESCOLARIDADE) %>%
  summarise(QT_ELEITORES = sum(QT_ELEITORES_PERFIL))

print(agrupado_municipio)

# Salva os dados
nome_arquivo <- paste0("agrupado_municipio_", estado, ".csv")

write_csv(agrupado_municipio, nome_arquivo)

cat("Arquivo salvo como:", nome_arquivo, "\n")


In [None]:
# Município com menos eleitores
municipio_menos <- dataset_limpo %>%
  group_by(NM_MUNICIPIO) %>%
  summarise(Total_Eleitores = sum(QT_ELEITORES_PERFIL)) %>%
  arrange(Total_Eleitores) %>%
  slice(1)


# Município com mais eleitores (exceto a capital)
municipio_mais <- dataset_limpo %>%
  group_by(NM_MUNICIPIO) %>%
  summarise(Total_Eleitores = sum(QT_ELEITORES_PERFIL)) %>%
  arrange(desc(Total_Eleitores)) %>%
  slice(2)

cat("Município com menos eleitores:\n")
print(municipio_menos)

cat("Município com mais eleitores (exceto a capital):\n")
print(municipio_mais)


In [None]:
titulo <- paste0("Distribuição de Eleitores por Gênero - ", estado)

grafico <- ggplot(contagem_sexo, aes(x = DS_GENERO, y = QT_ELEITORES, fill = DS_GENERO)) +
  geom_bar(stat = "identity") +
  labs(title = titulo,
       x = "Gênero", y = "Total de Eleitores") +
  theme_minimal()

print(grafico)

nome_arquivo <- paste0("eleitores_genero_", estado, ".png")

ggsave(nome_arquivo, plot = grafico, width = 10, height = 6)


In [None]:
titulo <- paste0("Eleitores por Faixa Etária e Sexo - ", estado)


grafico <- ggplot(sexo_vs_idade, aes(x = DS_FAIXA_ETARIA, y = QT_ELEITORES, fill = DS_GENERO)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = titulo,
       x = "Faixa Etária", y = "Total de Eleitores") +
  theme_minimal()

print(grafico)

nome_arquivo <- paste0("eleitores_por_genero_idade_", estado, ".png")

ggsave(nome_arquivo, plot = grafico, width = 10, height = 6)


In [None]:
# Heatmap para Faixa Etária vs Estado Civil - Gênero Masculino

titulo <- paste0("Distribuição de Eleitores (Masculino) - ", estado)

heatmap_masculino <- dataset_limpo %>%
  filter(DS_GENERO == "MASCULINO") %>%
  group_by(DS_FAIXA_ETARIA, DS_ESTADO_CIVIL) %>%
  summarise(QT_ELEITORES = sum(QT_ELEITORES_PERFIL), .groups = "drop") %>%
  ggplot(aes(x = DS_ESTADO_CIVIL, y = DS_FAIXA_ETARIA, fill = QT_ELEITORES)) +
  geom_tile(color = "white") +
  scale_fill_gradient(low = "white", high = "blue", name = "Eleitores") +
  labs(
    title = titulo,
    x = "Estado Civil",
    y = "Faixa Etária"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

print(heatmap_masculino)

nome_arquivo <- paste0("heatmap_masc_", estado, ".png")

ggsave(nome_arquivo, plot = heatmap_masculino, width = 10, height = 6)



In [None]:
# Heatmap para Faixa Etária vs Estado Civil - Gênero Feminino

titulo <- paste0("Distribuição de Eleitores (Feminino) - ", estado)

heatmap_feminino <- dataset_limpo %>%
  filter(DS_GENERO == "FEMININO") %>%
  group_by(DS_FAIXA_ETARIA, DS_ESTADO_CIVIL) %>%
  summarise(QT_ELEITORES = sum(QT_ELEITORES_PERFIL), .groups = "drop") %>%
  ggplot(aes(x = DS_ESTADO_CIVIL, y = DS_FAIXA_ETARIA, fill = QT_ELEITORES)) +
  geom_tile(color = "white") +
  scale_fill_gradient(low = "white", high = "purple", name = "Eleitores") +
  labs(
    title = titulo,
    x = "Estado Civil",
    y = "Faixa Etária"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

print(heatmap_feminino)

nome_arquivo <- paste0("heatmap_fem_", estado, ".png")

ggsave(nome_arquivo, plot = heatmap_feminino, width = 10, height = 6)

