-
Notifications
You must be signed in to change notification settings - Fork 0
/
relatorio.Rmd
112 lines (84 loc) · 4.17 KB
/
relatorio.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
---
title: "Relação entre votos, receitas, despesas e bens de candidatos"
author: "Seu nome"
output: html_notebook
---
```{r setup, include=FALSE}
library(dplyr)
library(GGally)
library(ggplot2)
library(here)
library(readr)
options(OutDec = ",")
```
```{r carrega dados, include=FALSE}
despesas <- here("dados", "despesas_candidatos_2014_PB.txt") %>%
read_delim(";", locale = locale(encoding = "latin1", decimal_mark = ","))
receitas <- here("dados", "receitas_candidatos_2014_PB.txt") %>%
read_delim(";", locale = locale(encoding = "latin1", decimal_mark = ","))
bens <- here("dados", "bem_candidato_2014_PB.csv") %>%
read_delim(";", locale = locale(encoding = "latin1", decimal_mark = ","))
votacao <- here("dados", "votacao_candidato_munzona_2014_PB.txt") %>%
read_delim(";", locale = locale(encoding = "latin1", decimal_mark = ","),
col_names = c(
"DT_GERACAO", "HH_GERACAO", "ANO_ELEICAO", "NUM_TURNO", "DESC_ELEICAO",
"SIGLA_UF", "SIGLA_UE", "COD_MUNICIPIO", "NM_MUNICIPIO", "NR_ZONA",
"COD_CARGO", "NR_CANDIDATO", "SQ_CANDIDATO", "NM_CANDIDATO",
"NM_URNA_CANDIDATO", "DESC_CARGO", "COD_SIT_CAND_SUPERIOR",
"DESC_SIT_CAND_SUPERIOR", "COD_SIT_CANDIDATO", "DESC_SIT_CANDIDATO",
"COD_SID_CAND_TOT", "DESC_SIT_CAND_TOT", "NR_PARTIDO", "SIGLA_PARTIDO",
"NM_PARTIDO", "SEQ_LEGENDA", "NM_COLIGACAO", "COMPOSICAO_LEGENDA",
"TOTAL_VOTOS", "TRANSITO"
))
```
```{r agrega dados, include = FALSE}
total_despesas <- despesas %>%
group_by(`Sequencial Candidato`) %>%
summarise(`Total despesas` = sum(`Valor despesa`))
total_receitas <- receitas %>%
group_by(`Sequencial Candidato`) %>%
summarise(`Total receitas` = sum(`Valor receita`))
total_bens <- bens %>%
group_by(`Sequencial Candidato` = SQ_CANDIDATO) %>%
summarise(`Total bens` = sum(VR_BEM_CANDIDATO))
total_votos <- votacao %>%
group_by(Cargo = DESC_CARGO,
`Sigla Partido` = SIGLA_PARTIDO,
`Sequencial Candidato` = SQ_CANDIDATO,
`Numero candidato` = NR_CANDIDATO,
`Nome candidato` = NM_CANDIDATO,
Turno = NUM_TURNO) %>%
summarise(Situacao = first(DESC_SIT_CAND_TOT),
`Total votos` = sum(TOTAL_VOTOS, na.rm = TRUE))
dados_candidatos <- total_votos %>%
left_join(total_despesas) %>%
left_join(total_receitas) %>%
left_join(total_bens)
```
Explique os dados que você vai analisar, de onde obteve e que análise pretende
fazer. Filtre candidatos de apenas um cargo e um lugar, que tenha pelo menos 90
candidatos. Por exemplo, deputado estadual na Paraíba ou vereador em Campina Grande.
```{r filtra dados}
# Filtre apenas o cargo que você está interessado em analisar. Exemplo:
dados_candidatos <- dados_candidatos %>%
filter(Cargo == "DEPUTADO FEDERAL")
dados_candidatos
```
# Análise exploratória
Inicialmente, faça uma análise exploratória de cada variável individualmente.
# Análise das relações entre variáveis
Faça uma análise das relações entre as variáveis em questão. Você pode começar
com uma análise gráfica das relações entre variáveis, para depois partir para
análise de correlação e regressão.
# Análise de regressão
Analise a relação entre a quantidade de votos que um candidato recebe
com outras variáveis. Você pode começar com regressões simples, considerando
apenas uma variável por vez, e em seguida fazer regressões múltiplas.
Descreva bem as suas conclusões, de forma clara para um público geral.
# Exemplos de perguntas a responder:
- Quanto um candidato deve gastar no mínimo (despesa) para ter mais chance de ser eleito?
- Quanto um candidato deve arrecadar no mínimo (receita) para ter mais chance de ser eleito?
- Quanto de bens um candidato deve ter no mínimo para ter mais chance de ser eleito?
- Existe alguma combinação de variáveis que explica bem a quantidade de dados que um candidato recebe?
- Considere um candidato fictício que recebeu 100 mil reais de receita na campanha. Qual a previsão de votos que ele deve receber? É provável que ele seja eleito?
- Considere um candidato fictício que gastou 100 mil reais de despesa na campanha e possui 1 milhão de reais em bens. Qual a previsão de votos que ele deve receber? É provável que ele seja eleito?