Skip to content
Permalink
Branch: master
Find file Copy path
Find file Copy path
Fetching contributors…
Cannot retrieve contributors at this time
358 lines (243 sloc) 10.9 KB
---
title: "Cota parlamentar do Senado"
author: "Gabriela Caesar"
date: "31/01/2019"
output:
pdf_document: default
html_document:
df_print: paged
---
Este notebook se propõe a analisar os gastos dos senadores com a Cota para o Exercício da Atividade Parlamentar (Ceap). Os dados usados neste projeto estão disponíveis no site do Senado Federal.
Para rodar cada trecho de código, você deve clicar em 'run' no lado direito ou pressionar 'ctrl+shift+enter' dentro do código.
Abaixo, nós estamos carregando as bibliotecas necessárias para esta análise. Caso nunca tenha trabalhado com elas, você precisará instalar as bibliotecas com o comando "install.packages()".
Link do que pode ser feito com esta análise:
1) https://g1.globo.com/politica/noticia/viagens-de-jatinho-flat-de-luxo-refeicao-de-r-1000-gastos-de-senadores-com-cota-parlamentar-chegam-a-r-266-milhoes-em-2017.ghtml
2) http://especiais.g1.globo.com/politica/gastos-dos-senadores-em-2017/
```{r}
library(data.table)
library(ggplot2)
library(dplyr)
```
Definimos o diretório em que vamos trabalhar e importamos o arquivo CSV. Ele recebeu na análise o nome 'cota2018'.
O arquivo que usamos está neste link: https://www12.senado.leg.br/transparencia/dados-abertos-transparencia/dados-abertos-ceaps
```{r}
setwd("~/Downloads/")
cota2018 <- fread("cota-parlamentar-sf-31jan2018.csv", sep = ";")
head(cota2018)
```
Queremos analisar brevemente o arquivo importado. Por exemplo, quantas linhas o arquivo tem? Quantos senadores são mencionados? Há algum erro de digitação nas colunas 'MES' e 'DATA'? Os valores de 'VALOR_REEMBOLSO' estão como float?
```{r}
summary(cota2018)
```
Como não queremos trabalhar com o dataframe inteiro, vamos deletar as colunas "DOCUMENTO", "DETALHAMENTO" e "DATA".
```{r}
cota2018$DOCUMENTO <- NULL
#cota2018$DETALHAMENTO <- NULL
#cota2018$DATA <- NULL
```
```{r}
unique(cota2018$SENADOR)
```
```{r}
length(unique(cota2018$SENADOR))
```
```{r}
unique(cota2018$MES)
```
```{r}
ggplot(data=cota2018, aes(cota2018$MES)) +
geom_histogram(col = "blue",
binwidth = 1,
fill = "green",
alpha = .2) +
labs(title = "Número de pedidos de reembolso via Ceap no Senado em 2018", x = "Mês", y = "Nº de pedidos") +
scale_y_continuous(labels=function(y) format(y, big.mark = ".", scientific = FALSE))
```
```{r}
typeof(cota2018$VALOR_REEMBOLSADO)
```
```{r}
?as.double
```
Como o 'valor do reembolso' está em texto, nós vamos converter para número float/double.
```{r}
cota2018$VALOR_REEMBOLSADO <- as.double(sub(",", ".", cota2018$VALOR_REEMBOLSADO))
head(cota2018$VALOR_REEMBOLSADO)
```
Quanto os senadores gastaram pela cota parlamentar em 2018?
```{r}
sum(cota2018$VALOR_REEMBOLSADO)
```
Abaixo nós vemos quais foram os gastos individuais mais altos em 2018. O valor mais alto foi de R$ 66 mil, com a contratação da empresa "NC Comunicação Visual Ltda"", na categoria "divulgação da atividade parlamentar". O reembolso foi solicitado em dezembro pelo senador Eduardo Lopes (PRB-RJ). Veja abaixo os gastos mais altos de 2018:
```{r}
order_cota2018 <- cota2018[order(cota2018$VALOR_REEMBOLSADO, decreasing = TRUE),]
head(order_cota2018)
```
Considerando esse mesmo dataframe, agora queremos identificar quais foram os menores gastos em 2018. Os menores valores registrados são de 1 centavo e fazem parte da categoria que abrange passagens áereas. Os senadores responsáveis são Jorge Viana (PT-AC) e Dário Berger (MDB-SC).
```{r}
order_cota2018 <- cota2018[order(cota2018$VALOR_REEMBOLSADO, decreasing = FALSE),]
head(order_cota2018)
```
Agora queremos saber quais foram os cinco senadores que mais gastaram durante o ano de 2018. E, depois, também os cinco que menos gastaram em 2018.
Para isso, vamos agrupar os valores por nome. Ou seja, todas as despesas de determinado senador devem ser somadas e apresentadas no nome dele.
Abaixo vemos que os senadores João Capiberibe (PSB-AP) e Eduardo Braga (MDB-AM) foram os campeões em despesas com a cota parlamentar.
```{r}
senador_cota2018 <- cota2018 %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_desc <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_desc)
```
Por outro lado, os senadores Ione Guimarães (PTB-GO) e Cristovam Buarque (PPS-DF) foram os que apresentaram menos despesas com a cota parlamentar.
Ione Guimarães é suplente de Lúcia Vânia (PSB-GO) e ficou menos dias em exercício do mandato.
Note que o nosso dataframe apresenta 74 nomes, sendo que são 81 senadores. Possivelmente, algum senador optou por não usar a cota. É necessária uma apuração para detectar os motivos.
```{r}
senador_cota2018_asc <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = FALSE),]
head(senador_cota2018_asc)
```
# ANÁLISE POR CATEGORIA
Aplicamos um filtro por categoria para saber qual foi o senador que gastou mais naquela determina categoria. Fazemo isso com todas as categorias.
Primeiro, precisa saber quais categorias nós temos.
```{r}
unique(cota2018$TIPO_DESPESA)
```
## CATEGORIA DA COTA
### DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Divulgação da atividade parlamentar") %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat1 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat1)
```
```{r}
summary(senador_cota2018_cat1)
```
## CATEGORIA DA COTA
### ALUGUEL DE ESCRITÓRIO POLÍTICO ETC
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Aluguel de imóveis para escritório político, compreendendo despesas concernentes a eles.") %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat2 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat2)
```
```{r}
summary(senador_cota2018_cat2)
```
## CATEGORIA DA COTA
### PASSAGENS AÉREAS ETC
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Passagens aéreas, aquáticas e terrestres nacionais") %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat3 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat3)
```
```{r}
summary(senador_cota2018_cat3)
```
## CATEGORIA DA COTA
### CONSULTORIAS, PESQUISAS ETC
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Contratação de consultorias, assessorias, pesquisas, trabalhos técnicos e outros serviços de apoio ao exercício do mandato parlamentar") %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat5 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat5)
```
```{r}
summary(senador_cota2018_cat5)
```
## CATEGORIA DA COTA
### ALIMENTAÇÃO, HOSPEDAGEM ETC
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Locomoção, hospedagem, alimentação, combustíveis e lubrificantes") %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat6 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat6)
```
```{r}
summary(senador_cota2018_cat6)
```
## CATEGORIA DA COTA
### DESPESAS POSTAIS, MATERIAL DE ESCRITÓRIO ETC
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Aquisição de material de consumo para uso no escritório político, inclusive aquisição ou locação de software, despesas postais, aquisição de publicações, locação de móveis e de equipamentos. ") %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat7 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat7)
```
```{r}
summary(senador_cota2018_cat7)
```
## CATEGORIA DA COTA
### SEGURANÇA PRIVADA
```{r}
senador_cota2018 <- cota2018 %>%
filter(TIPO_DESPESA == "Serviços de Segurança Privada" ) %>%
group_by(SENADOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
senador_cota2018_cat8 <- senador_cota2018[order(senador_cota2018$total_cota, decreasing = TRUE),]
head(senador_cota2018_cat8)
```
```{r}
summary(senador_cota2018_cat8)
```
## PARTE FINAL
Quais foram os gastos totais com cada categoria? Os senadores, em geral, pediram reembolso por despesas em quais categorias? E quais categorias tiveram menos pedidos de reembolso?
Podemos fazer essa busca por nome da empresa, com a coluna "FORNECEDOR", como vemos abaixo.
```{r}
empresa_cota2018 <- cota2018 %>%
group_by(FORNECEDOR) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
empresa_cota2018 <- empresa_cota2018[order(empresa_cota2018$total_cota, decreasing = TRUE),]
head(empresa_cota2018)
```
E também podemos fazer a busca pelo CNPJ, com a coluna "CNPJ_CPF".
```{r}
empresa_cota2018_2 <- cota2018 %>%
group_by(CNPJ_CPF) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
empresa_cota2018_2 <- empresa_cota2018_2[order(empresa_cota2018_2$total_cota, decreasing = TRUE),]
head(empresa_cota2018_2)
```
A quem pertece o CPNJ_CPF que mais recebeu dinheiro via Ceap no Senado em 2018?
Podemos pesquisar esse CNPJ_CPF no dataframe original. Há um lugar para a busca.
Temos um scatterplot com todos os pedidos de reembolso? Quais são os outliers?
```{r}
scatterplot_cota2018 <- ggplot(cota2018, aes(x = cota2018$TIPO_DESPESA,
y = cota2018$VALOR_REEMBOLSADO,
col = "red")) +
geom_point(alpha = 0.5, size = 3.5) +
labs(y = "Valor reembolsado (em R$)", caption = "Fonte: Senado Federal",
title = "Despesas de senadores com a cota parlamentar em 2018",
subtitle = "Distribuição mostra despesas, em R$, por categoria de gasto",
family = "Open Sans") +
theme(legend.position = "none",
axis.title.x = element_blank())
scatterplot_cota2018
```
Quais categorias tiveram mais gastos via Ceap no Senado em 2018? E quais tiveram menos?
```{r}
categoria_cota2018 <- cota2018 %>%
group_by(TIPO_DESPESA) %>%
summarise(total_cota = sum(VALOR_REEMBOLSADO))
categoria_cota2018 <- categoria_cota2018[order(categoria_cota2018$total_cota, decreasing = TRUE),]
head(categoria_cota2018)
```
E quanto cada categoria representa, em termos percentuais, em gasto do total de 2018?
```{r}
categoria_cota2018$gasto_2018 <- sum(categoria_cota2018$total_cota)
categoria_cota2018$perc <- as.double(categoria_cota2018$total_cota) / categoria_cota2018$gasto_2018
```
## OBRIGADA!
# FIM
You can’t perform that action at this time.