## Gastos do Legislativo municipal em 2017, por categorias de despesa 

**Autor:** Rodolfo Viana<br>
**Data:** 5 de novembro de 2017<br>
**Fonte de dados:** Câmara dos Vereadores de São Paulo<br>
**Extração de dados:** Raspagem via [script próprio](https://github.com/rodolfo-viana/globo/blob/master/scripts/vereadores_sp_gastos_v1.py) (disponível em modo privado), realizada em 4 de novembro de 2017<br>
**Arquivo de origem:** gastos_vereadores.csv<br>
**Ferramentas**: Python 2.7, Jupyter, Pandas

In [1]:
import pandas as pd

# Leitura do arquivo .csv
dataset = pd.read_csv('data/gastos_vereadores.csv', 
                      sep=';', 
                      low_memory=False)

# Seleção do ano de 2017
dataset = dataset[dataset['ano'] == 2017]

# Alteração dos nomes das categorias para torná-las legíveis
dataset['despesa'] = dataset['despesa'].astype('category')
dataset['despesa'].cat.rename_categories(['Aperfeiçoamento profissional',
                                          'Jornais e revistas',
                                          'Combustível',
                                          'Publicidade',
                                          'Contratação de PJ',
                                          'Correios',
                                          'Criação/Manutenção de site',
                                          'Eventos',
                                          'Correios (intermediado)',
                                          'Veículos (intermediado)',
                                          'Xerox (intermediado)',
                                          'Limpeza de veículos',
                                          'Livros',
                                          'Aluguel de móveis/equipamentos',
                                          'Veículos',
                                          'Lubrificante',
                                          'Material de escritório',
                                          'Internet',
                                          'Xerox',
                                          'Telefone fixo',
                                          'Telefone celular'], inplace=True)

# Agrupamento por despesas e soma de valores
dataset_categorias = dataset.groupby(['despesa'])\
                            .agg({'valor': sum})\
                            .sort_values(by = 'valor', ascending = False)\
                            .reset_index()

# Definição do percentual
dataset_categorias['porcentagem'] = (dataset_categorias['valor']\
                                     / dataset_categorias['valor']\
                                     .sum()) * 100

# Adequação para duas casas de fração em 'valor' e 'porcentagem'
dataset_categorias['valor'] = dataset_categorias['valor'].map("{0:.2f}".format)
dataset_categorias['porcentagem'] = dataset_categorias['porcentagem'].map("{0:.2f}".format)

# Resultado
dataset_categorias

Unnamed: 0,despesa,valor,porcentagem
0,Publicidade,1763960.81,23.0
1,Contratação de PJ,1648478.8,21.49
2,Criação/Manutenção de site,871726.59,11.37
3,Veículos (intermediado),808896.86,10.55
4,Correios (intermediado),672856.72,8.77
5,Material de escritório,652705.97,8.51
6,Aluguel de móveis/equipamentos,493798.74,6.44
7,Combustível,318643.85,4.15
8,Telefone celular,96553.43,1.26
9,Xerox,94570.33,1.23
