In [1]:
import requests as re
import pandas as pd
import numpy as np
import xmltodict
import xml.etree.ElementTree as ET
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

## Lista de endpoints disponíveis

In [2]:
endpoints = {
    'obterDeputados': 'http://www.camara.leg.br/SitCamaraWS/deputados.asmx/ObterDeputados', 
    'listarPresencasParlamentar': 'http://www.camara.leg.br/SitCamaraWS/sessoesreunioes.asmx/ListarPresencasParlamentar', 
    'listarPresencasDia': 'http://www.camara.leg.br/SitCamaraWS/sessoesreunioes.asmx/ListarPresencasDia',
    'obterVotacaoProposicao':'http://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao'
}

In [3]:
def fetch_data(url, params=None):
    response = re.get(url, params=params)
    print('Url: %s\nStatus: %s' % (response.url, response.status_code))
    return xmltodict.parse(response.content)

## Obter _dataset_ de deputados e salvar em um csv

In [4]:
root = fetch_data(endpoints['obterDeputados'])

Url: http://www.camara.leg.br/SitCamaraWS/deputados.asmx/ObterDeputados
Status: 200


In [5]:
deputados = root['deputados']['deputado']
deputados_df = pd.DataFrame.from_dict(deputados, orient='columns')


In [6]:
print('Quantidade de deputados: %d\nQuantidade de colunas: %d' % (deputados_df.shape))

Quantidade de deputados: 513
Quantidade de colunas: 16


In [215]:

deputados_df.head()

Unnamed: 0,ideCadastro,codOrcamento,condicao,matricula,idParlamentar,nome,nomeParlamentar,urlFoto,sexo,uf,partido,gabinete,anexo,fone,email,comissoes
0,178980,3283,Titular,361,5830382,ANTONIO GOULART DOS REIS,GOULART,http://www.camara.gov.br/internet/deputado/ban...,masculino,SP,PSD,533,4,3215-5533,dep.goulart@camara.gov.br,"{u'titular': None, u'suplente': None}"
1,141335,2152,Titular,19,5830714,JOSÉ ROBERTO OLIVEIRA FARO,BETO FARO,http://www.camara.gov.br/internet/deputado/ban...,masculino,PA,PT,723,4,3215-5723,dep.betofaro@camara.gov.br,"{u'titular': None, u'suplente': None}"
2,141531,2488,Titular,268,5830453,RODRIGO BATISTA DE CASTRO,RODRIGO DE CASTRO,http://www.camara.gov.br/internet/deputado/ban...,masculino,MG,PSDB,701,4,3215-5701,dep.rodrigodecastro@camara.gov.br,"{u'titular': None, u'suplente': None}"
3,141478,2551,Titular,412,5830785,LAERTE RODRIGUES DE BESSA,LAERTE BESSA,http://www.camara.gov.br/internet/deputado/ban...,masculino,DF,PR,340,4,3215-5340,dep.laertebessa@camara.gov.br,"{u'titular': None, u'suplente': None}"
4,178826,3712,Titular,368,5830405,SERGIO OLIMPIO GOMES,MAJOR OLIMPIO,http://www.camara.gov.br/internet/deputado/ban...,masculino,SP,SD,279,3,3215-5279,dep.majorolimpio@camara.gov.br,"{u'titular': None, u'suplente': None}"


In [7]:
# Salva dados em Csv
deputados_df.to_csv('deputados.csv', encoding='utf-8')

## Minerando presenças dos deputados

Foi-se utilizado uma base previamente limpa, que pode ser encontrada neste link: https://raw.githubusercontent.com/nazareno/dados-da-camara-federal/master/dados/votacoes.csv

In [8]:
votacoes = pd.read_csv('https://raw.githubusercontent.com/nazareno/dados-da-camara-federal/master/dados/votacoes.csv')
votacoes.columns

Index([u'tipo', u'num_pro', u'ano', u'id_votacao', u'data', u'hora', u'sessao',
       u'nome', u'id_dep', u'partido', u'uf', u'voto', u'orientacao_partido',
       u'orientacao_gov'],
      dtype='object')

In [9]:
votacoes.shape

(243916, 14)

In [10]:
votacoes.head()

Unnamed: 0,tipo,num_pro,ano,id_votacao,data,hora,sessao,nome,id_dep,partido,uf,voto,orientacao_partido,orientacao_gov
0,PEC,1,2015,1,22/3/2016,76200,5820,Ariosto Holanda,74103.0,pdt,CE,sim,sim,sim
1,PEC,1,2015,1,22/3/2016,76200,5820,Flavio Nogueira,191923.0,pdt,PI,sim,sim,sim
2,PEC,1,2015,1,22/3/2016,76200,5820,Zé Augusto Nalin,191945.0,pmdb,RJ,sim,,sim
3,PEC,1,2015,1,22/3/2016,76200,5820,Paulo Henrique Lustosa,141517.0,pp,CE,sim,sim,sim
4,PEC,1,2015,1,22/3/2016,76200,5820,Wilson Beserra,193066.0,pmdb,RJ,sim,,sim


In [11]:
meses = ['jan', 'fev', 'mar', 'abr', 'mai', 'jun', 'jul', 'ago', 'set', 'out', 'nov', 'dez']
votacoes['mes'] = [meses[int(x[1])-1] for x in votacoes['data'].str.split('/')]

In [37]:
votacoes_2017 = votacoes[votacoes['ano'] == 2017]

tipo                  24121
num_pro               24121
ano                   24121
id_votacao            24121
data                  24121
hora                  24121
sessao                24121
nome                  24121
id_dep                24121
partido               24121
uf                    24121
voto                  24121
orientacao_partido    24121
orientacao_gov        24121
mes                   24121
dtype: int64

In [116]:
votacoes_2017.head()

Unnamed: 0,tipo,num_pro,ano,id_votacao,data,hora,sessao,nome,id_dep,partido,uf,voto,orientacao_partido,orientacao_gov,mes
67363,PEC,304,2017,1,10/5/2017,76860,16201,Luiza Erundina,74784.0,psol,SP,não,não,sim,mai
67364,PEC,304,2017,1,10/5/2017,76860,16201,Roberto Alves,152610.0,prb,SP,sim,sim,sim,mai
67365,PEC,304,2017,1,10/5/2017,76860,16201,Lázaro Botelho,141480.0,pp,TO,sim,sim,sim,mai
67366,PEC,304,2017,1,10/5/2017,76860,16201,Sérgio Brito,73808.0,psd,BA,sim,sim,sim,mai
67367,PEC,304,2017,1,10/5/2017,76860,16201,Erivelton Santana,99654.0,pen,BA,não,,sim,mai


## Ordenando por presença em sessões no plenário

### Deputados com o menor número de presenças

In [201]:
presencas = votacoes_2017[votacoes_2017['voto'] <> '-'].groupby(votacoes_2017['nome'])['voto'].count()
presencas.sort_values().head(30)

nome
Rogério Silva           1
Lourival Gomes          1
Dagoberto               1
Edinho Bez              3
Mário Heringer          6
Carlos Zarattini        7
Vinicius Gurgel         9
Vicente Candido         9
Franklin               11
Marcos Medrado         11
Osmar Serraglio        12
Tia Eron               12
Chico D´Angelo         14
Roberto Freire         14
Aníbal Gomes           14
Ariosto Holanda        14
Giacobo                14
Guilherme Mussi        14
Roberto Góes           14
Luizianne Lins         15
Hermes Parcianello     15
Julião Amin Castro     15
Marco Maia             16
César Halum            16
Jéssica Sales          16
Wladimir Costa         16
Mário Negromonte Jr    16
João Carlos Bacelar    16
Evandro Gussi          17
Andre Moura            18
Name: voto, dtype: int64

### Deputados com maior número de presenças



In [221]:
presencas.sort_values(ascending=False).head(30)

nome
Carlos Manato               48
Tenente Lúcio               48
Ivan Valente                48
Flavinho                    48
Tiririca                    48
Walney Rocha                47
João Daniel                 47
Delegado Edson Moreira      47
Victor Mendes               47
Luiz Couto                  47
Carlos Henrique Gaguim      47
Miro Teixeira               47
Ronaldo Benedet             47
Afonso Motta                47
Rogério Peninha Mendonça    47
Glauber Braga               47
Valmir Assunção             46
Átila Lira                  46
Izaque Silva                46
Chico Lopes                 46
Jose Stédile                46
Jutahy Junior               46
Laudivio Carvalho           46
Lobbe Neto                  46
Marcio Alvino               46
Jarbas Vasconcelos          46
Expedito Netto              46
Bacelar                     46
Chico Alencar               45
Geovania de Sá              45
Name: voto, dtype: int64

### Deputados ausentes

In [222]:
ausencias = votacoes_2017[votacoes_2017['voto'] == '-'].groupby(votacoes_2017['nome'])['voto'].count()

In [223]:
ausencias.sort_values().head(30)

nome
Luciano Bivar               1
Miro Teixeira               1
Luiz Couto                  1
Laudivio Carvalho           1
Rogério Peninha Mendonça    1
João Daniel                 1
Josias Gomes                1
Mário Heringer              1
Glauber Braga               1
Afonso Motta                1
Jarbas Vasconcelos          1
Chico D Angelo              1
Fernando Torres             1
Walney Rocha                1
Pedro Chaves                1
Victor Mendes               1
Izaque Silva                2
Expedito Netto              2
Jutahy Junior               2
Geovania de Sá              2
Lobbe Neto                  2
Bacelar                     2
Chico Lopes                 2
Marcio Alvino               2
Marcos Medrado              2
Eduardo Bolsonaro           2
Jose Stédile                2
Francisco Chapadinha        2
Átila Lira                  2
Roberto Alves               2
Name: voto, dtype: int64