## Extraindo dados de votação de preposições

In [1]:
import pandas as pd
import pandasql as ps
import numpy as np
import json, requests 
#import xml.etree.ElementTree as ET
from bs4 import BeautifulSoup

### Extração dos dados

Capturando as informações das proposicões votadas por tipo e ano

In [2]:
def getProposicoes(tipo, ano):
    url_votacoes = "https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ListarProposicoesVotadasEmPlenario?ano="+ano+"&tipo="+tipo
    response = requests.get(url_votacoes)
    dados_req = BeautifulSoup(response.content, 'html.parser')
    dados_req

    codproposicao = []
    nomeproposicao = []
    datavotacao = []
    for row in dados_req.findAll("proposicao"):
        codproposicao.append(row.find('codproposicao').text)
        nomeproposicao.append(row.find('nomeproposicao').text)
        datavotacao.append(row.find('datavotacao').text)

    tipoproposicao = []
    numeroproposicao = []
    anoproposicao = []
    for i in nomeproposicao:
        tipoproposicao.append(i.split(" ")[0])
        numeroproposicao.append(i.split(" ")[1].split("/")[0])
        anoproposicao.append(i.split(" ")[1].split("/")[1])

    proposicoes = pd.DataFrame()
    proposicoes['CodProposicao'] = codproposicao
    proposicoes['TipoProposicao'] = tipoproposicao
    proposicoes['NumeroProposicao'] = numeroproposicao
    proposicoes['AnoProposicao'] = anoproposicao
    proposicoes['DataVotacao'] = datavotacao
    return proposicoes


In [3]:
from pandasql import sqldf

def getQuery(q):
    pysqldf = lambda q: sqldf(q, globals())
    return pysqldf(q)


Capturando informações da orientação da bancada

In [4]:
# capturando informação da orientação da bancada
def orientacaoBancada(dadosxml, codsessao, varprop):
    dados = dadosxml.find('votacao', codsessao=codsessao)
    dataVotacao = dados.get('data')
    objVotacao = dados.get('objvotacao')
    proposicao = varprop
    
    bancada_codSessao = []
    bancada_proposicao = []
    bancada_objvotacao = []
    bancada_data = []
    bancada_partido = []
    bancada_orientacao = []
    
    for row in dados.findAll("orientacaobancada"):
        cells = row.findAll('bancada')
        for tag in cells:
            bancada_partido.append(tag.get('sigla'))
            bancada_orientacao.append(tag.get('orientacao'))
            bancada_objvotacao.append(objVotacao)
            bancada_data.append(dataVotacao)
            bancada_codSessao.append(codsessao)
            bancada_proposicao.append(proposicao)
    
    bancada = pd.DataFrame()
    bancada['CodSessao'] = bancada_codSessao
    bancada['Proposicao'] = bancada_proposicao
    bancada['Bancada'] = bancada_partido
    bancada['Orientacao'] = bancada_orientacao
    bancada['ObjVotacao'] = bancada_objvotacao
    bancada['DataVotacao'] = bancada_data
    return bancada


Capturando informações da votação dos parlamentares

In [5]:
# capturando informação da votação
def votosParlamentar(dadosxml, codsessao, varprop):
    dados = dadosxml.find('votacao', codsessao=codsessao)
    dataVotacao = dados.get('data')
    objVotacao = dados.get('objvotacao')
    proposicao = varprop
    
    dep_codSessao = []
    dep_objVotacao = []
    dep_proposicao =[]
    dep_id = []
    dep_data = []
    dep_nome = []
    dep_partido = []
    dep_uf = []
    dep_voto = []
    for row in dadosxml.findAll("votos"):
        cells = row.findAll('deputado')
        for tag in cells:
            dep_id.append(tag.get('idecadastro'))
            dep_nome.append(tag.get('nome'))
            dep_partido.append(tag.get('partido').replace(" ",""))
            dep_uf.append(tag.get('uf'))
            dep_voto.append(tag.get('voto').replace(" ",""))
            dep_codSessao.append(codsessao)
            dep_objVotacao.append(objVotacao)
            dep_data.append(dataVotacao)
            dep_proposicao.append(proposicao)
    
    votacao = pd.DataFrame()
    votacao['CodSessao'] = dep_codSessao
    votacao['Proposicao'] = dep_proposicao
    votacao['IdParlamentar'] = dep_id
    votacao['Parlamentar'] = dep_nome
    votacao['Partido'] = dep_partido
    votacao['Uf'] = dep_uf
    votacao['Voto'] = dep_voto
    votacao['ObjVotacao'] = dep_objVotacao
    votacao['Data'] = dep_data
    return votacao


Extraindo dados de Orientação da Bancada

In [6]:
def extraiVotosBancada(df_proposicoes):
    dfOrientacaoBancada = pd.DataFrame(columns=["CodSessao","Bancada","Orientacao","ObjVotacao","DataVotacao"])
    q="""SELECT DISTINCT CodProposicao, TipoProposicao, NumeroProposicao, AnoProposicao FROM proposicoes;"""
    df_proposicoes = getQuery(q)
    for x, y, z in zip(df_proposicoes['TipoProposicao'], df_proposicoes['NumeroProposicao'], df_proposicoes['AnoProposicao']):
        print("----------------")
        print(x,y,z)
        varprop = x + " " + y + " " + z
        url = "https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo="+x+"&numero="+y+"&ano="+z
        header = { 'Accept': 'application/xml' }
        response = requests.get(url)
        dadosxml = BeautifulSoup(response.content, 'html.parser')
        print(url)
        for votacao in dadosxml.findAll("votacoes"):
            linhas = votacao.findAll('votacao')
            for tag in linhas:
                print(tag.get('codsessao'), "-", tag.get('objvotacao'))

                df_orientacao = orientacaoBancada(dadosxml, tag.get('codsessao'), varprop)
                dfOrientacaoBancada = pd.concat([dfOrientacaoBancada, df_orientacao])
    return dfOrientacaoBancada

Extraindo os dados de Votação do Parlamentar

In [7]:
def extraiVotosParlamentar(proposicoes):
    dfVotosParlamentares = pd.DataFrame(columns=["CodSessao","IdParlamentar","Parlamentar","Partido","Uf","Voto","ObjVotacao","Data"])
    q="""SELECT DISTINCT CodProposicao, TipoProposicao, NumeroProposicao, AnoProposicao FROM proposicoes;"""
    df_proposicoes = getQuery(q)
    for x, y, z in zip(df_proposicoes['TipoProposicao'], df_proposicoes['NumeroProposicao'], df_proposicoes['AnoProposicao']):
        print("----------------")
        print(x,y,z)
        varprop = x + " " + y + " " + z
        url = "https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo="+x+"&numero="+y+"&ano="+z
        header = { 'Accept': 'application/xml' }
        response = requests.get(url)
        dadosxml = BeautifulSoup(response.content, 'html.parser')
        print(url)
        for votacao in dadosxml.findAll("votacoes"):
            linhas = votacao.findAll('votacao')
            for tag in linhas:
                print(tag.get('codsessao'), "-", tag.get('objvotacao'))

                df_votos = votosParlamentar(dadosxml, tag.get('codsessao'), varprop)
                dfVotosParlamentares = pd.concat([dfVotosParlamentares, df_votos])
    return dfVotosParlamentares

Extraindo os dados de Proposições

In [8]:
tipo = ["PEC", "MPV", "PLP", "PL"]
ano = "2019"
proposicoes = pd.DataFrame(columns=["CodProposicao","TipoProposicao","NumeroProposicao","AnoProposicao","DataVotacao"])
for t in tipo:
    proposicoes = pd.concat([proposicoes, getProposicoes(t, ano)])
print("Tipos:", tipo)
proposicoes.head()

Tipos: ['PEC', 'MPV', 'PLP', 'PL']


Unnamed: 0,CodProposicao,TipoProposicao,NumeroProposicao,AnoProposicao,DataVotacao
0,516111,PEC,70,2011,05/06/2019
1,516111,PEC,70,2011,05/06/2019
2,516111,PEC,70,2011,05/06/2019
3,946494,PEC,2,2015,26/03/2019
4,946494,PEC,2,2015,26/03/2019


In [9]:
dfVotosParlamentares = extraiVotosParlamentar(proposicoes)

----------------
PEC 70 2011
https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PEC&numero=70&ano=2011
16828 - EMENDA AGLUTINATIVA Nº 1
16828 - PROPOSTA DE EMENDA À CONSTITUIÇÃO - 2º TURNO
16828 - EMENDA DE REDAÇÃO Nº 1
----------------
PEC 2 2015


of pandas will change to not sort by default.

To accept the future behavior, pass 'sort=False'.




https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PEC&numero=2&ano=2015
16761 - PROPOSTA DE EMENDA À CONSTITUIÇÃO - SEGUNDO TURNO
16761 - DTQ. 1 - BLOCO PSL - §11 DO ART. 165, CONST. DO ART. 1º DO SUBSTITUTIVO
16761 - DTQ. 2 - BLOCO PSL - EXP. "NOS TERMOS DE LEI COMPLEMENTAR", ...
16761 - SUBSTITUTIVO DA COMISSÃO ESPECIAL
16761 - EMENDAS DE REDAÇÃO DE NºS 1 A 4
----------------
PEC 372 2017
https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PEC&numero=372&ano=2017
16955 - PROPOSTA DE EMENDA À CONSTITUIÇÃO - PRIMEIRO TURNO
16983 - PROPOSTA DE EMENDA A CONSTITUIÇÃO - SEGUNDO TURNO
16983 - DTQ 1 - PL - EXP: "ALÉM DE OUTRAS ATRIBUIÇÕES..."
----------------
PEC 391 2017
https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PEC&numero=391&ano=2017
17027 - EMENDA Nº 1
17027 - REQUERIMENTO DE RETIRADA DE PAUTA
17027 - PROPOSTA DE EMENDA À CONSTITUIÇÃO - PRIMEIRO TURNO
17027 - PROPOSTA DE EMENDA À CONS

16901 - REQUERIMENTO DE ADIAMENTO DA VOTAÇÃO POR 2 SESSÕES
16901 - REQUERIMENTO DE VOTAÇÃO ARTIGO POR ARTIGO
16902 - REQUERIMENTO DE RETIRADA DE PAUTA
----------------
MPV 881 2019
https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=MPV&numero=881&ano=2019
16894 - PARECER DA C.M P/ ATEND. DOS PRESSUPOSTOS CONSTITUCIONAIS...
16894 - REQUERIMENTO DE RETIRADA DE PAUTA
16893 - REQUERIMENTO DE VOTAÇÃO NOMINAL DO REQ. DE RETIRADA DE PAUTA
16896 - DTQ 5 - PSC - ART. 18 DO PLV À MP Nº 881/2019, QUE INCLUI ART. 82-A...
16894 - REQUERIMENTO DE ENCERRAMENTO DA DISCUSSÃO E DO ENCAMINHAMENTO
16896 - DTQ 8 - PT - §3º, ART. 74 DO DECRETO DE LEI Nº 5.452/1943...
16895 - DTQ 9 - PT - § 4º, ART. 50 DA LEI Nº 10.406/2002...
16895 - DTQ 10 - PT - ART. 70 DO DECRETO LEI Nº 5.452/1943...
16895 - DTQ 20 - PCdoB - ART. 68 CONTIDO NO ART. 28 DO PLV
16895 - DTQ 27 - PSOL - ART. 67 CONST. DO ART. 28 DO PLV
16894 - EMENDA AGLUTINATIVA Nº 1
16895 - EMA 4 - EMENDA AGLUTINATIVA Nº 4
16

16727 - REQUERIMENTO DE ADIAMENTO DA DISCUSSÃO POR 2 SESSÕES
----------------
PL 10985 2018
https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PL&numero=10985&ano=2018
16845 - REQUERIMENTO DE VOTAÇÃO NOMINAL DO REQ. DE RETIRADA DE PAUTA
16845 - DTQ 4 - NOVO - ART. 3º DO PL 10.985/2018
16846 - DTQ 6 - PSL - ART. 4º DO PL 10.985/2018
----------------
PL 5029 2019
https://www.camara.leg.br/SitCamaraWS/Proposicoes.asmx/ObterVotacaoProposicao?tipo=PL&numero=5029&ano=2019
16930 - REQUERIMENTO DE RETIRADA DE PAUTA
16931 - REQUERIMENTO DE VOTAÇÃO DAS EMENDAS UMA A UMA
16931 - DTQ 1: NOVO - EMENDA SUPRESSIVA DO SENADO FEDERAL, QUE SUPRIMIU O ART. 44...
16930 - REQUERIMENTO DE ADIAMENTO DA DISCUSSÃO POR 2 SESSÕES
16931 - DTQ 2: PSL - EMENDA DO SENADO FEDERAL QUE SUPRIME O INCISO X DO ART. 44...
16931 - DTQ 3: PSL - EMENDA DO SENADO FEDERAL QUE SUPRIME O ART. 11 DA LEI Nº 9504/97
16931 - DTQ 4: PSL - EMENDA DO SENADO FEDERAL QUE SUPRIME O INCISO VIII DO ART. 44...


In [10]:
dfVotosParlamentares.head()

Unnamed: 0,CodSessao,Data,IdParlamentar,ObjVotacao,Parlamentar,Partido,Proposicao,Uf,Voto
0,16828,5/6/2019,141417,EMENDA AGLUTINATIVA Nº 1,Edio Lopes,PL,PEC 70 2011,RR,Sim
1,16828,5/6/2019,204465,EMENDA AGLUTINATIVA Nº 1,Haroldo Cathedral,PSD,PEC 70 2011,RR,Sim
2,16828,5/6/2019,178959,EMENDA AGLUTINATIVA Nº 1,Hiran Gonçalves,PP,PEC 70 2011,RR,Sim
3,16828,5/6/2019,160531,EMENDA AGLUTINATIVA Nº 1,Jhonatan de Jesus,PRB,PEC 70 2011,RR,-
4,16828,5/6/2019,204468,EMENDA AGLUTINATIVA Nº 1,Joenia Wapichana,REDE,PEC 70 2011,RR,Sim


In [11]:
ano_list = []
for i in dfVotosParlamentares['Data']:
    ano_list.append(i.split('/')[2])
dfVotosParlamentares['Ano'] = ano_list

In [12]:
# Removendo votação que possa não ter ocorrido no ano selecionado
dfVotosParlamentares = dfVotosParlamentares.query("Ano=='"+ano+"'")

In [13]:
print("Base de dados do ano de", ano, "contém", dfVotosParlamentares.shape[0], "linhas e", dfVotosParlamentares.shape[1], "colunas.")

Base de dados do ano de  2019 contém 2250300 linhas e 10 colunas.


In [17]:
#Exportando para csv
dfVotosParlamentares.to_csv('dados/votos_2019.csv', sep=';', index=False)