# Resumo

Teste de um web crawling para extração de dados dos votos dos deputados no site camara (https://www.camara.leg.br)

# Bibliotecas

In [46]:
import pandas as pd
import requests as re 
from bs4 import BeautifulSoup

In [135]:
def busca_informacao_td(td):
    '''
    :param: td html 
    :return: conteudo da td
    '''
    cell = []
    for conteudo in td.contents:


        if conteudo is None:
            cell.append('')
        elif isinstance(conteudo,str):
            cell.append(conteudo.replace('\t','').replace('\r','').replace('\n','').replace('\xa0', '').rstrip().lstrip())
        else:
            if conteudo.string is not None:                
                cell.append(conteudo.string)
                
    return ' '.join(cell)
                

def busca_informacao_tr(tr):
    '''
    :param: tr html 
    :return: lista com conteudode cada td da tr
    '''    
    tds = list(map(busca_informacao_td, tr.find_all('td') ))
    if tds:
        return tds
    else:
        return list(map(busca_informacao_td, tr.find_all('th') ))
  

In [184]:
def request_votacoes_deputado(n_matricula):
    '''
    :param: numero de matricula do deputaado
    :return: retorna o dataframe das votacoes
    '''    
    url = 'https://www.camara.leg.br/internet/deputado/RelVotacoes.asp?nuLegislatura=56&nuMatricula='+str(n_matricula)+'&dtInicio=01/02/2019&dtFim=26/10/2019'
    
    soup = BeautifulSoup(re.get(url).content, 'html.parser')
    try:
        print('Testando página...')
        if soup.find_all('div', attrs={'id':'content'})[0].contents[1].string == 'Nenhuma informação encontrada.':
            print('############################################')
            print(f'\t\tRASPAGEM NÃO ENCONTRADA PARA DEPUTADO :   {n_matricula}')
            print('############################################')            
            return pd.DataFrame()

    except:
        pass
    print('Buscando...')
    nome_deputado = ''
    for h3 in soup.find_all('h3'):
        conteudo = h3.contents
        if nome_deputado == '':
            if len(conteudo) > 1:
                if 'Nome Parlamentar' in conteudo[0]:
                    nome_deputado = conteudo[1].string


    rows = soup.find_all('tr')
    tabela = list(map(busca_informacao_tr,rows))
    df = pd.DataFrame.from_records(tabela[1:],columns=tabela[0] )
    df['Deputado'] = nome_deputado
    print('############################################')
    print(f'\t\tRASPAGEM COMPLETA PARA DEPUTADO : {nome_deputado} - {n_matricula}')
    print('############################################')
    return df 

In [166]:
url = 'https://www.camara.leg.br/internet/deputado/RelVotacoes.asp?nuLegislatura=56&nuMatricula='+str(13)+'&dtInicio=01/02/2019&dtFim=26/10/2019'

soup = BeautifulSoup(re.get(url).content, 'html.parser')

In [177]:
soup.find_all('div', attrs={'id':'content'})[0].contents[1].string == 'Nenhuma informação encontrada.'

True

In [188]:
from time import sleep


In [189]:
l_df = []
for i in range(144,520): 
    sleep(10)
    l_df.append(request_votacoes_deputado(i))


Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : DANIEL COELHO - CIDADANIA/PE - 144
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : FELIPE CARRERAS - PSB/PE - 145
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : FERNANDO MONTEIRO - PP/PE - 146
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : FERNANDO RODOLFO - PL/PE - 147
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : DANILO CABRAL - PSB/PE - 148
############################################
Testando página...
Buscando...
##########################

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : DANIEL ALMEIDA - PCdoB/BA - 188
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : ANTONIO BRITO - PSD/BA - 189
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : ABÍLIO SANTANA - PL/BA - 190
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : ADOLFO VIANA - PSDB/BA - 191
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : ARTHUR OLIVEIRA MAIA - DEM/BA - 192
############################################
Testando página...
Buscando...
#############################

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : BILAC PINTO - DEM/MG - 232
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : DOMINGOS SÁVIO - PSDB/MG - 233
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : EMIDINHO MADEIRA - PSB/MG - 234
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : MARCELO ÁLVARO ANTÔNIO - PSL/MG - 235
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : MARCELO ARO - PP/MG - 236
############################################
Testando página...
Buscando...
##############################

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : DA VITORIA - CIDADANIA/ES - 276
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : DRA. SORAYA MANATO - PSL/ES - 277
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : FELIPE RIGONI - PSB/ES - 278
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : HELDER SALOMÃO - PT/ES - 279
############################################
Testando página...
############################################
		RASPAGEM NÃO ENCONTRADA PARA DEPUTADO :   280
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMP

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : PROFESSOR JOZIEL - PSL/RJ - 320
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : GURGEL - PSL/RJ - 321
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : RODRIGO MAIA - DEM/RJ - 322
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : TALÍRIA PETRONE - PSOL/RJ - 323
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : VINICIUS FARAH - MDB/RJ - 324
############################################
Testando página...
Buscando...
########################################

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : JOICE HASSELMANN - PSL/SP - 364
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : JÚNIOR BOZZELLA - PSL/SP - 365
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : KIM KATAGUIRI - DEM/SP - 366
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : LUIZ CARLOS MOTTA - PL/SP - 367
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : LUIZ PHILIPPE DE ORLEANS E BRAGANÇA - PSL/SP - 368
############################################
Testando página...
Buscando...
#########

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : PROFESSORA ROSA NEIDE - PT/MT - 408
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : BIA KICIS - PSL/DF - 409
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : CELINA LEÃO - PP/DF - 410
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : FLÁVIA ARRUDA - PL/DF - 411
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : JULIO CESAR RIBEIRO - REPUBLICANOS/DF - 412
############################################
Testando página...
#####################################

Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : GUSTAVO FRUET - PDT/PR - 452
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : LEANDRE - PV/PR - 453
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : LUISA CANZIANI - PTB/PR - 454
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : VERMELHO - PSD/PR - 455
############################################
Testando página...
############################################
		RASPAGEM NÃO ENCONTRADA PARA DEPUTADO :   456
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO 

Testando página...
############################################
		RASPAGEM NÃO ENCONTRADA PARA DEPUTADO :   497
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : HENRIQUE FONTANA - PT/RS - 498
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : BOHN GASS - PT/RS - 499
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : LIZIANE BAYER - PSB/RS - 500
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA DEPUTADO : LUCAS REDECKER - PSDB/RS - 501
############################################
Testando página...
Buscando...
############################################
		RASPAGEM COMPLETA PARA

In [190]:
df_total = pd.concat(l_df)

In [194]:

df_total.to_csv('./data/tb_votacoes_deputados_56.csv', sep=';', index=False)