#### Access the requests.get method

In [1]:
import requests

#### Go to BeautifulSoup library

In [2]:
from bs4 import BeautifulSoup

#### Download the Senate voting page

In [3]:
page = requests.get("http://www25.senado.leg.br/web/atividade/materias/-/materia/votacao/2363507")

#### We can use the BeautifulSoup library to parse this document. We first have to import the library, and create an instance of the BeautifulSoup class to parse our document

In [4]:
soup = BeautifulSoup(page.content, 'html.parser')

#### We can now print out the HTML content of the page, formatted nicely, using the prettify method on the BeautifulSoup object

In [5]:
print(soup.prettify())

<!DOCTYPE html>
<html class="aui ltr" dir="ltr" lang="pt-BR">
 <head>
  <title>
   Resultado da Votação - Pesquisas - Senado Federal
  </title>
  <meta content="initial-scale=1.0, width=device-width" name="viewport"/>
  <meta content="text/html; charset=utf-8" http-equiv="content-type"/>
  <link href="http://www25.senado.leg.br/senado-theme/images/favicon.ico" rel="Shortcut Icon"/>
  <link href="http://www25.senado.leg.br/web/atividade/materias/-/materia/votacao/2363507" rel="canonical"/>
  <link href="http://www25.senado.leg.br/web/atividade/materias/-/materia/votacao/2363507" hreflang="x-default" rel="alternate"/>
  <link href="http://www25.senado.leg.br/web/atividade/materias" hreflang="pt-BR" rel="alternate"/>
  <link href="http://www25.senado.leg.br/en/web/atividade/materias" hreflang="en-US" rel="alternate"/>
  <link class="lfr-css-file" href="http://www25.senado.leg.br/senado-theme/css/aui.css?browserId=other&amp;themeId=senado_WAR_senadotheme&amp;minifierType=css&amp;languageId

#### Use the find_all method to search for items by class or by id. In the below example, we’ll search for ul tag that has the class unstyled. The first two lists have the vote of interest

In [25]:
listas = soup.find_all('ul' , class_='unstyled', limit=2)

In [26]:
listas

[<ul class="unstyled"> <li>0. Aécio Neves - Sim</li> <li>1. Aloysio Nunes Ferreira - Sim</li> <li>2. Alvaro Dias - Sim</li> <li>3. Ana Amélia - Sim</li> <li>4. Ângela Portela - Não</li> <li>5. Antonio Anastasia - Sim</li> <li>6. Antonio Carlos Valadares - Sim</li> <li>7. Armando Monteiro - Sim</li> <li>8. Ataídes Oliveira - Sim</li> <li>9. Benedito de Lira - Sim</li> <li>10. Cidinho Santos - Sim</li> <li>11. Ciro Nogueira - Sim</li> <li>12. Cristovam Buarque - Sim</li> <li>13. Dalirio Beber - Sim</li> <li>14. Dário Berger - Sim</li> <li>15. Davi Alcolumbre - Sim</li> <li>16. Deca - Sim</li> <li>17. Edison Lobão - Sim</li> <li>18. Eduardo Amorim - Sim</li> <li>19. Eduardo Braga - Sim</li> <li>20. Elmano Férrer - Sim</li> <li>21. Eunício Oliveira - Sim</li> <li>22. Fátima Bezerra - Não</li> <li>23. Fernando Bezerra Coelho - Sim</li> <li>24. Fernando Collor - Sim</li> <li>25. Flexa Ribeiro - Sim</li> <li>26. Garibaldi Alves Filho - Sim</li> <li>27. Gladson Cameli - Sim</li> <li>28. Gleisi

### Alternative method, with selenium and phantom js

In [1]:
from selenium import webdriver

In [2]:
path_to_phantomjs = '/Users/Reinaldo/Documents/phantomjs-2.1.1-windows/bin/phantomjs'

In [3]:
browser = webdriver.PhantomJS(executable_path = path_to_phantomjs)

In [4]:
browser.get("http://www25.senado.leg.br/web/atividade/materias/-/materia/votacao/2363507")

In [5]:
list_senadores = browser.find_elements_by_xpath(".//ul[@class='unstyled']")

In [6]:
print("Primeira coluna")
for lis in list_senadores[0].find_elements_by_css_selector("li"):
    print(lis.text)

Primeira coluna
0. Aécio Neves - Sim
1. Aloysio Nunes Ferreira - Sim
2. Alvaro Dias - Sim
3. Ana Amélia - Sim
4. Ângela Portela - Não
5. Antonio Anastasia - Sim
6. Antonio Carlos Valadares - Sim
7. Armando Monteiro - Sim
8. Ataídes Oliveira - Sim
9. Benedito de Lira - Sim
10. Cidinho Santos - Sim
11. Ciro Nogueira - Sim
12. Cristovam Buarque - Sim
13. Dalirio Beber - Sim
14. Dário Berger - Sim
15. Davi Alcolumbre - Sim
16. Deca - Sim
17. Edison Lobão - Sim
18. Eduardo Amorim - Sim
19. Eduardo Braga - Sim
20. Elmano Férrer - Sim
21. Eunício Oliveira - Sim
22. Fátima Bezerra - Não
23. Fernando Bezerra Coelho - Sim
24. Fernando Collor - Sim
25. Flexa Ribeiro - Sim
26. Garibaldi Alves Filho - Sim
27. Gladson Cameli - Sim
28. Gleisi Hoffmann - Não
29. Hélio José - Sim
30. Humberto Costa - Não
31. Ivo Cassol - Sim
32. Jader Barbalho - Sim
33. João Alberto Souza - Sim
34. João Capiberibe - Não
35. Jorge Viana - P-NRV
36. José Agripino - Sim
37. José Aníbal - Sim
38. José Maranhão - Sim
39. Jo

In [7]:
print("Segunda coluna")
for lis in list_senadores[1].find_elements_by_css_selector("li"):
    print(lis.text)

Segunda coluna
41. Kátia Abreu - Não
42. Lasier Martins - Sim
43. Lídice da Mata - Não
44. Lindbergh Farias - Não
45. Lúcia Vânia - Sim
46. Magno Malta - Sim
47. Marcelo Crivella - Sim
48. Marta Suplicy - Sim
49. Omar Aziz - Sim
50. Otto Alencar - Sim
51. Pastor Valadares - Sim
52. Paulo Bauer - Sim
53. Paulo Paim - Não
54. Paulo Rocha - Não
55. Pedro Chaves - Sim
56. Pinto Itamaraty - Sim
57. Raimundo Lira - Sim
58. Randolfe Rodrigues - Não
59. Regina Sousa - Não
60. Reguffe - Sim
61. Renan Calheiros - Presidente (art. 51 RISF)
62. Ricardo Ferraço - Sim
63. Roberto Muniz - Sim
64. Roberto Requião - P-NRV
65. Romário - LS
66. Romero Jucá - Sim
67. Ronaldo Caiado - Sim
68. Rose de Freitas - Sim
69. Sérgio Petecão - Sim
70. Simone Tebet - Sim
71. Tasso Jereissati - Sim
72. Telmário Mota - P-NRV
73. Valdir Raupp - Sim
74. Vanessa Grazziotin - Não
75. Vicentinho Alves - Sim
76. Virginio de Carvalho - AP
77. Waldemir Moka - Sim
78. Wellington Fagundes - Sim
79. Wilder Morais - Sim
80. Zeze 