### Web Scraping com Selenium 

#### O que é  o Selenium?

Biblioteca em python voltada a simular interações de um usuário em um navegador web.

#### Por que usar o Selenium?

O Selenium é uma ferramenta muito poderosa para web scraping, pois ele permite que você acesse páginas que são carregadas dinamicamente, ou seja, que são carregadas após a página inicial ser carregada.

#### Quando usar o Selenium?

- Interagir com páginas que são carregadas dinamicamente;
- Localizar elementos por XPath;
- Extrair dados de páginas que são carregadas dinamicamente.

#### Como instalar o Selenium?

Para instalar o Selenium, basta rodar o comando abaixo:


```python
!pip install selenium
```

In [21]:
from selenium import webdriver


driver = webdriver.Chrome()

driver.get("http://www.sigaa.unb.br/sigaa/verTelaLogin.do")

driver.quit()

### Como Loaclizar e Interagir com Elementos web com Selenium

#### Como Localizar:

- Por ID
- Por Name
- Por XPath
- Por CSS Selector
- Por Classe

#### Métodos:

- antigo = driver.find_element_by_*
- novo = driver.find_element

#### Exemplo: 

Encontrar os telefones disponiveis nesse site: https://webscraper.io/test-sites/e-commerce/allinone/phones

In [22]:
from selenium import webdriver
from selenium.webdriver.common.by import By


driver = webdriver.Chrome()

driver.get("https://webscraper.io/test-sites/e-commerce/allinone/phones")

lista_telefones = driver.find_elements(By.CLASS_NAME, "title")

for telefones in lista_telefones:
    print(telefones.text)

driver.quit()

Sony Xperia
Nokia 123
LG Optimus


#### Como interagir? 

- send keys - enviar texto
- click - clicar
- select - selecionar
- submit - enviar formulário

#### Exemplo:
Encontrar os computadores disponiveis nesse site: https://webscraper.io/test-sites/e-commerce/allinone/phones

In [23]:
from selenium import webdriver
from selenium.webdriver.common.by import By


driver = webdriver.Chrome()

driver.get("https://webscraper.io/test-sites/e-commerce/allinone/phones")

tela_laptops = driver.find_element(By.XPATH, '//*[@id="side-menu"]/li[2]/a')
tela_laptops.click()

lista_laptops = driver.find_elements(By.XPATH, '//*[@id="side-menu"]/li[2]/ul/li[1]/a')

driver.quit()

#### Explorando as capacidades de automação de interações com o selenium

#### Live coding -> https://quotes.toscrape.com/


- Login
- Filtro
- Paginação 
- Localizar elemento

In [1]:
from selenium import  webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()

driver.get("https://quotes.toscrape.com/")
login = driver.find_element(By.XPATH, '/html/body/div/div[1]/div[2]/p/a')
login.click()
driver.get("https://quotes.toscrape.com/login")
username = driver.find_element(By.ID, 'username')
username.send_keys("admin")
password = driver.find_element(By.ID, 'password')
password.send_keys("admin")
login = driver.find_element(By.XPATH, '/html/body/div/form/input[2]')
login.click()

humor = driver.find_element(By.XPATH, '/html/body/div/div[2]/div[2]/span[4]/a')
humor.click()

botao_next = driver.find_element(By.XPATH, '/html/body/div/div[2]/div[1]/nav/ul/li/a')
botao_next.click()

texto = driver.find_element(By.CSS_SELECTOR , 'body > div > div:nth-child(3) > div.col-md-8 > div:nth-child(1) > span.text').text
print (texto)

driver.quit()

“I am free of all prejudice. I hate everyone equally. ”


### Lidando com temas mais avançados com Selenium

Com Selenium podemos simular interações mais complexas de usuário, em páginas web, como:

- Cookies personalizados;
- Requisições AJAX;
- Lazy loading;
- Carregamento condicionado;
- Timeout.



#### Cookies Personalizados


cookie = {name : 'name', value : 'value'}
driver.add_cookie(cookie)
driver.get_cookies()



In [25]:

from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()

driver.get("https://quotes.toscrape.com/")

cookie = {'name' : 'name', 'value' : 'value'}
driver.add_cookie(cookie)
driver.get_cookies()

driver.quit()

[{'domain': 'quotes.toscrape.com',
  'httpOnly': False,
  'name': 'name',
  'path': '/',
  'sameSite': 'Lax',
  'secure': True,
  'value': 'value'}]

#### Requisições AJAX e Lazy Loading

htttps://scrapthissite.com/pages/ajax-javascript/#2013

#### Espera Explicita

```python
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# Espera até que o elemento esteja visível, máximo de 10 segundos
elemento = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.ID, "elemento"))
)
```

#### Espera Implicita

```python
driver = webriver.chrome()
driver.implicitly_wait(10)
```