# Automação Web com Python

## Web-Scraping com Selenium

Idealmente, utilizar o navegador Chrome para realizar os processos, pois ele é o que tem maior compatibilidade com Selenium e com as funções utilizadas. 
Para instalar o selenium, use o pip:

    pip install --upgrade selenium

Podemos baixar o driver do chrome [aqui](https://chromedriver.chromium.org/downloads) e coloque o arquivo na pasta onde o Python está instalado.

Para testar se funionou use o seguinte código:

    from selenium import webdriver

    navegador = webdriver.Chrome()

Se abrir uma aba do navegador chrome, funcionou normalmente. Se não abrir a aba, verifique se o caminho do ChromeDriver está correto.
Tem também a opção de utilizar a biblioteca `webdriver-manager` para gerenciar o ChromeDriver automaticamente, mas normalmente ela retarda a execução do código, pois instala o ChromeDriver a cada vez que o código é executado.

## Acessar paginas com o Selenium
Agora com o Selenium instalado, podemos dar sequência. Utilizaremos o `webdriver-manager` para gerenciar o ChromeDriver automaticamente, mesmo que ele deixe a execução do código um pouco mais lenta, pois assim conseguiremos controlar as versões automaticamente. 

### Criando o navegador:
Nessa primeira célula de código iremos criar o navegador Chrome de forma que, ele será "criado" uma única vez, e não necessitará baixar o driver mais vezes. 

In [1]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from webdriver_manager.chrome import ChromeDriverManager

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)

### Fazendo as interações com o navegador:
Agora, na célula de código, iremos interagir com o navegador, de forma que podemos pesquisar a página desejada, e mesmo que mudemos a página, ele irá pesquisar novamente no navegador já aberto, não abrindo um novo navegador.
Podemos abrir tanto páginas web, quanto arquivos html locais no disco. 

Obs: Se quisermos, podemos usar código com a lib `os` para identificar o caminho do arquivo e se ele estiver na mesma pasta do arquivo python que estamos codando, irá facilitar e diminuir o código.

In [2]:
import os
caminho_do_arquivo = os.getcwd() + r'\Pagina Hashtag.html'
navegador.get(rf'{caminho_do_arquivo}')
# Ou
# navegador.get('https://www.youtube.com/')

# Obtendo elementos da página com Selenium:

## Como buscar e selecionar elementos únicos com selenium:
Podemos selecionar os elementos de uma página utilizando métodos semelhantes ao javascript, por exemplo, usando o Id de um item. Para selecionar itens precisamos importar uma classe do Selenium chamado `By`.

    from selenium.webdriver.common.by import By

Quando procuramos por um item específico, usamos o método `.find_element()`, nele iremos passar o tipo de seleção e o valor do id do elemento (se formos de fato selecionar pelo id, caso contrário, pode-se selecionar por outros valores, como explicado na documentação do selenium).
Se houver então uma ID, podemos usar o método `.find_elements()` passando como parametros `By.ID` e o id do elemento.
<br>
Exemplo:

In [3]:
# campo_nome_form = navegador.find_element(By.ID, 'fullname')
# campo_nome_form.send_keys('Fulano de Tal')

## ou podemos fazer em uma linha de código somente:

navegador.find_element(By.ID, 'fullname').send_keys('Fulano de Tal')
navegador.find_element(By.ID, 'email').send_keys('fulano@email.com')
navegador.find_element(By.ID, '_form_176_submit').click()

Dessa forma selecionamos o campo nome, o campo de email clicamos no botão de envio e então enviamos os dados. Se selecionarmos algum item que possua algum valor específico,podemos atribuir este valor a uma variável.

Agora, se o elemento desejado não tem id, podemos conferir se ele tem classe, tendo classe, parece ser uma classe única (ao menos na página em questão.). Se for uma classe única, usaremos o método `find_element()` passando como parametros `By.CLASS_NAME` e o nome da classe.
<br>
Exemplo:

In [4]:
navegador.find_element(By.CLASS_NAME, 'custom-logo').click()

NoSuchWindowException: Message: no such window: target window already closed
from unknown error: web view not found
  (Session info: chrome=127.0.6533.120)
Stacktrace:
	GetHandleVerifier [0x00CA8923+23283]
	(No symbol) [0x00C6E934]
	(No symbol) [0x00BA0733]
	(No symbol) [0x00B7D2E3]
	(No symbol) [0x00C0A64F]
	(No symbol) [0x00C1C686]
	(No symbol) [0x00C041B6]
	(No symbol) [0x00BD8017]
	(No symbol) [0x00BD890D]
	GetHandleVerifier [0x00D9A5F3+1013699]
	GetHandleVerifier [0x00DA3E4C+1052700]
	GetHandleVerifier [0x00D9D4B4+1025668]
	GetHandleVerifier [0x00CCEA2B+179195]
	(No symbol) [0x00C76833]
	(No symbol) [0x00C73198]
	(No symbol) [0x00C73337]
	(No symbol) [0x00C6B4BE]
	BaseThreadInitThunk [0x76467BA9+25]
	RtlInitializeExceptionChain [0x76FDC10B+107]
	RtlClearBits [0x76FDC08F+191]


Agora, se a classe não parece ser única, podemos usar o `XPATH` para localizar o elemento. Fazemos isso da seguinte forma:
* No navegador, com o elemento selecionado, clicamos com o botão direito sobre ele no painel do DevTools e escolhemos a opção "Copy" depois escolhemos a opção "Copy XPath" e teremos XPath daquele elemento.
* Utilizamos o `find_element()` passando como parametros `By.XPATH` e o XPath do elemento.
<br>
Exemplo:

In [None]:
navegador.find_element(By.XPATH, '//*[@id="header"]/div/div/div[1]/a/img').click()

### Uso:
Portanto podemos usar a seleção de arquivos únicos de forma simples na seguinte sequência:
1. `By.ID` para selecionar um item pelo id que é o parâmetro mais difícil de ser alterado em uma página Web.
2. `By.CLASS_NAME` para seleção de elementos por uma classe que é mais simples de ser alterado em uma página Web, mas ainda assim, é evitado de fazer. 
3. `By.XPATH` para seleção de elementos por um XPath que é o mais simples e eficaz, mas páginas que usam paginação dinâmica ou utilizam a renderização como a do React, podem dificultar a seleção de elementos.

### Outras formas de seleção:

#### Seleção por tag (TAG_NAME):
Em uma ocasião onde queremos obter dados atribuídos especificamente a determinadas tags, podemos usar `By.TAG_NAME`.

In [None]:
titulo_pagina = navegador.find_element(By.TAG_NAME, 'h2').text

print(f'Título da Página: {titulo_pagina}')

Título da Página: TODOS OS CURSOS DA HASHTAG TREINAMENTOS


#### Selecionar pelo Partial Link Text (ou LINK_TEXT)
Quando queremos seleção de link através de algum texto parcial do mesmo podemos utilizar `By.PARTIAL_LINK_TEXT`. Mas atenção no case senitive, pois se por ventura, alguma letra estiver escrita em case diferente, o Selenium não irá encontrar o elemento, retornando um erro.

In [None]:
numero_whatsapp = navegador.find_element(By.PARTIAL_LINK_TEXT, 'WhatsApp').text
print(f'Número do Whatsapp: {numero_whatsapp[:16]}')

Número do Whatsapp: (21) 99865-8852 


Se tiver o texto inteiro correto, podemos usar `By.LINK_TEXT`.

In [None]:
numero_whatsapp_2 = navegador.find_element(By.LINK_TEXT, '(21) 99865-8852 (WhatsApp)').text
print(f'Número do Whatsapp: {numero_whatsapp_2[:16]}')

Número do Whatsapp: (21) 99865-8852 


#### Seleção por Name (NAME):
Podemos usar `By.NAME` para seleção de elementos pelo nome do campo de formulário. Dessa forma, podemos obter facilmente dados preenchidos no formulário.

In [None]:
# navegador.find_element(By.NAME, 'email').send_keys('fulano@email')

navegador.find_element(By.NAME, 'email').send_keys('fulano@email')


---

## Como buscar e selecionar vários elementos com selenium:

Como demonstrado anteriormente, podemos encontrar elementos únicos na página usando o `find_element()` e atribuindo como parâmetros algumas das forma de obtenção de valores do mesmo. Para buscar vários elementos, podemos usar o `find_elements()` e seguir a mesma sequência de seleção.

A grande diferença é que `find_elements()` retorna uma lista de elementos, ao invés de um único elemento.

In [None]:
lista_elementos = navegador.find_elements(By.CLASS_NAME, "nav-link")
for elemento in lista_elementos:
    if elemento.text.upper() == 'BLOG':
        elemento.click()
        break



Abaixo, uma forma de obter os links da página (todos os href's referenciados a uma Tag `<a>` usando `find_elements()`).

In [None]:
links = navegador.find_elements(By.TAG_NAME, 'a')
# Se que quiser pegar os links que possuem 'whatsapp' em algum lugar do texto
for link in links:
    if "whatsapp" in link.text.lower():
        print(f'Link: {link.get_attribute("href")}')
        break
print('Fim da Pesquisa do whatsapp.')
print('= ='*50)


Link: https://api.whatsapp.com/send?phone=5521998658852&text=Ol%C3%A1%2C%20gostaria%20de%20tirar%20uma%20d%C3%BAvida%20%20sobre%20o%20curso%20online
Fim da Pesquisa do whatsapp.
= == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == == =


TypeError: argument of type 'NoneType' is not iterable

### Pegar os atributos de um elemento:

Podemos precisar pegar os atributos de um elemento, como por exemplo o 'href', para isso, podemos utilizar o método `get_attribute()`.

1. Obter o link do Whatsapp:

In [None]:
## Minha versão:
links = navegador.find_elements(By.TAG_NAME, 'a')
# Se que quiser pegar os links que possuem 'whatsapp' em algum lugar do texto
for link in links:
    if "whatsapp" in link.text.lower():
        print(f'Link: {link.get_attribute("href")}')
        break
print('Fim da Pesquisa do whatsapp.')
print('= ='*50)

In [None]:
# Versão do professor:

texto = navegador.find_element(By.XPATH, '/html/body/footer/div/div[1]/div[2]/div/a[2]').get_attribute('href')
print(texto)

https://api.whatsapp.com/send?phone=5521998658852&text=Ol%C3%A1%2C%20gostaria%20de%20tirar%20uma%20d%C3%BAvida%20%20sobre%20o%20curso%20online


2. Para pegar os links de todas imagens:

In [None]:
figures_elements = navegador.find_elements(By.TAG_NAME, 'figure')
for figure in figures_elements:
    images_links = figure.find_elements(By.TAG_NAME, 'a')
    if images_links == '':
        print('Este elemento não possui imagens.')
        continue
    else:
        for image_link in images_links:
            print(f'Link da imagem: {image_link.get_attribute("href")}')


Link da imagem: https://www.hashtagtreinamentos.com/curso-de-excel-online
Link da imagem: https://www.hashtagtreinamentos.com/curso-power-bi
Link da imagem: https://www.hashtagtreinamentos.com/curso-python
Link da imagem: https://www.hashtagtreinamentos.com/curso-sql
Link da imagem: https://www.hashtagtreinamentos.com/curso-vba-excel


# Interação com página web usando Selenium:

## Preenchendo formulários com selenium:

Abaixo serão feitos vários exemplos de preenchimento de formulários usando Selenium.

In [None]:
# Script padrão para iniciar o navegador Chrome com o selenium e abrir a página web específica. 
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)
caminho_do_arquivo = os.path.join(os.getcwd(), 'formulario.html')
navegador.get(caminho_do_arquivo)

### Botão  "normal" padrão (botão de clicar simples):
Para clicar em um botão normal podemos usar o método `.click()` do Selenium após selecionar o elemento usando `find_element()` ou `find_elements()`.
No caso do botão em questão, ao clicar nele, irá gerar um pop-up com um alerta com a mensagem "Você clicou em mim!", no código, podemos usar o método `switch_to.alert.accept()` para aceitar o alerta e `switch_to.alert.dismiss()` para fechar o alerta.

In [None]:
navegador.find_element(By.XPATH, '/html/body/form/input[1]').click()
alerta = navegador.switch_to.alert
alerta.accept()

#### Dica: 
* Esteja atento ao atributo "value" dos inputs, ele pode te ajudar a obter os valores dos inputs, como por exemplo, utilizando o método `get_attribute('value')` iremos receber o valor do input de texto por exemplo.
* Usaremos bastante também o método `is_selected()` para verificar se um checkbox ou campo de seleção está marcado.
* Ainda também, usaremos o método `text` para pegar os valores de texto intrínsecos do elemento como já fizemos.

### Botão de Seleção estilo Checkbox (clicar no botão para marcar/desmarcar podendo ser mais de um):

In [None]:
checkbox_1 = navegador.find_element(By.XPATH, '/html/body/form/input[2]')
checkbox_2 = navegador.find_element(By.XPATH, '/html/body/form/input[3]')

if checkbox_1.is_selected():
    print(f"O Checkbox 1 está selecionado!")
else:
    checkbox_1.click()

if checkbox_2.is_selected():
    print(f"O Checkbox 2 está selecionado!")
else:
    checkbox_2.click()

checkbox = navegador.find_elements(By.TAG_NAME, 'input')

for i, input_element in enumerate(checkbox):
    if input_element.get_attribute('type').lower() == 'checkbox': # type: ignore
        if input_element.is_selected():
            print(f"O Checkbox {i} está selecionado! Irei descarmar o checkbox!")
            input_element.click()
            print(f"Agora o Checkbox {i} está desmarcado!")
        else:
            print(f"O Checkbox {i} não está selecionado! Irei marcar o checkbox!")
            input_element.click()

O Checkbox 1 está selecionado!
O Checkbox 2 está selecionado!
O Checkbox 1 está selecionado! Irei descarmar o checkbox!
Agora o Checkbox 1 está desmarcado!
O Checkbox 2 está selecionado! Irei descarmar o checkbox!
Agora o Checkbox 2 está desmarcado!


### Botão de Seleção de Cores (enviar valor):

In [None]:
## Descobrir a cor que está sendo usada:
cor_atual_1 = navegador.find_element(By.XPATH, '/html/body/form/input[4]').get_attribute('value')
print(cor_atual_1)
cor_atual_2 = navegador.find_element(By.XPATH, '/html/body/form/input[5]').get_attribute('value')
print(cor_atual_2)

## Alterar a cor:
COR_USAR_1 = '#E82121'
cor_nova_1 = navegador.find_element(By.XPATH, '/html/body/form/input[4]').send_keys(COR_USAR_1)
COR_USAR_2 = '#2143E8'
cor_nova_2 = navegador.find_element(By.XPATH, '/html/body/form/input[5]').send_keys(COR_USAR_2)

#e82121
#2143e8


### Botão de Data (enviar valor):
Nesse ponto, não há muito segredo. Só é necessário observar corretamente a forma como deve ser preenchido o input.

In [None]:
# Obter o valor da data:
data_marcada = navegador.find_element(By.XPATH, '/html/body/form/input[6]').get_attribute('value')
print(data_marcada)

# Preencher o valor:
data_correta = '14/08/2024'
navegador.find_element(By.XPATH, '/html/body/form/input[6]').send_keys(data_correta)


2024-08-14


### Botão de Datas com horas (enviar valor):
Nesse caso em particular, teremos duas informações diferentes para inserir no mesmo input. Se tentarmos diretamente, não será possível, portanto precisaremos de algo tipo um "TAB". Para isso podemos usar o `Keys.TAB` para ir para o próximo passo do input.

In [None]:
# Obter o valor da data:
data_marcada = navegador.find_element(By.XPATH, '/html/body/form/input[7]').get_attribute('value')
print(data_marcada)

# Preencher o valor:
data_correta = '14/08/2024'
hora_correta = '22:38'
navegador.find_element(By.XPATH, '/html/body/form/input[7]').send_keys(data_correta, Keys.TAB, hora_correta)




### Botão para selecionar o arquivo (enviar valor com caminho completo):

In [None]:
# Enviar o arquivo:

caminho_do_arquivo = r"C:\Users\albin\Desktop\Teste.txt"
navegador.find_element(By.XPATH, '/html/body/form/input[8]').send_keys(caminho_do_arquivo)

In [None]:
# Obter o valor do arquivo:

arquivo = navegador.find_element(By.XPATH, '/html/body/form/input[8]').get_attribute('value')
print(arquivo)

C:\fakepath\Teste.txt


### Botão para selecionar mês ano (enviar valor):

In [None]:
# Pegando o valor do mês e ano:
mes_ano = navegador.find_element(By.XPATH, '/html/body/form/input[9]').get_attribute('value')
print(mes_ano)

# Inserindo o valor de mês e ano:

mes_correto = '08'
ano_correto = '2024'
navegador.find_element(By.XPATH, '/html/body/form/input[9]').send_keys(mes_correto, Keys.TAB, ano_correto, Keys.TAB)

2322-04


### Campos Numéricos:

In [None]:
# Da seguinte forma, está varrendo a página procurando os inputs numéricos,
# ao achar irá preencher com o valor informado.
inputs = navegador.find_elements(By.TAG_NAME, 'input')
valor = ''
for input_element in inputs:
    if input_element.get_attribute('type') == 'number':
        print('Este campo é numérico! Será preenchido somente com números inteiros.')
        input_element.clear()
        input_element.send_keys('123')
        valor = input_element.get_attribute('value')
        break
    else:
        pass

print(valor)


Este campo é numérico! Será preenchido somente com números inteiros.
123


### Campos de Senha:


In [None]:
#Preencher a senha:
navegador.find_element(By.XPATH, '/html/body/form/input[11]').send_keys('SenhaTeste1234')

#Obter o valor preenchido da senha:
senha_atual = navegador.find_element(By.XPATH, '/html/body/form/input[11]').get_attribute('value')
print(f'Senha atual: {senha_atual}')

Senha atual: SenhaTeste1234


### Radio Buttons (botões de seleção única):

In [None]:
# Validar se o botão radio está marcado (validando todos de uma vez):
inputs_radio = navegador.find_elements(By.TAG_NAME, 'input')
for i, input_element in enumerate(inputs_radio):
    if input_element.get_attribute('type') == 'radio':
        if input_element.is_selected():
            print(f'O radio button {i-10} está marcado!')
        else:
            input_element.click()
            print(f'O radio button {i-10} foi marcado!')
            break
    else:
        pass

O radio button 1 foi marcado!


### Slider (enviar valor):

In [None]:
# Pegar o valor do slider (range):
valor_slider = navegador.find_element(By.XPATH, '/html/body/form/input[15]').get_attribute('value')
print(f'Valor do slider: {valor_slider}')
valor_slider = int(valor_slider) # type: ignore
elemento_slider = navegador.find_element(By.XPATH, '/html/body/form/input[15]')

elemento_slider.clear()
if valor_slider != 70:
    print('O slider não está na posição desejada! Ajustando o valor para 70.')
    for i in range(70 - valor_slider):
        elemento_slider.send_keys(Keys.ARROW_RIGHT)
    print(f'Valor do slider: {navegador.find_element(By.XPATH, '/html/body/form/input[15]').get_attribute('value')}')


Valor do slider: 50
O slider não está na posição desejada! Ajustando o valor para 70.
Valor do slider: 70


### Caixa de Texto:

In [None]:
#Preencher o valor:
navegador.find_element(By.XPATH, '/html/body/form/input[16]').send_keys('Inter')

In [None]:
#Obter o valor:
valor = navegador.find_element(By.XPATH, '/html/body/form/input[16]').get_attribute('value')
print(valor)

Inter


### Caixa de Horas:

In [None]:
# Obtendo o valor:
horas_marcadas = navegador.find_element(By.XPATH, '/html/body/form/input[17]').get_attribute('value')
print(f'Horas marcadas: {horas_marcadas}')

# Preencher o valor:
navegador.find_element(By.XPATH, '/html/body/form/input[17]').send_keys('08:57')

print(f'Horas marcadas: {navegador.find_element(By.XPATH, '/html/body/form/input[17]').get_attribute('value')}')

Horas marcadas: 08:57
Horas marcadas: 08:57


### Caixa de Data Personalizada (Semanal):

In [None]:
# Obteno o valor:
semana_ano_marcada = navegador.find_element(By.XPATH, '/html/body/form/input[18]').get_attribute('value')
print(f'Data semanal marcada: {semana_ano_marcada}')

# Preencher o valor:
navegador.find_element(By.XPATH, '/html/body/form/input[18]').send_keys('38,2025' , Keys.TAB)
print(f'Data semanal marcada: {navegador.find_element(By.XPATH, '/html/body/form/input[18]').get_attribute('value')}')

Data semanal marcada: 2024-W31
Data semanal marcada: 2025-W38


### Blocos de texto (enviar valor):

In [None]:
# Obter o valor:
texto_preenchido = navegador.find_element(By.XPATH, '//*[@id="story"]').text
print(f'Texto preenchido: {texto_preenchido}')

navegador.find_element(By.XPATH, '//*[@id="story"]').clear()
navegador.find_element(By.XPATH, '//*[@id="story"]').send_keys(
'''Novo texto.
Texto novo.
novo texto.
texto novo.
''', Keys.ENTER, 'Podemos dar enter também com o `Keys.ENTER`.')

print(f'Texto preenchido: {navegador.find_element(By.XPATH, '//*[@id="story"]').get_attribute('value')}')

Texto preenchido: 
Texto preenchido: Novo texto.
Texto novo.
novo texto.
texto novo.

Podemos dar enter também com o `Keys.ENTER`.


### Selecionando itens de uma lista:

In [None]:
## Enviando valor do select
navegador.find_element(By.XPATH, '/html/body/form/select[1]').send_keys('B')


## Obtendo o valor do select
valor_selecionado = navegador.find_element(By.XPATH, '/html/body/form/select[1]').get_attribute('value')
print('Valor do select:', valor_selecionado)

Valor do select: b


In [None]:
## Clicando para selecionar
import time

navegador.find_element(By.XPATH, '/html/body/form/select[1]').click()
time.sleep(0.5)
navegador.find_element(By.XPATH, '/html/body/form/select[1]/option[2]').click()
navegador.find_element(By.XPATH, '/html/body/form/select[1]').send_keys(Keys.ESCAPE)


In [None]:
## Usando Select
import select
from selenium.webdriver.support.select import Select

elemento = navegador.find_element(By.TAG_NAME, 'select')
elemento_select = Select(elemento)

elemento_select.select_by_visible_text('A')
elemento_select.select_by_index(1)
elemento_select.select_by_value('c')

## Há o método para tirar todas as seleções, o `deselect_all(), mas ocorrerá um erro se o elemento não puder não ter opção selecionada.`
# elemento_select.deselect_all()

## Há o método para verificar se o elemento é múltiplo de seleção
print(elemento_select.is_multiple)

## Há também a oopções de conferir o valor do elemento
# O método first_selected_option retorna a opção selecionada atualmente.
# Então, se não foi alterado, irá retornar o valor padrão.
# Detalhe é que os métodos a seguir irão retornar o elemento, não seus valores.
# Para obter os valores, é necessário usar o .get_atribute('value') e obter o texto com o .text.

elemento_selecionado = elemento_select.first_selected_option
print(elemento_selecionado.get_attribute('value'))
print(elemento_selecionado.text)

## Se for uma lista com várias opções selecionadas,
# podemos usar o método all_selected_options para ver as opções.
# Essa opção irá retornar uma lista de elementos Selenium,
# o detalhe é que, no exemplo usado, não haverá mais de um.

lista_elementos_selecionados = elemento_select.all_selected_options
print(lista_elementos_selecionados[0].get_attribute('value'))
print(lista_elementos_selecionados[0].text)

None
c
C
c
C


---

## ActionsChains
ActionsChains é uma ferramenta do Selenium que permite fazer operações complexas de mouse, por exemplo, clicar, mover o mouse, arrastar e soltar.

In [None]:
# Script padrão para iniciar o navegador Chrome com o selenium e abrir a página web específica. 
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)
caminho_do_arquivo = os.path.join(os.getcwd(), 'Pagina Hashtag.html')
navegador.get(caminho_do_arquivo)

Quando em um site, algum menu suspenso simula um dropdown, mas sem efetivamente estar em um formulário com um select, podemos ter dificuldades para poder selecionar os elementos do menu suspenso. Uma das formas disso é tentar pegar o `href` de dentro do elemento desejado, tentando acessá-lo através do elemento pai. Como abaixo:

In [None]:
links = navegador.find_element(By.XPATH, '//*[@id="menu-item-16313"]/ul').find_elements(By.TAG_NAME, 'a')
for link in links:
    link_href = link.get_attribute('href')
    print(link_href)

https://www.hashtagtreinamentos.com/curso-sql
https://www.hashtagtreinamentos.com/curso-vba-excel
https://www.hashtagtreinamentos.com/curso-powerpoint
https://www.hashtagtreinamentos.com/todos-os-cursos-hashtag-treinamentos


Mas há formas de fazer isso mais direto. Através do ActionChains podemos fazer operações complexas de mouse, como clicar, mover o mouse e realizar um hoover.

In [None]:
from selenium.webdriver import ActionChains

menu = navegador.find_element(By.XPATH, '//*[@id="menu-item-dropdown-16313"]')
item = navegador.find_element(By.XPATH, '//*[@id="menu-item-17042"]/a')

# Colocar o mouse sobre o menu
ActionChains(navegador).move_to_element(menu).perform()

# Clicar no item
item.click()

---

## Alertas com Selenium

In [None]:
# Script padrão para iniciar o navegador Chrome com o selenium e abrir a página web específica. 
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)
caminho_do_arquivo = os.path.join(os.getcwd(), 'alertas.html')
navegador.get(caminho_do_arquivo)

#### Alertas Básicos

In [None]:
# selecionar um alerta
navegador.find_element(By.XPATH, '/html/body/div[1]/input').click()

In [None]:
# forma simples
alerta = navegador.switch_to.alert

# forma "completa"
from selenium.webdriver.common.alert import Alert

alerta_full = Alert(navegador)

In [None]:
alerta.accept()
# ou
alerta_full.accept()

#### Alertas de Confirmação

In [None]:
# selecionar um alerta
navegador.find_element(By.XPATH, '/html/body/div[2]/input').click()

In [None]:
alerta_full = Alert(navegador)

# aceitar
alerta_full.accept()

# cancelar
alerta_full.dismiss()


#### Pegar o texto do alerta

In [None]:
alerta_full = Alert(navegador)
texto = alerta_full.text

print(f'Texto do alerta: {texto}')

Texto do alerta: Quer confirmar a emissão da NF?


#### Alertas de Input

In [None]:
navegador.find_element(By.XPATH, '/html/body/div[3]/button').click()

In [None]:
alerta = Alert(navegador)

In [None]:
alerta.send_keys('123456789')

In [None]:
alerta.accept()

---


## Novas abas e novas janelas


In [None]:
# Script padrão para iniciar o navegador Chrome com o selenium e abrir a página web específica. 
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)
caminho_do_arquivo = os.path.join(os.getcwd(), 'Pagina Hashtag.html')
navegador.get(caminho_do_arquivo)

In [None]:
navegador.find_element(By.XPATH, '/html/body/section[2]/div/div[6]/figure/a').click()

In [None]:
navegador_original = navegador.window_handles[0]
nova_aba = navegador.window_handles[1]

navegador.switch_to.window(nova_aba)

In [None]:
navegador.find_element(By.ID, 'firstname').clear()
navegador.find_element(By.ID, 'firstname').send_keys('John Doe')
navegador.find_element(By.ID, 'email').send_keys('e-mail@example.com')

In [None]:
#Para voltar a aba original
navegador.switch_to.window(navegador_original)
navegador.find_element(By.XPATH, '/html/body/section[2]/div/div[4]/figure/a').click()

In [None]:
## Ver os titulos de todas as abas
for aba in navegador.window_handles:
    navegador.switch_to.window(aba)
    print(navegador.title)
    



Todos os Cursos Hashtag Treinamentos
Curso Power BI Avançado | Projetos Reais e +80h de Conteúdo
Curso de Excel Completo: Excel Impressionador
3


In [None]:
# navegador.find_element(By.XPATH, '/html/body/section[2]/div/div[10]/figure/a').click()
lista_abas = navegador.window_handles
print(len(lista_abas))
# aba_sql = lista_abas[4]
# navegador.switch_to.window(aba_sql)

# navegador.find_element(By.ID, 'firstname').send_keys('John Doe')
# navegador.find_element(By.ID, 'email').send_keys('teste@example.com')
# navegador.find_element(By.ID, 'phone').send_keys('+5555555555555')
# navegador.close()

navegador.switch_to.window(lista_abas[3])
navegador.close()

navegador.switch_to.window(lista_abas[2])
navegador.close()

navegador.switch_to.window(lista_abas[1])
navegador.close()

navegador.switch_to.window(lista_abas[0])
navegador.close()


4


---


## Eperar carregar algum elemento na tela.
Dependendo da página, pode ser necessário esperar um pouco para o elemento aparecer na tela. 

In [None]:
# Script padrão para iniciar o navegador Chrome com o selenium e abrir a página web específica. 
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)

### Formas de esperar o elemento aparecer na tela:
1. "Na marra": Utiliza a função time.sleep() do Python para esperar um tempo específico. Pior solução, pois o tempo de espera é fixo, ou seja, pode não ser o ideal e ainda depende da disponibilidade do site e da velocidade do navegador.

In [None]:
import time

navegador.get('https://www.hashtagtreinamentos.com/')
time.sleep(15)
navegador.find_element(By.XPATH, '//*[@id="elementor-popup-modal-13160"]/div/a').click()

2. "Loop": Utiliza um loop para tentar acessar um elemento até que ele apareça. É uma solução mais robusta e mais eficiente, ainda que não nativa do selenium, irá manter a manutenibilidade do código.

In [None]:
navegador.get('https://www.hashtagtreinamentos.com/')
lista_elementos_esperados =  navegador.find_elements(By.CLASS_NAME, 'dialog-close-button')
print(len(lista_elementos_esperados))
while len(lista_elementos_esperados) < 1:
    time.sleep(1)
    lista_elementos_esperados =  navegador.find_elements(By.CLASS_NAME, 'dialog-close-button')

time.sleep(1)
navegador.find_element(By.XPATH, '//*[@id="elementor-popup-modal-13160"]/div/a').click()

3. "Wait": Utiliza a função WebDriverWait do Selenium para esperar um determinado tempo e executar a ação desejada no elemento. É uma solução mais robusta e eficiente do que o time.sleep. Outra vantagem é que o WebDriverWait é mais fácil de usar e demais para lidar com exceptions e ao mesmo tempo que executa a ação desejada já atribuí o valor do elemento referenciado a variável declarada.

In [None]:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

navegador.get('https://www.hashtagtreinamentos.com/')
## Busca do elemento e aguarda até o elemento aparecer no limite de tempo de 20 segundos.
elemento = WebDriverWait(navegador, 20).until(EC.presence_of_element_located((By.CLASS_NAME, 'eicon-close')))
time.sleep(1)
elemento.click()

---

## PrintScreen com Selenium

É possível fazer um printscreen do navegador usando o Selenium. A vantagem de fazer isso com ele, é que não precisa de outro software externo, e pode continuar utilizando o computador enquanto a automação está rodando. 

In [None]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)
caminho_do_arquivo = os.path.join(os.getcwd(), 'Pagina Hashtag.html')
navegador.get(caminho_do_arquivo)
navegador.maximize_window()

### Tirando print da tela inteira
Para tirar um printscreen da tela inteira do navegador é bem simples, use o método `save_screenshot()` do Selenium e escolha o caminho e o nome do arquivo. Se quiser salvar na mesma pasta em qua o programa está rodando, pode deixar só o nome do arquivo daí, com extensão. 

In [None]:
# Para fazer o printscreen inteiro do navegador, use:
navegador.save_screenshot('print_screen_full2.png')
# Onde pode-se mudar o caminho de salvamento do arquivo a vontade e o formado do arquivo e nome também. 
navegador.save_screenshot(r'C:\Users\albin\Desktop\print_teste.png')

True

### Tirando print de parte da tela
É um pouco mais complexo de fazer um printscreen de parte da tela. Precisaremos utilizar alguma biblioteca de imagem, como Pillow. Abaixo está um exemplo de como fazer:

In [None]:
from PIL import Image

imagem = Image.open('print_screen_full2.png')

elemento = navegador.find_element(By.ID, 'header')
posicao = elemento.location
tamanho = elemento.size

print(posicao, tamanho)

x_inicial, y_inicial, x_final, y_final = posicao['x'], posicao['y'], (posicao['x'] + tamanho['width']), (posicao['y'] + tamanho['height'])

imagem = imagem.crop((x_inicial, y_inicial, x_final, y_final)) # Lembre-se de substituir os valores para os pixels de corte.

imagem.save('print_screen_parte.png')

{'x': 0, 'y': 0} {'height': 113, 'width': 1903}


---

## Gerenciar a tela do navegador

### Maximizar a janela do navegador

In [None]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
navegador = webdriver.Chrome(service=service)
caminho_do_arquivo = os.path.join(os.getcwd(), 'Pagina Hashtag.html')
navegador.get(caminho_do_arquivo)

### Maximizar a janela do navegador
Use abaixo do `navegador.get(caminho_do_arquivo)`

In [None]:
navegador.maximize_window()

### Minimizar a janela do navegador
Use abaixo do `navegador.get(caminho_do_arquivo)`

In [None]:
navegador.minimize_window()

### Headless mode
Modo em que o navegador não aparece no monitor, fica aberta para o código rodar em background, sem ser visível ao usuário.
**OBS**: Atenção ao usar este modo, ele não tem nada de visual e o tempo de vida do navegador é bem menor. 
Então fazer TODO o código e testes sem modo Headless! E só utilizar quanto estiver concluído.
Outro detalhe é que em algumas páginas, pode não funcionar corretamente no modo Headless.

In [None]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import os

service = Service(ChromeDriverManager().install())
# Alteração no código de inicialização do navegador para usar o modo Headless
options = webdriver.ChromeOptions()
options.add_argument('--headless')
navegador = webdriver.Chrome(service=service, options=options)
# Normal o restante.
caminho_do_arquivo = os.path.join(os.getcwd(), 'Pagina Hashtag.html')
navegador.get(caminho_do_arquivo)

navegador.quit()


---

## Abrir o navegador com cookies (utilizando um perfil do navegador já logado):

### Alterações no código de inicialização:
Para usar o selenium com configurações do navegador já logado, é necessário usar um perfil do navegador. Pode-se criar um novo perfil e usar esse para inicializar o navegador com o selenium exclusivamente, e logar no que é necessário neste navegador. Esse é o recomendado. 

Para isso temos que usar o options do webdriver do Chrome para usar o perfil. Veja abaixo o código de inicialização do navegador.

In [1]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager


service = Service(ChromeDriverManager().install())
# Alteração no código de inicialização do navegador para usar o modo Headless
options = webdriver.ChromeOptions()
options.add_argument(r'--user-data-dir=C:\Users\albin\AppData\Local\Google\Chrome\User Data\Selenium')
navegador = webdriver.Chrome(service=service, options=options)
# Normal o restante.
navegador.get('https://account.hackthebox.com')



---


## Executar Comandos Javascript (como por exemplo o Scroll da tela)

- Você consegue, por meio do Selenium, executar comandos javascript no seu navegador

- Isso é essencial para dar scroll na tela, por exemplo, caso seja necessário, como no youtube

Exemplo: Queremos pegar uma lista de pelo menos 50 vídeos de Python no Youtube.

In [1]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import time

service = Service(ChromeDriverManager().install())
# Alteração no código de inicialização do navegador para usar o modo Headless
options = webdriver.ChromeOptions()
options.add_argument(r'--user-data-dir=C:\Users\albin\AppData\Local\Google\Chrome\User Data\Selenium')
navegador = webdriver.Chrome(service=service, options=options)
# Normal o restante.
navegador.get('https://www.youtube.com/results?search_query=Python')
navegador.maximize_window()

In [None]:
# scroll na tela com JavaScript

for i in range(2):
    qtde_scroll = i * 2000
    navegador.execute_script(f'window.scrollTo(0, {qtde_scroll})')
    time.sleep(2)

lista_videos = navegador.find_elements(By.ID, 'thumbnail')

for video in lista_videos:
    print(video.get_attribute('href')) if video.get_attribute('href') != None else None

navegador.execute_script('window.alert("Concluido!")')	

A função do selenium (`execute_script`) é usada para executar scripts JavaScript no navegador. Extremamente útil para poder realizar diversas automações, mas ainda mais útil para realizar automações para pentest com vulnerabilidades XSS e afins. 

---

## iFrames

- Às vezes, você vai fazer tudo certo no Selenium e aparentemente não vai funcionar o seu código
- Possivelmente o elemento que você está tentando selecionar está dentro de um iframe
O iFrame é um elemento HTML que contém outro documento, que é carregado em uma janela separada, mas ainda dentro da página, o que, na prática, para você acessar o elemento do iFrame, teria que acessar essa outra página. 

In [9]:
# Queremos pegar o pontos por jogo mandante da 1ª linha da tabela
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
import time

link = "https://pbdatatrader.com.br/jogosdodia"

service = Service(ChromeDriverManager().install())
# Alteração no código de inicialização do navegador para usar o modo Headless
options = webdriver.ChromeOptions()
options.add_argument(r'--user-data-dir=C:\Users\albin\AppData\Local\Google\Chrome\User Data\Selenium')
navegador = webdriver.Chrome(service=service, options=options)
# Normal o restante.
navegador.get(link)
# navegador.maximize_window()
time.sleep(10)

iframe1 = navegador.find_element(By.TAG_NAME, 'iframe')
navegador.switch_to.frame(iframe1)
iframe2 = navegador.find_element(By.TAG_NAME, 'iframe')
navegador.switch_to.frame(iframe2)

In [12]:
pontos_por_jogo_mandante_xpath_1 = '//*[@id="pvExplorationHost"]/div/div/exploration/div/explore-canvas/div/div[2]/div/div[2]/div[2]/visual-container-repeat/visual-container[19]/transform/div/div[3]/div/div/visual-modern/div/div/div[2]/div[1]/div[2]/div/div[1]/div/div/div[8]'
navegador.find_element(By.XPATH, pontos_por_jogo_mandante_xpath_1).text

'1,31'

Para podermos então selecionar elementos dentro de um iframe, precisamos estar no iframe, podemos fazer isso usando o `switch_to.frame(iframe)` se houver mais de um iframe na página, atentar-se para ter que ir para o correto, mesmo que esteja um dentro do outro, como no exemplo acima. 

---

## Como burlar qualquer Captcha


In [18]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from webdriver_manager.chrome import ChromeDriverManager
from anticaptchaofficial.recaptchav2proxyless import *
import time
from dotenv import load_dotenv
import os

load_dotenv()

my_key = os.getenv('API_KEY')

link = "https://google.com/recaptcha/api2/demo"

service = Service(ChromeDriverManager().install())
options = webdriver.ChromeOptions()
options.add_argument(r'--user-data-dir=C:\Users\albin\AppData\Local\Google\Chrome\User Data\Selenium')
navegador = webdriver.Chrome(service=service, options=options)
navegador.get(link)
time.sleep(10)
# navegador.maximize_window()

In [23]:
data_site_key = navegador.find_element(By.ID, 'recaptcha-demo').get_attribute('data-sitekey')
print(data_site_key)

solver = recaptchaV2Proxyless()
solver.set_verbose(1)
solver.set_key(my_key)
solver.set_website_url(link)
solver.set_website_key(data_site_key)

g_response = solver.solve_and_return_solution()
if g_response != 0:
    print("g-response: "+g_response)
    navegador.execute_script(f'document.getElementById("g-recaptcha-response").innerHTML = "{g_response}"')
    navegador.find_element(By.ID, 'recaptcha-demo-submit').click()
else:
    print("task finished with error "+solver.error_code)
    navegador.execute_script(f'document.getElementById("g-recaptcha-response").innerHTML = "{g_response}"')
    # navegador.find_element(By.ID, 'recaptcha-demo-submit').click()

6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-
making request to createTask
could not create task
API error ERROR_ZERO_BALANCE: Account has zero or negative balance
task finished with error ERROR_ZERO_BALANCE
