# **Web Scraping + Selenium**

Similar aos comandos do *pyautogui* e *pyperclip*. No entanto, há algumas vantagens:

        Selenium é capaz de continuar automatizando mesmo se a página web for reconfigurada;
        
        Selinium não exige tantos comandos manuais na montagem do código;
        
        Não há necessidade de usar o time.sleep()
        
----------

## **Desafio**

Para uma empresa importadora, deseja- se atualizar os preços dos produtos diariamente de acordo com a cotação do dólar, do euro e do ouro. 

        pegar na internet as cotações -> atualizar os preços na minha base de dados -> exportar a base para o sistema principal da empresa


**Instalação do webdrive*

~Cada computador apresenta um webdrive específico de acordo com o navegador padrão. 
Para o Chrome, o nome é chrome drive e devemos instalá-lo 

**Observação:** Tentar instalar o webdrive na mesma pasta onde está instalada o Pyhton. 

In [2]:
#Dentro da biblioteca selenium, eu desejo apenas o "livro" webdriver
#webdriver é uma classe especifica para conctar o webdrive do meu pc ao python

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By


***O QUE SIGNIFICA FIND_ELEMENT?***
        
Uma função específica para encontrar um campo específico de um site. 

*By.XPATH* = Uma forma específica de pegar o link do campo. Existem outros, porém *By.XPATH* é o mais genérico 

*.send_keys(Chaves específicas para realizar comandos)

In [3]:
# Conectar o webdriver ao navegar do computador e entrar em um site específico

browser = webdriver.Chrome('chromedriver.exe')
browser.get("https://www.google.com/")
browser.find_element(By.XPATH,
                     '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys("Cotação do dólar hoje")
browser.find_element(By.XPATH,
                     '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER)
price_dolar = browser.find_element(By.XPATH, 
                                   '//*[@id="knowledge-currency__updatable-data-column"]/div[1]/div[2]/span[1]').get_attribute('data-value')

#-------------------------

browser.get("https://www.google.com/")
browser.find_element(By.XPATH,
                     '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys("Cotação do euro hoje")
browser.find_element(By.XPATH,
                     '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER)
price_euro = browser.find_element(By.XPATH, 
                                   '//*[@id="knowledge-currency__updatable-data-column"]/div[1]/div[2]/span[1]').get_attribute('data-value')

#------------------------

browser.get('https://www.melhorcambio.com/ouro-hoje')
price_gold =browser.find_element(By.XPATH, '//*[@id="comercial"]').get_attribute('value').replace(',', '.')


  browser = webdriver.Chrome('chromedriver.exe')


In [4]:
print(f'Cotações\nDólar: R${price_dolar}\nEuro: R${price_euro}\nOuro: R${price_gold}')

Cotações
Dólar: R$5.5158
Euro: R$6.296031973000001
Ouro: R$322.39


In [5]:
# Próximo passo é importar a base de dados 

import pandas as pd 

In [6]:
frame = pd.read_excel(r'Produtos.xlsx')
display(frame)

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5,4999.95,1.4,6999.93
1,Carro Renault,4500.0,Euro,6,27000.0,2.0,54000.0
2,Notebook Dell,899.99,Dólar,5,4499.95,1.7,7649.915
3,IPhone,799.0,Dólar,5,3995.0,1.7,6791.5
4,Carro Fiat,3000.0,Euro,6,18000.0,1.9,34200.0
5,Celular Xiaomi,480.48,Dólar,5,2402.4,2.0,4804.8
6,Joia 20g,20.0,Ouro,350,7000.0,1.15,8050.0


**frame.loc[linha,coluna]**

.loc indica para localizar exatamente aquelas posições na tabela. 

Porém podemos colocar opeações específicas dentro de linhas ou de colunas. 

        frame.loc[frame['Moeda'] == 'Dólar', Cotação]

Para toda linha cujo elemento na coluna moeda seja Dólar, modificaremos o elemento de mesma linha localizado na coluna 'Cotação'



In [7]:
# Atualização das cotações de maneira rápida e eficiente 

frame.loc[frame['Moeda'] == 'Dólar', 'Cotação'] = float(price_dolar)
frame.loc[frame['Moeda'] == 'Euro', 'Cotação'] = float(price_euro)
frame.loc[frame['Moeda'] == 'Ouro', 'Cotação'] = float(price_gold)

display(frame)

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5.5158,4999.95,1.4,6999.93
1,Carro Renault,4500.0,Euro,6.296032,27000.0,2.0,54000.0
2,Notebook Dell,899.99,Dólar,5.5158,4499.95,1.7,7649.915
3,IPhone,799.0,Dólar,5.5158,3995.0,1.7,6791.5
4,Carro Fiat,3000.0,Euro,6.296032,18000.0,1.9,34200.0
5,Celular Xiaomi,480.48,Dólar,5.5158,2402.4,2.0,4804.8
6,Joia 20g,20.0,Ouro,322.39,7000.0,1.15,8050.0


In [8]:
frame.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 7 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   Produtos         7 non-null      object 
 1   Preço Original   7 non-null      float64
 2   Moeda            7 non-null      object 
 3   Cotação          7 non-null      float64
 4   Preço de Compra  7 non-null      float64
 5   Margem           7 non-null      float64
 6   Preço de Venda   7 non-null      float64
dtypes: float64(5), object(2)
memory usage: 520.0+ bytes


In [9]:
# Atualização dos valores de preço de compra e preço de venda

frame['Preço de Compra'] = frame['Preço Original'] * frame['Cotação']
frame['Preço de Venda'] = frame['Preço de Compra'] * frame['Margem']

In [10]:
display(frame)

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5.5158,5515.744842,1.4,7722.042779
1,Carro Renault,4500.0,Euro,6.296032,28332.143879,2.0,56664.287757
2,Notebook Dell,899.99,Dólar,5.5158,4964.164842,1.7,8439.080231
3,IPhone,799.0,Dólar,5.5158,4407.1242,1.7,7492.11114
4,Carro Fiat,3000.0,Euro,6.296032,18888.095919,1.9,35887.382246
5,Celular Xiaomi,480.48,Dólar,5.5158,2650.231584,2.0,5300.463168
6,Joia 20g,20.0,Ouro,322.39,6447.8,1.15,7414.97


In [13]:
# Arredondar todos os valores dentro de um DataFrame

frame.loc[:,'Preço de Venda'] = round(frame.loc[:,'Preço de Venda'],3)
display(frame)

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5.5158,5515.744842,1.4,7722.043
1,Carro Renault,4500.0,Euro,6.296032,28332.143879,2.0,56664.288
2,Notebook Dell,899.99,Dólar,5.5158,4964.164842,1.7,8439.08
3,IPhone,799.0,Dólar,5.5158,4407.1242,1.7,7492.111
4,Carro Fiat,3000.0,Euro,6.296032,18888.095919,1.9,35887.382
5,Celular Xiaomi,480.48,Dólar,5.5158,2650.231584,2.0,5300.463
6,Joia 20g,20.0,Ouro,322.39,6447.8,1.15,7414.97


In [12]:
frame.to_excel('Preços_Produtos_atualizados.xlsx', index=False)