# Automação Web scrapping e Busca de Informações com Python

Web scrapping, Selenium, exportar relatorios e pesquisa automatica

#### Objetivo: 

Trabalhamos em uma importadora e o preço dos nossos produtos é vinculado a cotação de:
- Dólar
- Euro
- Ouro

Precisamos pegar na internet, de forma automática, a cotação desses 3 itens e saber quanto devemos cobrar pelos nossos produtos, considerando uma margem de contribuição que temos na nossa base de dados.

Base de Dados: https://drive.google.com/drive/folders/1KmAdo593nD8J9QBaZxPOG1yxHZua4Rtv?usp=sharing

Para isso, vamos criar uma automação web:

- Usaremos o selenium
- Importante: baixar o webdriver

In [1]:
!pip install selenium

Collecting selenium
  Downloading selenium-4.1.3-py3-none-any.whl (968 kB)
Collecting trio~=0.17
  Downloading trio-0.20.0-py3-none-any.whl (359 kB)
Collecting trio-websocket~=0.9
  Downloading trio_websocket-0.9.2-py3-none-any.whl (16 kB)
Collecting outcome
  Downloading outcome-1.1.0-py2.py3-none-any.whl (9.7 kB)
Collecting wsproto>=0.14
  Downloading wsproto-1.1.0-py3-none-any.whl (24 kB)
Collecting h11<1,>=0.9.0
  Downloading h11-0.13.0-py3-none-any.whl (58 kB)
Installing collected packages: outcome, h11, wsproto, trio, trio-websocket, selenium
Successfully installed h11-0.13.0 outcome-1.1.0 selenium-4.1.3 trio-0.20.0 trio-websocket-0.9.2 wsproto-1.1.0


Instalar o chromedriver para possibilitar funcionamento do selenium

#webdriver do chrome - chromedriver - varia por navegador
#Passo a passo:
- Verificar a versao do chrome em ajuda do chrome: a versão que estou usando é a 99.
- no navegador, digitar chromedriver download - selecionar versao de download chromedrive99
- download do chromedriver de acordo com seu sistema operacional
- Colocar o arquivo do chromedriver na mesma pasta onde esta instalado o python no anaconda - verificar localização abrindo prompt do anaconda (C:\Users\psfm5\anaconda3


# Executando selenium

In [62]:
from selenium import webdriver #controlar o navegador
from selenium.webdriver.common.keys import Keys #controlar o teclado
from selenium.webdriver.common.by import By #localizar itens do navegador

# Criar navegador que o selenium irá controlar
# abrir um navegador

In [63]:
navegador = webdriver.Chrome()

In [64]:
#Cotação dolar

navegador.get("https://www.google.com/")

#encontrar campo de busca e digitar busca da cotação do dolár
navegador.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys('cotação dólar')
navegador.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER) 

cotacao_dolar = navegador.find_element(By.XPATH,'//*[@id="knowledge-currency__updatable-data-column"]/div[1]/div[2]/span[1]').get_attribute('data-value')
#data-value é o atributo que quero obter - o nome do atributo está no código em "inspecionar"
print(cotacao_dolar)

5.02375


In [65]:
#Cotação euro

navegador.get("https://www.google.com/")

#encontrar campo de busca e digitar busca da cotação do euro
navegador.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys('cotação euro')
navegador.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER) 

cotacao_euro = navegador.find_element(By.XPATH,'//*[@id="knowledge-currency__updatable-data-column"]/div[1]/div[2]/span[1]').get_attribute('data-value')
#data-value é o atributo que quero obter - o nome do atributo está no código em "inspecionar"
print(cotacao_euro)

5.561542437


In [66]:
#Cotação ouro

navegador.get("https://www.melhorcambio.com/ouro-hoje")
cotacao_ouro = navegador.find_element(By.XPATH,'//*[@id="comercial"]').get_attribute('value')
#value é o atributo que quero obter - o nome do atributo está no código em "inspecionar"

cotacao_ouro = cotacao_ouro.replace(",", ".")
print(cotacao_ouro)

310.35


In [67]:
navegador.quit()

# informações extras:

# para rodar o chrome em 2º plano


#from selenium.webdriver.chrome.options import Options

#chrome_options = Options()

#chrome_options.headless = True

#navegador = webdriver.Chrome(options=chrome_options)


# caso queira deixar na mesma pasta do seu código

#navegador = webdriver.Chrome("chromedriver.exe")


### Agora vamos atualizar a nossa base de preços com as novas cotações

- Importando a base de dados

In [68]:
# Passo 4: Importar a lista de produtos
import pandas as pd

tabela = pd.read_excel("Produtos.xlsx")
tabela

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5,4999.95,1.4,6999.93
1,Carro Renault,4500.0,Euro,6,27000.0,2.0,54000.0
2,Notebook Dell,899.99,Dólar,5,4499.95,1.7,7649.915
3,IPhone,799.0,Dólar,5,3995.0,1.7,6791.5
4,Carro Fiat,3000.0,Euro,6,18000.0,1.9,34200.0
5,Celular Xiaomi,480.48,Dólar,5,2402.4,2.0,4804.8
6,Joia 20g,20.0,Ouro,350,7000.0,1.15,8050.0


In [69]:
#atualizar preço de compra = preço original x cotaçao

#usaando .loc (localizar)
#tabela.loc(linhas, colunas) = float(cotacao_dolar)
#linhas = a em que a moeda for dolar, ou euro, ou ouro.
#coluna = a coluna cotação
# == os dois sinais é para comparar - se fosse só =, iria criar um elemento
# != é sinal para diferente (apenas informação adicional)

tabela.loc[tabela['Moeda'] == 'Dólar', 'Cotação'] = float(cotacao_dolar)
tabela.loc[tabela['Moeda'] == 'Euro', 'Cotação'] = float(cotacao_euro)
tabela.loc[tabela['Moeda'] == 'Ouro', 'Cotação'] = float(cotacao_ouro)


tabela

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5.02375,4999.95,1.4,6999.93
1,Carro Renault,4500.0,Euro,5.561542,27000.0,2.0,54000.0
2,Notebook Dell,899.99,Dólar,5.02375,4499.95,1.7,7649.915
3,IPhone,799.0,Dólar,5.02375,3995.0,1.7,6791.5
4,Carro Fiat,3000.0,Euro,5.561542,18000.0,1.9,34200.0
5,Celular Xiaomi,480.48,Dólar,5.02375,2402.4,2.0,4804.8
6,Joia 20g,20.0,Ouro,310.35,7000.0,1.15,8050.0


In [70]:
#atualizar preço de compra

tabela['Preço de Compra'] = tabela['Preço Original'] * tabela['Cotação']

#atualizar preço de venda

tabela['Preço de Venda'] = tabela['Preço de Compra'] * tabela['Margem']

tabela

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5.02375,5023.699762,1.4,7033.179667
1,Carro Renault,4500.0,Euro,5.561542,25026.940966,2.0,50053.881933
2,Notebook Dell,899.99,Dólar,5.02375,4521.324762,1.7,7686.252096
3,IPhone,799.0,Dólar,5.02375,4013.97625,1.7,6823.759625
4,Carro Fiat,3000.0,Euro,5.561542,16684.627311,1.9,31700.791891
5,Celular Xiaomi,480.48,Dólar,5.02375,2413.8114,2.0,4827.6228
6,Joia 20g,20.0,Ouro,310.35,6207.0,1.15,7138.05


In [71]:
#formatar para duas casas decimais e separação de milhar

tabela["Preço de Compra"] = tabela["Preço de Compra"].map("R${:,.2f}".format)
tabela["Preço de Venda"] = tabela["Preço de Venda"].map("R${:,.2f}".format)
tabela["Cotação"] = tabela["Cotação"].map("R${:,.2f}".format)

tabela

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,R$5.02,"R$5,023.70",1.4,"R$7,033.18"
1,Carro Renault,4500.0,Euro,R$5.56,"R$25,026.94",2.0,"R$50,053.88"
2,Notebook Dell,899.99,Dólar,R$5.02,"R$4,521.32",1.7,"R$7,686.25"
3,IPhone,799.0,Dólar,R$5.02,"R$4,013.98",1.7,"R$6,823.76"
4,Carro Fiat,3000.0,Euro,R$5.56,"R$16,684.63",1.9,"R$31,700.79"
5,Celular Xiaomi,480.48,Dólar,R$5.02,"R$2,413.81",2.0,"R$4,827.62"
6,Joia 20g,20.0,Ouro,R$310.35,"R$6,207.00",1.15,"R$7,138.05"


### Agora vamos exportar a nova base de preços atualizada para um arquivo xlsx

In [72]:
#Salvar os novos preços dos produtos atualizados - não colocar indice de linha no arquivo

tabela.to_excel("ProdutosNovo.xlsx", index=False)

In [73]:
tabelanova = pd.read_excel("ProdutosNovo.xlsx")
tabelanova

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,R$5.02,"R$5,023.70",1.4,"R$7,033.18"
1,Carro Renault,4500.0,Euro,R$5.56,"R$25,026.94",2.0,"R$50,053.88"
2,Notebook Dell,899.99,Dólar,R$5.02,"R$4,521.32",1.7,"R$7,686.25"
3,IPhone,799.0,Dólar,R$5.02,"R$4,013.98",1.7,"R$6,823.76"
4,Carro Fiat,3000.0,Euro,R$5.56,"R$16,684.63",1.9,"R$31,700.79"
5,Celular Xiaomi,480.48,Dólar,R$5.02,"R$2,413.81",2.0,"R$4,827.62"
6,Joia 20g,20.0,Ouro,R$310.35,"R$6,207.00",1.15,"R$7,138.05"
