# Web Scraping with Python

#### Challenge: 

We work in an importer and the price of our products is linked to a quotation from:
- Dollar
- Euro
- Gold

We need to find this information from the internet, automatically, the quotation from this 3 itens and based on that how much we should charge for our products, considering a contribution margin that we have in our database.

DataBase: https://drive.google.com/drive/folders/1KmAdo593nD8J9QBaZxPOG1yxHZua4Rtv?usp=sharing

To solve this problem, we're going to create a Web Scraping program

- Using selenium

In [2]:
!pip install selenium



In [3]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

navegador = webdriver.Chrome()

# Step 1: Dollar quotation
navegador.get('https://www.google.com.br/')
navegador.find_element('xpath', '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys('cotação dólar')
navegador.find_element('xpath', '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER)

cotacao_dolar = navegador.find_element('xpath', '//*[@id="knowledge-currency__updatable-data-column"]/div[1]/div[2]/span[1]').get_attribute('data-value')
print(cotacao_dolar)

# Step 2: Euro quotation
navegador.get('https://www.google.com.br/')
navegador.find_element('xpath', '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys('cotação euro')
navegador.find_element('xpath', '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER)

cotacao_euro = navegador.find_element('xpath', '//*[@id="knowledge-currency__updatable-data-column"]/div[1]/div[2]/span[1]').get_attribute('data-value')
print(cotacao_euro)

# Step 3: Gold quotation
navegador.get('https://www.melhorcambio.com/ouro-hoje')
cotacao_ouro = navegador.find_element('xpath', '//*[@id="comercial"]').get_attribute('value')
cotacao_ouro = cotacao_ouro.replace(',', '.')

print(cotacao_ouro)

navegador.quit()



5.1133
5.2124999999999995
296.61


### Agora vamos atualiza a nossa base de preços com as novas cotações

- Importando a base de dados

In [4]:
# Step 4: Update the quotations in our databse
import pandas as pd

tabela_produtos = pd.read_excel('Produtos.xlsx')
tabela_produtos

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5,4999.95,1.4,6999.93
1,Carro Renault,4500.0,Euro,6,27000.0,2.0,54000.0
2,Notebook Dell,899.99,Dólar,5,4499.95,1.7,7649.915
3,IPhone,799.0,Dólar,5,3995.0,1.7,6791.5
4,Carro Fiat,3000.0,Euro,6,18000.0,1.9,34200.0
5,Celular Xiaomi,480.48,Dólar,5,2402.4,2.0,4804.8
6,Joia 20g,20.0,Ouro,350,7000.0,1.15,8050.0


- Updating prices and Preço Final calculation

In [5]:
# Step 5: Recalculate item prices
tabela_produtos.loc[tabela_produtos['Moeda'] == 'Dólar', 'Cotação'] = float(cotacao_dolar)
tabela_produtos.loc[tabela_produtos['Moeda'] == 'Euro', 'Cotação'] = float(cotacao_euro)
tabela_produtos.loc[tabela_produtos['Moeda'] == 'Ouro', 'Cotação'] = float(cotacao_ouro)
                    
# Updating actual base prices (original base price * quote)
tabela_produtos['Preço de Compra'] = tabela_produtos['Preço Original'] * tabela_produtos['Cotação']

# Updating final purchase prices (purchase price * margin)
tabela_produtos['Preço de Venda'] = tabela_produtos['Preço de Compra'] * tabela_produtos['Margem']                   
                    
tabela_produtos

Unnamed: 0,Produtos,Preço Original,Moeda,Cotação,Preço de Compra,Margem,Preço de Venda
0,Câmera Canon,999.99,Dólar,5.1133,5113.248867,1.4,7158.548414
1,Carro Renault,4500.0,Euro,5.2125,23456.25,2.0,46912.5
2,Notebook Dell,899.99,Dólar,5.1133,4601.918867,1.7,7823.262074
3,IPhone,799.0,Dólar,5.1133,4085.5267,1.7,6945.39539
4,Carro Fiat,3000.0,Euro,5.2125,15637.5,1.9,29711.25
5,Celular Xiaomi,480.48,Dólar,5.1133,2456.838384,2.0,4913.676768
6,Joia 20g,20.0,Ouro,296.61,5932.2,1.15,6822.03


### Now let's export the new updated price base

In [6]:
# Step 6: Exporting to the databse

tabela_produtos.to_excel('Produtos_Atualizado.xlsx', index= False)