# Projeto Automação Web - Busca de Preços

### Objetivo: treinar um projeto em que a gente tenha que usar automações web com Selenium para buscar as informações que precisamos

- Já fizemos um projeto com esse objetivo no Módulo de Python e Web e em gravações de encontros ao vivo, mas não custa nada treinar mais um pouco.

### Como vai funcionar:

- Imagina que você trabalha na área de compras de uma empresa e precisa fazer uma comparação de fornecedores para os seus insumos/produtos.

- Nessa hora, você vai constantemente buscar nos sites desses fornecedores os produtos disponíveis e o preço, afinal, cada um deles pode fazer promoção em momentos diferentes e com valores diferentes.

- Seu objetivo: Se o valor dos produtos for abaixo de um preço limite definido por você, você vai descobrir os produtos mais baratos e atualizar isso em uma planilha.
- Em seguida, vai enviar um e-mail com a lista dos produtos abaixo do seu preço máximo de compra.

- No nosso caso, vamos fazer com produtos comuns em sites como Google Shopping e Buscapé, mas a ideia é a mesma para outros sites.

### Outra opção:

- APIs

### O que temos disponível?

- Planilha de Produtos, com os nomes dos produtos, o preço máximo, o preço mínimo (para evitar produtos "errados" ou "baratos de mais para ser verdade" e os termos que vamos querer evitar nas nossas buscas.

### O que devemos fazer:

- Procurar cada produto no Google Shopping e pegar todos os resultados que tenham preço dentro da faixa e sejam os produtos corretos
- O mesmo para o Buscapé


In [62]:
# criar um navegador atua
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By

import pandas as pd

# criar o navegador
nav = webdriver.Chrome()

# importar/visualizar a base de dados
tabela_produtos = pd.read_excel("buscas.xlsx")
display(tabela_produtos)

Unnamed: 0,Nome,Termos banidos,Preço mínimo,Preço máximo
0,iphone 12 64 gb,mini watch,3000,5500
1,rtx 3060,zota galax,2500,4500


### Definição da função de busca no google

In [63]:
import time

def busca_google_shopping(nav, produto, termos_banidos, preco_minimo, preco_maximo):

    #entrar no google
    nav.get('http://www.google.com.br/')
    
    #tratar os valores que vieram da tabela
    produto = produto.lower()
    termos_banidos = termos_banidos.lower()
    lista_termos_banidos = termos_banidos.split(' ')
    lista_termos_produto = produto.split(' ')
    preco_maximo = float(preco_maximo)
    preco_minimo = float(preco_minimo)

    #pesquisa o nome do produto no google
    nav.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(produto)
    nav.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER)

    #clicar na aba shopping
    elementos = nav.find_elements(By.CLASS_NAME, 'hdtb-mitem')
    for item in elementos:
        if 'Shopping' in item.text:
            item.click()
            break

    #pegar a lista de resultados do produto no shopping do google
    #preco = nav.find_element(By.CLASS_NAME, 'a8Pemb').text
    #print(preco)

    #pegar a lista de resultados do produto no shopping do google
    lista_resultados = nav.find_elements(By.CLASS_NAME, 'sh-dgr__grid-result')
    
    #para cada resultado, verificar se o resultado corresponde a todas as condições
    lista_ofertas = [] #lista que a função va trazer como resposta
    for resultado in lista_resultados:

        nome = resultado.find_element(By.CLASS_NAME, 'Xjkr3b').text
        nome = nome.lower()

        #verificar se no nome tem algum termo banido
        tem_termos_banidos = False
        for palavra in lista_termos_banidos:
            if palavra in nome:
                tem_termos_banidos = True
        
        #verificar se no nome tem todos os termos do nome do produto
        tem_todos_termos_produto = True
        for palavra in lista_termos_produto:
            if palavra not in nome:
                tem_todos_termos_produto = False

        #se tem_termos_banidos = False e o tem_todos_termos_produto = True  
        if not tem_termos_banidos and tem_todos_termos_produto: #verificando o nome
            try:
                
                preco = resultado.find_element(By.CLASS_NAME, 'a8Pemb').text
                preco = preco.replace('R$', '').replace(' ','').replace('.', '').replace(',', '.')
                preco = float(preco)

                #verificando se o preco ta dentro do minimo e maximo
            
                if preco_minimo <= preco <= preco_maximo:
                    elemento_link = resultado.find_element(By.CLASS_NAME, 'aULzUe')
                    elemento_pai = elemento_link.find_element(By.XPATH, '..')
                    link = elemento_pai.get_attribute('href')
                    lista_ofertas.append((nome, preco, link))
            except:
                continue
    
    return lista_ofertas


def busca_buscape(nav, produto, termos_banidos, preco_minimo, preco_maximo):
    #trata os valores dos produtos da função   
    preco_maximo = float(preco_maximo)
    preco_minimo = float(preco_minimo)
    produto = produto.lower()
    termos_banidos = termos_banidos.lower()
    lista_termos_banidos = termos_banidos.split(' ')
    lista_termos_produto = produto.split(' ')
    
    #entrar no buscape
    nav.get('https://www.buscape.com.br/')
    
    #pesquisar produto no buscape
    nav.find_element(By.CLASS_NAME, 'AutoCompleteStyle_textBox__eLv3V').send_keys(produto, Keys.ENTER)
    
    #pegar lista de resultados da busca no buscape
    time.sleep(5)
    lista_resultados = nav.find_elements(By.CLASS_NAME, 'SearchCard_ProductCard_Inner__7JhKb')
    
    #para cada resultado 
    lista_ofertas = []
    for resultado in lista_resultados:
        try:
            preco = resultado.find_element(By.XPATH, '//*[@id="__next"]/div[2]/div/div[2]/div[2]/div[1]/a/div[2]/div[2]/div[2]/p[1]').text
            nome = resultado.find_element(By.CLASS_NAME, 'SearchCard_ProductCard_Name__ZaO5o').text
            nome = nome.lower()
            link = resultado.get_attribute('href')
            
            #verificar se no nome tem algum termo banido
            tem_termos_banidos = False
            for palavra in lista_termos_banidos:
                if palavra in nome:
                    tem_termos_banidos = True

            #verificar se no nome tem todos os termos do nome do produto
            tem_todos_termos_produto = True
            for palavra in lista_termos_produto:
                if palavra not in nome:
                    tem_todos_termos_produto = False
            
            if not tem_termos_banidos and tem_todos_termos_produto:
                preco = preco.replace('R$', '').replace(' ','').replace('.', '').replace(',', '.')
                preco = float(preco)
                if preco_minimo <= preco <= preco_maximo:
                    lista_ofertas.append((nome, preco, link))
                    #print(nome, preco, link)
        except:
            pass
    return lista_ofertas
    
    #ver se ele tem algum termo banido
    

### Construção da lista de ofertas encontradas

In [64]:
tabela_ofertas = pd.DataFrame()

for linha in tabela_produtos.index:
    produto = tabela_produtos.loc[linha, 'Nome']
    termos_banidos = tabela_produtos.loc[linha, 'Termos banidos']
    preco_minimo = tabela_produtos.loc[linha, 'Preço mínimo']
    preco_maximo = tabela_produtos.loc[linha, 'Preço máximo'] #onde define o preço maximo, só alterar aqui ex.: 4500

    lista_ofertas_google_shopping = busca_google_shopping(nav, produto, termos_banidos, preco_minimo, preco_maximo)
    if lista_ofertas_google_shopping: #se existe alg
        tabela_google_shopping = pd.DataFrame(lista_ofertas_google_shopping, columns = ['produto', 'preco', 'link'])
        tabela_ofertas = tabela_ofertas.append(tabela_google_shopping)
    else: tabela_google_shopping = None
        
    lista_ofertas_buscape = busca_buscape(nav, produto, termos_banidos, preco_minimo, preco_maximo)
    if lista_ofertas_buscape:
        tabela_buscape = pd.DataFrame(lista_ofertas_buscape, columns = ['produto', 'preco', 'link'])
        tabela_ofertas = tabela_ofertas.append(tabela_buscape)
    else: tabela_buscape = None
display(tabela_ofertas)    
    #display(tabela_google_shopping)
    #display(tabela_buscape)
    #break

  tabela_ofertas = tabela_ofertas.append(tabela_google_shopping)
  tabela_ofertas = tabela_ofertas.append(tabela_google_shopping)
  tabela_ofertas = tabela_ofertas.append(tabela_buscape)


Unnamed: 0,produto,preco,link
0,"iphone 12 64gb roxo, com tela de 6,1, 5g e câm...",4099.00,https://www.google.com.br/url?url=https://www....
1,vitrine iphone 12 preto 64gb,4590.00,https://www.google.com.br/url?url=https://www....
2,vitrine iphone 12 branco 64gb,4590.00,https://www.google.com.br/url?url=https://www....
3,iphone 12 apple 64gb ios 5g wi-fi tela 6.1'' c...,3200.00,https://www.google.com.br/url?url=https://mg.o...
4,iphone 12 black 64gb nota e garantia oficial a...,4760.00,https://www.google.com.br/url?url=https://prod...
...,...,...,...
16,placa de vídeo msi nvidia geforce rtx 3060 gam...,2549.15,https://www.buscape.com.br/lead?oid=893145377&...
17,placa de vídeo 51risc rtx 3060 12 gb gaming gp...,2549.15,https://www.buscape.com.br/lead?oid=929688471&...
18,placa de vídeo msi nvidia geforce rtx 3060 ti ...,2549.15,https://www.buscape.com.br/lead?oid=934237081&...
19,placa de vídeo msi geforce rtx 3060 ventus 2x ...,2549.15,https://www.buscape.com.br/lead?oid=877105145&...


### Exportar a base de ofertas para o excel

In [67]:
tabela_ofertas = tabela_ofertas.reset_index(drop = True)
tabela_ofertas.to_excel('Ofertas.xlsx', index = False)