# Projeto Automação Web - Busca de Preços

### Objetivo: treinar um projeto em que a gente tenha que usar automações web com Selenium para buscar as informações que precisamos

- Já fizemos um projeto com esse objetivo no Módulo de Python e Web e em gravações de encontros ao vivo, mas não custa nada treinar mais um pouco.

### Como vai funcionar:

- Imagina que você trabalha na área de compras de uma empresa e precisa fazer uma comparação de fornecedores para os seus insumos/produtos.

- Nessa hora, você vai constantemente buscar nos sites desses fornecedores os produtos disponíveis e o preço, afinal, cada um deles pode fazer promoção em momentos diferentes e com valores diferentes.

- Seu objetivo: Se o valor dos produtos for abaixo de um preço limite definido por você, você vai descobrir os produtos mais baratos e atualizar isso em uma planilha.
- Em seguida, vai enviar um e-mail com a lista dos produtos abaixo do seu preço máximo de compra.

- No nosso caso, vamos fazer com produtos comuns em sites como Google Shopping e Buscapé, mas a ideia é a mesma para outros sites.

### Outra opção:

- APIs

### O que temos disponível?

- Planilha de Produtos, com os nomes dos produtos, o preço máximo, o preço mínimo (para evitar produtos "errados" ou "baratos de mais para ser verdade" e os termos que vamos querer evitar nas nossas buscas.

### O que devemos fazer:

- Procurar cada produto no Google Shopping e pegar todos os resultados que tenham preço dentro da faixa e sejam os produtos corretos
- O mesmo para o Buscapé
- Enviar um e-mail para o seu e-mail (no caso da empresa seria para a área de compras por exemplo) com a notificação e a tabela com os itens e preços encontrados, junto com o link de compra. (Vou usar o e-mail pythonimpressionador@gmail.com. Use um e-mail seu para fazer os testes para ver se a mensagem está chegando)

IMPORTAR BIBLIOTECAS, CRIAR NAVEGADOR E LER BASE DE DADOS

In [None]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import pandas as pd
import time

#Criar navegador
nav = webdriver.Chrome()

#Importar e ler base de dados
tabela_produtos = pd.read_excel('buscas.xlsx')
display(tabela_produtos)

CRIAR FUNÇÕES DE BUSCA

In [None]:
def busca_google_shopping(nav, produto, termos_banidos, preco_minimo, preco_maximo):
    #Tratar variáveis
    produto = produto.lower()
    termos_banidos = termos_banidos.lower()
    lista_termos_banidos = termos_banidos.split(' ')
    lista_termos_produto = produto.split(' ')


    #Pesquisar nome do produto no Google
    nav.get('https://www.google.com')
    nav.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(produto)
    nav.find_element(By.XPATH, '/html/body/div[1]/div[3]/form/div[1]/div[1]/div[1]/div/div[2]/input').send_keys(Keys.ENTER)
    #Clicar na aba 'Shopping'
    elementos = nav.find_elements(By.CLASS_NAME, 'hdtb-mitem')
    for item in elementos:
        if 'Shopping' in item.text:
            item.click()
            break
    #Listar resultados da busca do google e pegar nomes, preços e link's
    lista_resultados = nav.find_elements(By.CLASS_NAME, 'sh-dgr__grid-result')
    lista_ofertas = []
    for resultado in lista_resultados:
        nome = resultado.find_element(By.CLASS_NAME, 'Xjkr3b').text
        nome = nome.lower()

        #Verificar nome
        tem_termos_banidos = False
        for palavra in lista_termos_banidos:
            if palavra in nome:
                tem_termos_banidos = True

        tem_todos_termos_produto = True
        for palavra in lista_termos_produto:
            if palavra not in nome:
                tem_todos_termos_produto = False

        if not tem_termos_banidos and tem_todos_termos_produto:
            try:
                preco = resultado.find_element(By.CLASS_NAME, 'a8Pemb').text
                preco = preco.replace('R$','').replace(' ','').replace('.', '').replace(',', '.')
                preco = float(preco)
                #Verificar se o preço está no intervalo especificado
                preco_maximo = float(preco_maximo)
                preco_minimo = float(preco_minimo)
                if preco_minimo <= preco <= preco_maximo:
                    elemento_filho = resultado.find_element(By.CLASS_NAME, 'aULzUe')
                    elemento_pai = elemento_filho.find_element(By.XPATH, '..')
                    link = elemento_pai.get_attribute('href')
                    lista_ofertas.append((nome, preco, link))
            except:
                continue
    return lista_ofertas

def busca_buscape(nav, produto, termos_banidos, preco_minimo, preco_maximo):
    #Tratar variáveis
    produto = produto.lower()
    termos_banidos = termos_banidos.lower()
    lista_termos_banidos = termos_banidos.split(' ')
    lista_termos_produto = produto.split(' ')
    
    #Pesquisar produto no Buscapé
    nav.get('https://www.buscape.com.br')
    nav.find_element(By.CLASS_NAME, 'AutoCompleteStyle_textBox__eLv3V').send_keys(produto, Keys.ENTER)
    
    #Pegar lista de resultados
    time.sleep(5)
    lista_resultados = nav.find_elements(By.CLASS_NAME, 'Cell_Content__fT5st')
    
    #Para cada resultado
    lista_ofertas = []
    for resultado in lista_resultados:
        nome = resultado.get_attribute('title')
        nome = nome.lower()
        preco = resultado.find_element(By.CLASS_NAME, 'CellPrice_MainValue__JXsj_').text
        link = resultado.get_attribute('href')
        
        #Verificar nome
        tem_termos_banidos = False
        for palavra in lista_termos_banidos:
            if palavra in nome:
                tem_termos_banidos = True
                
        tem_todos_termos_produto = True
        for palavra in lista_termos_produto:
            if palavra not in nome:
                tem_todos_termos_produto = False
        
        if not tem_termos_banidos and tem_todos_termos_produto:
            preco = preco.replace('R$', '').replace(' ', '').replace('.', ''). replace(',', '.')
            preco = float(preco)
            
            #Verificar se o preço está dentro do intervalo
            preco_maximo = float(preco_maximo)
            preco_minimo = float(preco_minimo)
            if preco_minimo <= preco <= preco_maximo:
                lista_ofertas.append((nome, preco, link))
    return lista_ofertas

CONSTRUIR LISTA OFERTAS

In [None]:
tabela_ofertas = pd.DataFrame()
for linha in tabela_produtos.index:
    produto = tabela_produtos.loc[linha, 'Nome']
    termos_banidos = tabela_produtos.loc[linha, 'Termos banidos']
    preco_minimo = tabela_produtos.loc[linha, 'Preço mínimo']
    preco_maximo = tabela_produtos.loc[linha, 'Preço máximo']
    lista_ofertas_google_shopping = busca_google_shopping(nav, produto, termos_banidos, preco_minimo, preco_maximo)
    if lista_ofertas_google_shopping:
        tabela_google_shopping = pd.DataFrame(lista_ofertas_google_shopping, columns=['PRODUTO', 'PRECO', 'LINK'])
        tabela_ofertas = tabela_ofertas.append(tabela_google_shopping)
    else:
        tabela_google_shopping = None
    lista_ofertas_buscape = busca_buscape(nav, produto, termos_banidos, preco_minimo, preco_maximo)
    if lista_ofertas_buscape:
        tabela_buscape = pd.DataFrame(lista_ofertas_buscape, columns=['PRODUTO', 'PRECO', 'LINK'])
        tabela_ofertas = tabela_ofertas.append(tabela_buscape)
    else:
        tabela_buscape = None
display(tabela_ofertas)

EXPORTAR PARA EXCEL

In [None]:
tabela_ofertas = tabela_ofertas.reset_index(drop=True)
tabela_ofertas.to_excel('Ofertas.xlsx', index=False)

ENVIAR EMAIL AUTOMÁTICO

In [None]:
import smtplib
import email.message

def enviar_email():  
    corpo_email = f"""
    <p>     Boa tarde,</p>
    <p>   Segue relatório com as ofertas encontradas:</p>
    <p>{tabela_ofertas.to_html(index=False)}</p>
    <p>Att.</p>
    <p>Anderson F. S. de Oliveira</p>
    """

    msg = email.message.Message()
    msg['Subject'] = "Ofertas Encontradas!"
    msg['From'] = 'andersonfplay@gmail.com'
    msg['To'] = 'andersonfplay@gmail.com'
    password = 'eaedpuijfuwtsqir' 
    msg.add_header('Content-Type', 'text/html')
    msg.set_payload(corpo_email )

    s = smtplib.SMTP('smtp.gmail.com: 587')
    s.starttls()
    # Login Credentials for sending the mail
    s.login(msg['From'], password)
    s.sendmail(msg['From'], [msg['To']], msg.as_string().encode('utf-8'))
    print('Email enviado')

In [None]:
enviar_email()