### Automatização de Coleta de Dados em E-commerce com RPA em Python

No mundo digital, onde a competição é acirrada e a agilidade é fundamental, a coleta de dados em e-commerce é uma tarefa crucial para entender o mercado, monitorar concorrentes e manter-se atualizado sobre as tendências do setor. No entanto, realizar essa coleta manualmente pode consumir tempo precioso e recursos humanos, além de ser suscetível a erros.

<Center><h5><font>Fluxograma da Automatização da Coleta de Dados na Web </font></h5></center>

<center>



<img src="../img/Automatização_Coleta_Dados_Web.png" width="60%">
</center>


<font color="yellow">Requisitos</font>
***
Instalação das bibliotecas:
- Requests (pip install requests)
- Beautifulsoup4 (pip install beautifulsoup4)
- Python-dotenv (pip install python-dotenv)

#### Importação das Bibliotecas

In [None]:
import requests
from bs4 import BeautifulSoup
import csv
import random
import time
import smtplib
import os
import dotenv

dotenv.load_dotenv("../config/.env")

True

#### Acessando Página na Web

In [2]:
URL = 'https://produto.mercadolivre.com.br/MLB-1819810336-automatizaco-de-processos-com-rpa-_JM#polycard_client=storefronts&type=item&tracking_id=883bb066-f7df-4b07-b9c7-17e223e14c88&source=eshops'
headers = {'User-Agent': 'Chrome'}
Page = requests.get(URL, headers)
soup = BeautifulSoup(Page.content, 'html.parser')

#### Coletando Dados do Produto

In [3]:
Produto = soup.select_one('h1.ui-pdp-title').text
Preco = soup.select_one('span.andes-money-amount').text

#### Realizando Tratamento de dados
***
Em Python, os números de ponto flutuante (float) são representados usando um ponto como separador decimal, em vez de vírgula, que é comum em algumas regiões do mundo. Portanto, quando você está coletando informações de preço de uma fonte externa, como um site de e-commerce, é importante garantir que o formato dos números esteja em conformidade com o esperado pela linguagem.

In [4]:
Preco = float(Preco[2:].replace(',','.'))
print(Preco, type(Preco))

117.6 <class 'float'>


#### Coletando Dados da Lista de Desejos
***


In [5]:
def ler_arquivo(nome_arquivo):
    lista_desejos = []

    with open(nome_arquivo, 'r') as file:
        arquivo = csv.reader(file, delimiter=';')
        next(arquivo)
        for linha in arquivo:
            if len(linha) == 2:
                item = {
                    'URL': linha[0],
                    "Preco-alvo": float(linha[1].replace(',', '.'))
                }
                lista_desejos.append(item)
    return lista_desejos

In [6]:
arquivo = '..\datasets\E-commerce\lista_de_desejos.txt'

lista_desejos = ler_arquivo(arquivo)
print(lista_desejos)

[{'URL': 'https://produto.mercadolivre.com.br/MLB-1819810336-automatizaco-de-processos-com-rpa-_JM#polycard_client=storefronts&type=item&tracking_id=883bb066-f7df-4b07-b9c7-17e223e14c88&source=eshops', 'Preco-alvo': 120.0}, {'URL': 'https://www.mercadolivre.com.br/data-science-para-negocios/p/MLB22819951#polycard_client=storefronts&type=product&tracking_id=a1e2d65b-6361-40a1-8ab3-89357f43c6f2&source=eshops&wid=MLB3315351201&sid=storefronts ', 'Preco-alvo': 79.9}, {'URL': 'https://www.mercadolivre.com.br/storytelling-com-dados-edico-colorida/p/MLB19783940#polycard_client=storefronts&type=product&tracking_id=b0f3ec73-4952-4c43-9638-c17da4e881ac&source=eshops&wid=MLB3677811009&sid=storefronts', 'Preco-alvo': 72.0}, {'URL': 'https://produto.mercadolivre.com.br/MLB-4616732102-livro-projetando-sistemas-de-machine-learning-processo-interativo-para-aplicacoes-prontas-para-produco-_JM#polycard_client=storefronts&type=item&tracking_id=a851836a-15ea-4590-9c2d-b0ebf81b2eae&source=eshops', 'Preco-a

  arquivo = '..\datasets\E-commerce\lista_de_desejos.txt'


#### Visualizando Dados Coletados
***

In [7]:
lista_desejos

[{'URL': 'https://produto.mercadolivre.com.br/MLB-1819810336-automatizaco-de-processos-com-rpa-_JM#polycard_client=storefronts&type=item&tracking_id=883bb066-f7df-4b07-b9c7-17e223e14c88&source=eshops',
  'Preco-alvo': 120.0},
 {'URL': 'https://www.mercadolivre.com.br/data-science-para-negocios/p/MLB22819951#polycard_client=storefronts&type=product&tracking_id=a1e2d65b-6361-40a1-8ab3-89357f43c6f2&source=eshops&wid=MLB3315351201&sid=storefronts ',
  'Preco-alvo': 79.9},
 {'URL': 'https://www.mercadolivre.com.br/storytelling-com-dados-edico-colorida/p/MLB19783940#polycard_client=storefronts&type=product&tracking_id=b0f3ec73-4952-4c43-9638-c17da4e881ac&source=eshops&wid=MLB3677811009&sid=storefronts',
  'Preco-alvo': 72.0},
 {'URL': 'https://produto.mercadolivre.com.br/MLB-4616732102-livro-projetando-sistemas-de-machine-learning-processo-interativo-para-aplicacoes-prontas-para-produco-_JM#polycard_client=storefronts&type=item&tracking_id=a851836a-15ea-4590-9c2d-b0ebf81b2eae&source=eshops',

#### Função Esperar e Executar - Comportamento Humano
***

In [8]:
def esperar(segundos=None):
    if not segundos:
        segundos = random.randrange(2,8)
    print(f'Esperando time de {segundos} segundos')
    time.sleep(segundos)

#### Validação da Função Esperar e Executar


In [9]:
segundos = 5
esperar(segundos)

Esperando time de 5 segundos


In [10]:
esperar()

Esperando time de 6 segundos


#### Gera Dados de Email
***

In [11]:
def conexaoEmail():
    host = 'smtp-mail.outlook.com'
    port = '587'
    User = os.environ['email_principal']
    senha = os.environ['senha_email']

    try:
        print('Iniciando conexão')
        server = smtplib.SMTP(host, port)
        server.starttls()
        server.login(user=User, password=senha)

        print('Sucesso')
        return server    

    except Exception as e:
        print(f'Ocorreu um erro na conexão. erro: {e}')

In [12]:
conexaoEmail()

Iniciando conexão
Ocorreu um erro na conexão. erro: (535, b'5.7.3 Authentication unsuccessful [ROAP284CA0356.BRAP284.PROD.OUTLOOK.COM 2024-11-15T22:29:23.319Z 08DD054A36351E82]')


#### Validação da Função de Gerar Dados do Email 

In [13]:
def geraDadosEmail(produto, url, preco_atual):
    if len(produto)> 30:
        descricao = produto[0:30] + '...'

    else:
        descricao = produto

    assunto = f'Preço caiu! Item: {descricao}'
    corpoEmail = f''' 
    Oportunidade de compra
    acesse agora - {produto}
    link: {url}
    '''

    return assunto, corpoEmail

In [14]:
Produto = 'curso'
url = 'www.google'
Preco = 2903

assunto, corpoEmail = geraDadosEmail(Produto, url, Preco)
print(assunto, corpoEmail)

Preço caiu! Item: curso  
    Oportunidade de compra
    acesse agora - curso
    link: www.google
    


### Realiza Conexão com o Servidor de E-mail
***

In [15]:
def conexaoEmail():
    host = 'smtp.gmail.com'
    port = '587'
    User = os.environ['email_principal']
    senha = os.environ['senha_email']

    try:
        print('Iniciando conexão')
        server = smtplib.SMTP(host, port)
        server.starttls()
        server.login(user=User, password=senha)

        print('Sucesso')
        return server    

    except Exception as e:
        print(f'Ocorreu um erro na conexão. erro: {e}')

#### Validação da Conexão com o Servidor de E-mail

In [16]:
conexaoEmail()

Iniciando conexão
Ocorreu um erro na conexão. erro: (535, b'5.7.8 Username and Password not accepted. For more information, go to\n5.7.8  https://support.google.com/mail/?p=BadCredentials d9443c01a7336-211d0dc4cbesm17194135ad.21 - gsmtp')


#### Coleta de dados de Lista de Email

In [17]:
def coletaEmail(listaEmail):
    with open(listaEmail, 'r') as file:
        lista = [linha.strip() for linha in file]
        return lista

In [18]:
caminhoEmails = "../datasets/lista_emails.txt"
destinatario = coletaEmail(caminhoEmails)

In [19]:
destinatario

['kkarenwwow@gmail.com', 'milainy4@gmail.com']

#### Função de Envio de Email
***

In [20]:
def enviar_email(produto, url, preco_atual, remetente):
    
    server = conexaoEmail()

    assunto, corpoEmail = geraDadosEmail(produto=produto,
                                         url=url,
                                         preco_atual=preco_atual)
    
    try:
        remetente = remetente
        caminhoEmails = "../datasets/lista_emails.txt"
        destinatario = coletaEmail(caminhoEmails)

        msg = f'Subject: {assunto}\n\n {corpoEmail}'

        
        server.sendmail(from_addr=remetente,
                        to_addrs=destinatario,
                        msg=msg.encode('latin1'))
        server.quit()

        print('Email enviado')
        
    except Exception as e:
        print(f'Nao foi possivel {e}')

In [21]:
enviar_email('teste','google', 273, 'milainy4@gmail.com')

Iniciando conexão


Ocorreu um erro na conexão. erro: (535, b'5.7.8 Username and Password not accepted. For more information, go to\n5.7.8  https://support.google.com/mail/?p=BadCredentials d2e1a72fcca58-72477135ecbsm1868656b3a.84 - gsmtp')
Nao foi possivel 'NoneType' object has no attribute 'sendmail'


#### Coletando Dados da Lista de Desejos
***