In [6]:
# Bibliotecas utilizadas
from bs4 import BeautifulSoup
import requests
import time
import datetime
import csv
import pandas as pd
import smtplib
import os

In [7]:
# Define o caminho onde o arquivo CSV será armazenado
# Por padrão, o arquivo será armazenado no mesmo diretório onde o script está localizado
cwd = os.getcwd()  # Obtém o diretório de trabalho atual
folder_path = os.path.join(cwd, 'price_history.csv')  # Cria o caminho completo para o arquivo CSV


In [8]:
# Função para verificar o preço de um produto

def check_price():
    # URL do produto que será monitorado
    URL = 'https://www.kabum.com.br/produto/320798/processador-amd-ryzen-5-5600-3-5ghz-4-4ghz-max-turbo-cache-35mb-am4-sem-video-100-100000927box?gad_source=1'

    # Cabeçalhos HTTP para simular um navegador web
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36",
        "Accept-Encoding": "gzip, deflate",
        "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
        "DNT": "1",
        "Connection": "close",
        "Upgrade-Insecure-Requests": "1"
    }

    # Obter a página web e extrair o conteúdo HTML
    page = requests.get(URL, headers=headers)

    # Armazenar o conteúdo HTML usando BeautifulSoup
    sp = BeautifulSoup(page.content, "html.parser")

    # Extrair as informações relevantes e limpar os dados
    product_name_raw = sp.find('h1', class_='sc-58b2114e-6 brTtKt').text
    product_name = product_name_raw.split(',')[0].strip() # Nome do produto

    price_raw = sp.find('h4', class_='sc-5492faee-2 ipHrwP finalPrice').text
    price = price_raw[3:].strip() # Preço

    # Obter a data atual para registro
    today = datetime.date.today().strftime('%d/%m/%Y')

    # Definir cabeçalho e dados para o arquivo CSV
    header = ['Produto', 'Valor', 'Data']
    data = [product_name, price, today]

    # Verificar se o arquivo CSV já existe
    if not os.path.exists(folder_path):
        # Se não existir, criar um novo arquivo CSV e escrever os cabeçalhos e dados
        with open(folder_path, 'w', newline='', encoding='UTF8') as f:
            writer = csv.writer(f)
            writer.writerow(header)
            writer.writerow(data)
    else:
        # Se já existir, adicionar os novos dados ao arquivo existente
        with open(folder_path, 'a+', newline='', encoding='UTF8') as f:
            writer = csv.writer(f)
            writer.writerow(data)


In [9]:
# Definir a duração em segundos para a execução do monitoramento
duration = 259



200  # Definir a duração em segundos (no exemplo, 3 dias)
start_time = datetime.datetime.now()  # Obter o tempo atual de início da execução
end_time = start_time + datetime.timedelta(seconds=duration)  # Calcular o tempo de término da execução

# Executar o loop até que o tempo de execução definido expire
while datetime.datetime.now() < end_time:
    # Chamar a função para verificar o preço do produto
    check_price()
    # Aguardar um intervalo de tempo antes de verificar novamente (opcional)
    time.sleep(3600)  # No exemplo, aguardar 1 hora antes da próxima verificação

# Exibir mensagem de conclusão após a execução pelo tempo definido
print(f"A execução foi interrompida após {duration} segundos.")


A execução foi interrompida após 259200 segundos.


In [12]:
# Lê o arquivo CSV localizado em 'folder_path' e carrega os dados em um DataFrame
df = pd.read_csv(folder_path)

# Exibe o DataFrame
df

Unnamed: 0,Produto,Valor,Data
0,Processador AMD Ryzen 5 5600,82999,17/05/2024
1,Processador AMD Ryzen 5 5600,82999,17/05/2024
2,Processador AMD Ryzen 5 5600,82999,17/05/2024
3,Processador AMD Ryzen 5 5600,82999,17/05/2024
4,Processador AMD Ryzen 5 5600,82999,17/05/2024
...,...,...,...
68,Processador AMD Ryzen 5 5600,84999,20/05/2024
69,Processador AMD Ryzen 5 5600,84999,20/05/2024
70,Processador AMD Ryzen 5 5600,84999,20/05/2024
71,Processador AMD Ryzen 5 5600,84999,20/05/2024
