In [58]:
import time
import pandas as pd
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager

# Configurações do Selenium
options = Options()
options.headless = True  # Executar em modo headless (sem interface gráfica)

# Use o ChromeDriverManager para instalar o ChromeDriver
service = Service(ChromeDriverManager().install())
driver = webdriver.Chrome(service=service, options=options)

# URLs das categorias
urls = [
    "https://www.amazon.com.br/s?k=air+fryer",
    "https://www.amazon.com.br/s?k=wap",
    "https://www.amazon.com.br/s?k=extratora",
    "https://www.amazon.com.br/s?k=lavadora+de+alta+press%C3%A3o",
    "https://www.amazon.com.br/s?k=aspirador+de+p%C3%B3+robo",
    "https://www.amazon.com.br/s?k=parafusadeira",
    "https://www.amazon.com.br/s?k=aspirador+de+p%C3%B3+vertical"
]

# Função para extrair informações da página
def extract_info(url):
    driver.get(url)
    time.sleep(5)  # Esperar a página carregar completamente
    
    products = driver.find_elements(By.XPATH, "//div[@data-component-type='s-search-result']")
    
    # Extrair informações
    data = []
    for product in products:
        title = "N/A"
        
        # Tentativa de encontrar o título principal
        try:
            title_span = product.find_element(By.CSS_SELECTOR, "span.a-size-base-plus.a-color-base.a-text-normal")
            title = title_span.text.strip()
        except:
            pass
        
        # Tentativa de encontrar o título alternativo
        if title == "N/A":
            try:
                title_span = product.find_element(By.CSS_SELECTOR, "span.a-truncate-cut")
                title = title_span.text.strip()
            except:
                pass
        
        data.append({
            'title': title
        })
    
    return pd.DataFrame(data)

# Extraindo dados e criando dataframes
dataframes = {}
for url in urls:
    category = url.split("=")[-1]
    print(f"Extraindo dados para a categoria: {category}")
    dataframes[category] = extract_info(url)
    time.sleep(2)  # Atraso de 2 segundos entre as requisições

# Exibindo DataFrames
for category, df in dataframes.items():
    print(f"\nCategoria: {category}")
    print(df)

# Salvando os DataFrames em arquivos CSV
for category, df in dataframes.items():
    df.to_csv(f"{category}.csv", index=False)

# Fechar o driver
driver.quit()


Extraindo dados para a categoria: air+fryer
Extraindo dados para a categoria: wap
Extraindo dados para a categoria: extratora
Extraindo dados para a categoria: lavadora+de+alta+press%C3%A3o
Extraindo dados para a categoria: aspirador+de+p%C3%B3+robo
Extraindo dados para a categoria: parafusadeira
Extraindo dados para a categoria: aspirador+de+p%C3%B3+vertical

Categoria: air+fryer
                                                title
0   Fritadeira Elétrica sem óleo Air Fryer 3,5L 15...
1   Arno, Airfryer air plus e grill digital, 4,2l,...
2   Airfrey Oven e Grill Arno Expert 9 em 1 Digita...
3   Fritadeira Air Fryer 5L Britânia BFR40PI Preta...
4   Fritadeira Sem Óleo Air Fryer 4L, Mondial, Pre...
5     Fritadeira Sem Óleo Oster 127V - OFRT520, PRETO
6   Fritadeira Philco Air Fryer Oven 12L PFR2200P ...
7   Fritadeira Air Fryer Forno Oven 12 Litros, Mon...
8   Fritadeira Sem Óleo Air Fryer 5L, Mondial, Pre...
9   Fritadeira Air Fryer Gourmet Philco 4,4 Litros...
10  Electrolux por Rit