In [3]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager
import time
import pandas as pd

# Función de Scraping de Productos
def scrape_products():
    # Configuración del ChromeDriver
    chrome_options = Options()
    chrome_options.add_argument("--headless")  # Si no quieres ver el navegador en acción
    chrome_options.add_argument("--disable-gpu")  # Deshabilitar GPU (puede ser útil en máquinas sin GPU)
    chrome_options.add_argument("--no-sandbox")  # Evitar errores en entornos Linux (si es necesario)
    
    # Crear el servicio con el webdriver_manager
    service = Service(ChromeDriverManager().install())
    
    # Iniciar el navegador
    driver = webdriver.Chrome(service=service, options=chrome_options)
    
    # Página base
    base_url = 'https://www.opaline.cl/accesorios-avance#'
    
    # Número de la página actual
    page_num = 1
    
    # Recopilar los datos de los productos
    datos_productos = []
    
    while True:
        # Abrir la página correspondiente
        url = f'{base_url}{page_num}'
        driver.get(url)
        
        # Esperar un poco para que cargue la página completamente
        time.sleep(5)  # Puedes ajustar este tiempo si es necesario
        
        # Buscar los productos en la página
        productos = driver.find_elements(By.XPATH, '//li[@layout="c5200360-0801-42c6-ba1e-7a89fec4184f"]')
        
        if not productos:
            print(f"No se encontraron productos en la página {page_num}. Fin del scraping.")
            break
        
        # Extraer los datos de los productos en la página
        for producto in productos:
            try:
                # Extraer el nombre del producto
                nombre = producto.find_element(By.XPATH, './/h2[@class="category-product__departament"]').text
                
                # Extraer el precio original
                precio_original = producto.find_element(By.XPATH, './/span[@class="oldPrice"]').text
                
                # Extraer el precio final
                precio_final = producto.find_element(By.XPATH, './/span[@class="bestPrice"]').text
                
                # Extraer la URL de la imagen
                url_imagen = producto.find_element(By.XPATH, './/img').get_attribute('src')
                
                # Extraer la URL del producto
                url_producto = producto.find_element(By.XPATH, './/a[@class="category-product__image-a"]').get_attribute('href')
                
                # Guardar los datos del producto
                datos_productos.append({
                    'nombre': nombre,
                    'precio_original': precio_original,
                    'precio_final': precio_final,
                    'url_imagen': url_imagen,
                    'url_producto': url_producto
                })
            except Exception as e:
                print(f"Error al extraer datos de un producto: {e}")
        
        # Incrementar el número de página para ir a la siguiente
        page_num += 1
    
    # Si se encontraron productos, exportar los datos a Excel
    if datos_productos:
        # Convertir los datos en un DataFrame de pandas
        df = pd.DataFrame(datos_productos)
        
        # Ruta de destino para guardar el archivo Excel
        ruta_excel = r"C:\Users\constanza.perez\OneDrive - Colgram\Escritorio\OPAOAPA_3.xlsx"
        
        # Exportar los datos a Excel
        df.to_excel(ruta_excel, index=False, engine='openpyxl')
        
        print(f"Datos exportados exitosamente a {ruta_excel}")
    else:
        print("No se encontraron productos para exportar.")
    
    # Cerrar el navegador
    driver.quit()

# Llamar a la función para hacer el scraping
scrape_products()


Error al extraer datos de un producto: Message: no such element: Unable to locate element: {"method":"xpath","selector":".//span[@class="oldPrice"]"}
  (Session info: chrome=132.0.6834.160); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception
Stacktrace:
	GetHandleVerifier [0x009B74A3+25091]
	(No symbol) [0x0093DC04]
	(No symbol) [0x0081B373]
	(No symbol) [0x0085F4DC]
	(No symbol) [0x0085F65B]
	(No symbol) [0x00854F21]
	(No symbol) [0x00881F54]
	(No symbol) [0x00854E44]
	(No symbol) [0x008821A4]
	(No symbol) [0x0089B49E]
	(No symbol) [0x00881CA6]
	(No symbol) [0x008531D5]
	(No symbol) [0x0085435D]
	GetHandleVerifier [0x00CB07C3+3142947]
	GetHandleVerifier [0x00CC1A2B+3213195]
	GetHandleVerifier [0x00CBC412+3191154]
	GetHandleVerifier [0x00A58720+685184]
	(No symbol) [0x00946E1D]
	(No symbol) [0x00943E18]
	(No symbol) [0x00943FB6]
	(No symbol) [0x009366F0]
	BaseThreadInitThunk [0x75B05D49+25]
	R