In [1]:
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# Configuración del WebDriver (Chrome) para modo headless
options = Options()
options.headless = True  # Ejecutar el navegador en segundo plano

# Inicializar el WebDriver con ChromeDriver Manager
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)

# URL de la página
url = "https://simple.ripley.cl/moda-infantil/marcas-destacadas/harvest?s=mdco"

# Navegar a la página
driver.get(url)

# Esperar a que los productos estén presentes en la página con WebDriverWait de 30 segundos
productos_elements = WebDriverWait(driver, 30).until(
    EC.presence_of_all_elements_located((By.CLASS_NAME, "catalog-product-item__container"))
)

# URL base del sitio
base_url = "https://simple.ripley.cl"

# Extraer los detalles de cada producto
for producto in productos_elements:
    try:
        # Esperar 10 segundos entre cada iteración de producto
        time.sleep(10)
        
        # Extraer nombre del producto
        nombre_producto = producto.find_element(By.CLASS_NAME, "catalog-product-details__name").text
        
        # Intentar extraer la URL del producto (href) - Usamos un selector más específico para obtener el enlace relativo
        try:
            # Aquí extraemos el href relativo, y lo concatenamos con la URL base
            url_relativa = producto.find_element(By.CSS_SELECTOR, "a").get_attribute("href")
            url_producto = url_relativa if url_relativa else None
        except Exception as e:
            url_producto = None
            print(f"Error al extraer URL del producto: {e}")
        
        # Intentar extraer el SKU del producto (número después del 'id=')
        try:
            sku = producto.find_element(By.CSS_SELECTOR, "a").get_attribute("id")
        except Exception as e:
            sku = None
            print(f"Error al extraer SKU: {e}")
        
        # Intentar extraer la URL de la imagen del producto (src de la etiqueta img)
        try:
            url_imagen = producto.find_element(By.CSS_SELECTOR, "img").get_attribute("src")
        except Exception as e:
            url_imagen = None
            print(f"Error al extraer URL de la imagen: {e}")
        
        # Imprimir los datos del producto
        print(f"Nombre: {nombre_producto}")
        print(f"URL del producto: {url_producto if url_producto else 'No disponible'}")
        print(f"SKU: {sku if sku else 'No disponible'}")
        print(f"URL de la imagen: {url_imagen if url_imagen else 'No disponible'}")
        print("-" * 50)  # Separador para mejorar la lectura
    
    except Exception as e:
        print(f"Error al procesar un producto: {e}")
        continue  # Continuar con el siguiente producto si hay algún error

# Cerrar el navegador
driver.quit()


Nombre: PACK X2 CALZA NIÑA HARVEST
URL del producto: https://simple.ripley.cl/pack-x2-calza-nina-harvest-2000401336058
SKU: 2000401336058
URL de la imagen: https://home.ripley.cl/store/Attachment/WOP/D152/2000401336232/2000401336232_2.jpg
--------------------------------------------------
Error al extraer URL del producto: Message: no such element: Unable to locate element: {"method":"css selector","selector":"a"}
  (Session info: chrome=131.0.6778.109); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception
Stacktrace:
	GetHandleVerifier [0x01013433+25059]
	(No symbol) [0x00F9CE34]
	(No symbol) [0x00E7BEC3]
	(No symbol) [0x00EBFD86]
	(No symbol) [0x00EBFFCB]
	(No symbol) [0x00EB5B01]
	(No symbol) [0x00EE1F44]
	(No symbol) [0x00EB5A24]
	(No symbol) [0x00EE2194]
	(No symbol) [0x00EFB51E]
	(No symbol) [0x00EE1C96]
	(No symbol) [0x00EB3FAC]
	(No symbol) [0x00EB4F3D]
	GetHandleVerifier [0x01305593+311


KeyboardInterrupt

