In [28]:
from selenium import webdriver # → Permite controlar el navegador mediante Selenium
from selenium.webdriver.common.by import By #→ Facilita la búsqueda de elementos en la página mediante selectores
from selenium.webdriver.support.ui import WebDriverWait #→ Permite esperar hasta que un elemento esté disponible.
from selenium.webdriver.support import expected_conditions as EC # → Define condiciones para esperar la aparición de elementos.
from time import sleep

driver = webdriver.Chrome()
driver.maximize_window()
driver.get("https://holatente.com/")
print("Accede a la página")
sleep(3)

wait = WebDriverWait(driver, 10) #→ Crea un objeto wait que esperará hasta 10 segundos para que un elemento aparezca antes de lanzar un error.

# Cerrar cookies
try:
    driver.find_element(By.CSS_SELECTOR, "#shopify-pc__banner__btn-decline").click()
    print("Cierra cookies")
    sleep(3)
except:
    print("No apareció el banner de cookies")

# Cerrar pop-up de suscripción
try:
    driver.find_element(By.CSS_SELECTOR, "#tente-moods-cajitas-de-10-tes-e-infusiones > div:nth-child(22) > div > div:nth-child(2) > div > div > div > div > div:nth-child(1) > button > svg > path").click()
    print("Cierra suscripción")
    sleep(3)
except:
    print("No apareció el pop-up de suscripción")

# Entrar en la sección de tés
driver.find_element(By.CSS_SELECTOR, "#header > sticky-header > div.header__content > div > div > div.header__nav.d-none.d-lg-flex > nav > div > div:nth-child(3) > a").click()
print("Entra en la sección de tés")
sleep(3)


# Función para hacer scroll hasta el final de la página 
def scroll_to_bottom():
    last_height = driver.execute_script("return document.body.scrollHeight")  # Altura inicial
    while True:
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")  # Baja al final
        sleep(5)  # Espera para que se carguen más productos
        new_height = driver.execute_script("return document.body.scrollHeight")  # Nueva altura
        if new_height == last_height:
            break  # Si no hay más contenido, salir del bucle
        last_height = new_height


#  Scroll infinito hasta que cargue todo 
scroll_to_bottom()
print("Scroll infinito completado, todos los productos cargados")


diccionario_tes = {
    "nombre": [],
    "precio": [],
    "tipo de té": [],
    "ingredientes": [],
}

# Obtener la cantidad total de productos cargados
productos = driver.find_elements(By.CSS_SELECTOR, "#CollectionProductGrid > div > product-item") #→ Encuentra todos los productos en la página usando find_elements (devuelve una lista).
total_productos = len(productos) #→ Guarda la cantidad total de productos en total_productos. 
print(f"Se han encontrado {total_productos} productos")

# Iterar sobre los productos 
for n in range(1, total_productos + 1):
    try:
        producto = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, 
            f"#CollectionProductGrid > div:nth-child({n}) > product-item > div > div > div.product-collection__image > a > div > img"))) #→ Usa element_to_be_clickable para esperar que cada producto sea clickeable.
        driver.execute_script("arguments[0].scrollIntoView({block: 'center'});", producto) #→ Hace scroll hasta el producto antes de hacer clic.
        sleep(1)
        producto.click()

        print(f"Entra en la página del té {n}")
        sleep(2)

        try:
            nombre = driver.find_element(By.CSS_SELECTOR, "#shopify-section-template--16959427772589__main h1").text
        except:
            nombre = "No disponible"
        diccionario_tes["nombre"].append(nombre)

        try:
            precio = driver.find_element(By.CSS_SELECTOR, ".product-page-info__price span span").text
        except:
            precio = "No disponible"
        diccionario_tes["precio"].append(precio)

        try:
            tipo = driver.find_element(By.CSS_SELECTOR, ".product-page-info__details span a").text
        except:
            tipo = "No disponible"
        diccionario_tes["tipo de té"].append(tipo)

        # Clic en la pestaña de ingredientes
        try:
            ing_tab = driver.find_element(By.CSS_SELECTOR, "tabs-element div.tabs__body > div:nth-child(2) > span")
            driver.execute_script("arguments[0].click();", ing_tab)
            sleep(1)
            ingredientes = driver.find_element(By.CSS_SELECTOR, "tabs-element div.tabs__body > div.active > div > p:nth-child(1)").text
        except:
            ingredientes = "No disponible"
        diccionario_tes["ingredientes"].append(ingredientes)

        # Regresar a la página de productos con espera
        driver.back()
        wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#CollectionProductGrid")))
        sleep(2)

    except Exception as e:
        print(f"Error en el producto {n}: {e}")
        sleep(2)

driver.close()


Accede a la página
Cierra cookies
Cierra suscripción
Entra en la sección de tés
Scroll infinito completado, todos los productos cargados
Se han encontrado 27 productos
Entra en la página del té 1
Entra en la página del té 2
Entra en la página del té 3
Entra en la página del té 4
Entra en la página del té 5
Entra en la página del té 6
Entra en la página del té 7
Entra en la página del té 8
Entra en la página del té 9
Entra en la página del té 10
Entra en la página del té 11
Entra en la página del té 12
Entra en la página del té 13
Entra en la página del té 14
Entra en la página del té 15
Entra en la página del té 16
Entra en la página del té 17
Entra en la página del té 18
Entra en la página del té 19
Entra en la página del té 20
Entra en la página del té 21
Entra en la página del té 22
Entra en la página del té 23
Entra en la página del té 24
Entra en la página del té 25
Entra en la página del té 26
Entra en la página del té 27


In [29]:
diccionario_tes


{'nombre': ['Té Hogar de Canela',
  'Té Sándalo',
  'Té Toucher de Noel',
  'Infusión Abrazos de lavanda',
  'Té Bamboo',
  'Rooibos Afro Sunset',
  'Té Petonet',
  'Té Bella-mente',
  'Té Sweet Marrakech',
  'Té The last garden',
  'Té Earl Grey Bio',
  'Té Ceylon OP Lovers Leap',
  'Té Chai Lovers',
  'Té China Milky Oolong',
  'Té Maduixa',
  'Té China Pu Erh 1st Grade',
  'Té Seny',
  'Té Mira Bonito',
  'Té Bambú Spa',
  'Infusión Tutti Frutti',
  'Rooibos Happy Tommy',
  'Infusión Jengibre y limón BIO',
  'Infusión Calma Orgánica',
  'Infusión Zanare-mola-cha',
  'Té Mon Amour',
  'Té Superfoods',
  'Té Bembé'],
 'precio': ['€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00',
  '€15,00'],
 'tipo de té': ['Té verde',
  'Té blanc

In [30]:
import pandas as pd
df = pd.DataFrame(diccionario_tes)
df

Unnamed: 0,nombre,precio,tipo de té,ingredientes
0,Té Hogar de Canela,"€15,00",Té verde,"té Hogar de Canela té verde, canela, claveles,..."
1,Té Sándalo,"€15,00",Té blanco,"té blanco, canela, nuez moscada, cardamomo ver..."
2,Té Toucher de Noel,"€15,00",Té negro,"Cardamomo, jengibre, semilla de cilantro, clav..."
3,Infusión Abrazos de lavanda,"€15,00",Infusión,"Lavanda, caramelo, cardamomo, manzana, jengibr..."
4,Té Bamboo,"€15,00",Tenté,"Frambuesa blanca,hojas de bambú y caléndula"
5,Rooibos Afro Sunset,"€15,00",Infusión,"Frambuesa, Cúrcuma y aciano"
6,Té Petonet,"€15,00",Té negro,
7,Té Bella-mente,"€15,00",Té blanco,
8,Té Sweet Marrakech,"€15,00",Té verde,
9,Té The last garden,"€15,00",Té verde,
