# Amazon

Utilizando un `hover` vamos a simular movimientos por dentro del sitio web.

También cómo introducir cadenas de texto en cuadros de texto, y simularemos cómo una persona escribe para ser más indetectables.

Descubriremos cómo interaccionar con banners que aparecen pasado un tiempo de estar en la web.

In [1]:
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager # sustituye al archivo
from selenium.webdriver.chrome.options import Options # opciones de chrome
from selenium.webdriver.common.by import By # By es para buscar por tag, clase, id...
from selenium.webdriver.support.ui import WebDriverWait   # para meter esperaras
from selenium.webdriver.support import expected_conditions as EC   # para esperar ciertos eventos
from selenium.webdriver import ActionChains # para hacer acciones con el ratón
import time
import random
import selenium.webdriver.common.keys as Keys # para simular teclas

In [2]:
#Opciones de chrome
opciones = webdriver.ChromeOptions()
#opciones.add_argument('--start-maximized')
opciones.add_argument('window-size=775,1400')
opciones.add_argument('--disable-extensions')
opciones.add_argument('--disable-blink-features=AutomationControlled')
opciones.add_argument('--no-sandbox')
opciones.add_experimental_option('useAutomationExtension', False)
opciones.add_experimental_option('excludeSwitches', ['enable-automation'])

# guardar las cookies
# opciones.add_argument('user-data-dir=cookies')    # mantiene las cookies
opciones.add_argument('--incognito') # modo incognito

In [3]:
url = 'https://www.amazon.es/'

In [4]:
driver = webdriver.Chrome(options=opciones)

driver.get(url)

There was an error managing chromedriver (error sending request for url (https://googlechromelabs.github.io/chrome-for-testing/known-good-versions-with-downloads.json)); using driver found in the cache


In [5]:
# Continuamos sin aceptar las cookies
driver.find_element(By.ID, 'sp-cc-rejectall-link').click()

**HOVER**

El objeto `hover` en Selenium es una técnica que se utiliza para simular el movimiento del cursor del ratón sobre un elemento web específico en una página, activando de este modo las funciones de estilo o comportamiento asociadas al evento hover.

In [6]:
#Hacemos hover sobre el elemento que queremos cuyo XPATH //*[@id="nav-link-accountList"]
elemento = driver.find_element(By.XPATH, '//*[@id="nav-link-accountList"]')

#Y ahora creamos el objeto
hover = ActionChains(driver).move_to_element(elemento)

#Y ahora lo ejecutamos
hover.perform()

In [7]:
#Dentro de los elementos del hover voy a darle a identificarse:
driver.find_element(By.CLASS_NAME, 'nav-action-inner').click()

In [8]:
#Podríamos loguearnos, pero lo que vamos a hacer es decirle al navegador que vaya para atrás
driver.back()

In [9]:
#Introducir texto de busqueda
cuadro_busqueda = driver.find_element(By.XPATH, '//*[@id="twotabsearchtextbox"]')

#Vamos a hacer una busqueda de partituras mozart:
cuadro_busqueda.send_keys('partitura mozart')

In [10]:
#Y ahora le damos a enter
cuadro_busqueda.submit()

In [11]:
#MODO NINJA ACTIVADO
cuadro_busqueda = driver.find_element(By.XPATH, '//*[@id="twotabsearchtextbox"]')

#Queremos escribir juguetes lego, pero vamos a hacerlo letra a letra como lo haría un humano
time.sleep(2)

#Borramos la busqueda anterior:
cuadro_busqueda.clear()
time.sleep(2)

#Y ahora vamos a escribir letra a letra:
for letra in 'juguetes lego':
    cuadro_busqueda.send_keys(letra)
    time.sleep(random.uniform(0.3,0.75))
cuadro_busqueda.submit()

In [12]:
#Sacamos listado de los productos de la página:
productos = driver.find_elements(By.CLASS_NAME, 'a-section.a-spacing-small.puis-padding-left-small.puis-padding-right-small')
productos.__len__()

68

In [13]:
#Le pasamos el listado de productos a Bs4
from bs4 import BeautifulSoup
soup = BeautifulSoup(driver.page_source, 'html.parser')
soup.find_all('div', class_='a-section a-spacing-base')
#Printeamos la lista de productos:
for producto in productos:
    print(producto.text)

LEGO Classic Caja de Ladrillos Creativos Mediana, Juegos de Construcción para Niños y Niñas de 4 Años o Más, Base Verde, Coches y Animales de Juguete, Fácil Almacenaje, Idea de Regalo Infantil 10696
30.640
1 mil+ comprados el mes pasado
24
01€ PVPR:
29,99€
Entrega GRATIS el lun, 30 de sept en tu primer pedido
Entrega más rápida el sáb, 28 de sept
Vendido por: Amazon
Edades: 4 años y más
LEGO 31058 Creator Grandes Dinosaurios, Regalo de Reyes para Niños y Niñas de 7 Años o Más, Maqueta 3en1 de Pterodáctilo, Triceratops y T-Rex, Figura de Animales de Juguete de Parque Jurásico
3.144
600+ comprados el mes pasado
13
64€ PVPR:
14,99€
Ahorra 5 % al comprar 4 de esta selección
Entrega GRATIS el lun, 30 de sept en tu primer pedido
Entrega más rápida el sáb, 28 de sept
Vendido por: Amazon
Más opciones de compra
12,95 €(59 nuevas ofertas)
Edades: 7 años y más
LEGO Marvel Persecución en Moto: Spider-Man vs. Doc Ock, Juguete de Construcción con Cañones y Aracnoblásteres, Moto de Spidey, Regalo par

In [14]:
productos[60].text.split('\n')

['LEGO Speed Champions Ferrari 812 Competizione Maqueta de Coche para Construir, Deportivo Rojo de Juguete de Colección Edición 2023, Regalo para Niños y Niñas de 9 Años o Más 76914',
 '3.042',
 '200+ comprados el mes pasado',
 '24',
 '87€',
 'Ahorra 5 % al comprar 4 de esta selección',
 'Entrega GRATIS el lun, 30 de sept en tu primer pedido',
 'Entrega más rápida el sáb, 28 de sept',
 'Vendido por: Amazon',
 'Más opciones de compra',
 '18,92 €(78 ofertas usadas y nuevas)',
 'Edades: 9 años y más']

In [15]:
producto.find_element(By.CLASS_NAME, 'a-icon-alt')

<selenium.webdriver.remote.webelement.WebElement (session="f9e27d0f79d478562d832cb55c3249b2", element="f.70D31203A657DB2D5D2A7D5D84A21E43.d.5F0E2ED07CC5DF85569F903F4F743093.e.333")>

In [45]:
#Vamos a sacar el nombre del producto, el precio y el link
list_of_all= []


for i,producto in enumerate(productos):
    dicc_of_all = {}
    try:
        nombre = producto.find_element(By.CLASS_NAME, 'a-size-base-plus').text
        dicc_of_all['nombre'] = nombre
    except: # Exception as e:
        nombre = print(f"El producto[{i}] sin nombre")#-->error: {e}
    try:
        precio = producto.find_element(By.CLASS_NAME, 'a-price-whole').text
        dicc_of_all['precio'] = precio + '€'
    except:
        precio = print(f"El producto[{i}] sin precio")
    try:
        stars = producto.find_element(By.CLASS_NAME, 'a-icon-alt').text
        dicc_of_all['stars'] = stars
    except:
        stars = print(f"El producto[{i}] sin stars")
    try:
        link = producto.find_element(By.CLASS_NAME, 'a-link-normal.a-text-normal').get_attribute('href')
        dicc_of_all['link'] = {link}
    except:
        link = print(f"El producto[{i}] sin link")

    
    list_of_all.append(dicc_of_all) 
print(list_of_all)

El producto[65] sin stars
[{'nombre': 'LEGO Classic Caja de Ladrillos Creativos Mediana, Juegos de Construcción para Niños y Niñas de 4 Años o Más, Base Verde, Coches y Animales de Juguete, Fácil Almacenaje, Idea de Regalo Infantil 10696', 'precio': '24€', 'stars': '', 'link': {'https://www.amazon.es/LEGO-Classic-10696-ladrillos-creativos/dp/B00NVDP3ZU/ref=sr_1_1?__mk_es_ES=%C3%85M%C3%85%C5%BD%C3%95%C3%91&crid=3B9W1AN9A5P7B&dib=eyJ2IjoiMSJ9.JeseBEYIk1Lq23zhgXFBeLvR6IAQsidBwkDGe4FZrAkwxvV0nuk8HBhBHV9v0ErdfgH8hu9zwbmW1hAbmX21SalCQ89UhT9dhTVetx9a5zBdU_g3ukVERk-V4sMAFa3_bfE3RhQWV_FjiZXKPuryM7APNvYyDffweFog4nP62FK-XUaa4ud8cQXhqLPK0SO46INxcp1k3uO1d9_yhxrqWmZlHceJGx9lIs7nCsxIhxz_yLsYKWNe8Mq_cYWwedboBpw4gfIIOw-vG_ux6PEXW_m-wV4dzjlkiIyFH5G17Bk.MSNeezHiqzVD-_V908HSeM3ksbNyswaLRBhP0Y0Ld1I&dib_tag=se&keywords=juguetes+lego&qid=1727376299&sprefix=juguetes+lego%2Caps%2C110&sr=8-1'}}, {'nombre': 'LEGO 31058 Creator Grandes Dinosaurios, Regalo de Reyes para Niños y Niñas de 7 Años o Más, Maqueta 3en1 

In [18]:
import pandas as pd

In [46]:
df = pd.DataFrame(list_of_all)
df.head()

Unnamed: 0,nombre,precio,stars,link
0,LEGO Classic Caja de Ladrillos Creativos Media...,24€,,{https://www.amazon.es/LEGO-Classic-10696-ladr...
1,"LEGO 31058 Creator Grandes Dinosaurios, Regalo...",13€,,{https://www.amazon.es/LEGO-Creator-Grandes-Di...
2,LEGO Marvel Persecución en Moto: Spider-Man vs...,9€,,{https://www.amazon.es/LEGO-Marvel-Persecuci%C...
3,LEGO Sonic The Hedgehog Sonic: Desafío de la E...,29€,,{https://www.amazon.es/LEGO-76990-Sonic-Hedgeh...
4,LEGO City Lancha de Rescate de Bomberos y Zodi...,19€,,{https://www.amazon.es/LEGO-60373-Bomberos-Flo...


In [105]:
productos[7].text

'LEGO Minecraft Set La Casa-Ajolote, Base Submarina Rosa de Construcción con Explorador Buceador, Zombi y Figuras de Delfín y Pez Globo, Juguetes de Aventura para Niños y Niñas de 7 Años o Más 21247\n752\n100+ comprados el mes pasado\n26\n99€\nVendido por: Amazon\nMás opciones de compra\n22,35 €(66 nuevas ofertas)'

In [106]:
driver.quit()

# MARCA

Esperas hasta que un botón sea clickable.

In [107]:
url = 'https://www.marca.com/'
driver = webdriver.Chrome(options=options)
driver.get(url)
driver.find_element(By.ID, 'ue-accept-notice-button').click()
#Boton de la radio
driver.find_element(By.CLASS_NAME, 'ue-c-tooltip--closearrow').click()

NameError: name 'options' is not defined

In [None]:
driver.quit()

In [None]:
url = 'https://www.marca.com/'
driver = webdriver.Chrome(options=options)
driver.get(url)
#Esperar hasta que el botón esté disponible
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.ID, 'ue-accept-notice-button'))).click()
#Boton de la radio (X)
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CLASS_NAME, 'ue-c-tooltip--closearrow'))).click()
#Boton acceder a la radio
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CLASS_NAME, 'radio-heading'))).click()

In [None]:
driver.quit()