# Amazon

Utilizando un `hover` vamos a simular movimientos por dentro del sitio web.

También cómo introducir cadenas de texto en cuadros de texto, y simularemos cómo una persona escribe para ser más indetectables.

Descubriremos cómo interaccionar con banners que aparecen pasado un tiempo de estar en la web.

In [1]:
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager # sustituye al archivo
from selenium.webdriver.chrome.options import Options # opciones de chrome
from selenium.webdriver.common.by import By # By es para buscar por tag, clase, id...
from selenium.webdriver.support.ui import WebDriverWait   # para meter esperaras
from selenium.webdriver.support import expected_conditions as EC   # para esperar ciertos eventos
from selenium.webdriver import ActionChains # para hacer acciones con el ratón
import time
import random
import selenium.webdriver.common.keys as Keys # para simular teclas

In [2]:
#Opciones de chrome
opciones = webdriver.ChromeOptions()
#opciones.add_argument('--start-maximized')
opciones.add_argument('window-size=775,1400')
opciones.add_argument('--disable-extensions')
opciones.add_argument('--disable-blink-features=AutomationControlled')
opciones.add_argument('--no-sandbox')
opciones.add_experimental_option('useAutomationExtension', False)
opciones.add_experimental_option('excludeSwitches', ['enable-automation'])

# guardar las cookies
# opciones.add_argument('user-data-dir=cookies')    # mantiene las cookies
opciones.add_argument('--incognito') # modo incognito

In [35]:
url = 'https://www.amazon.es/'

In [36]:
driver = webdriver.Chrome(options=opciones)

driver.get(url)

In [37]:
# Continuamos sin aceptar las cookies
driver.find_element(By.ID, 'sp-cc-rejectall-link').click()

**HOVER**

El objeto `hover` en Selenium es una técnica que se utiliza para simular el movimiento del cursor del ratón sobre un elemento web específico en una página, activando de este modo las funciones de estilo o comportamiento asociadas al evento hover.

In [12]:
#Hacemos hover sobre el elemento que queremos cuyo XPATH //*[@id="nav-link-accountList"]
elemento = driver.find_element(By.XPATH, '//*[@id="nav-link-accountList"]')

#Y ahora creamos el objeto
hover = ActionChains(driver).move_to_element(elemento)

#Y ahora lo ejecutamos
hover.perform()

In [13]:
#Dentro de los elementos del hover voy a darle a identificarse:
driver.find_element(By.CLASS_NAME, 'nav-action-inner').click()

In [14]:
#Podríamos loguearnos, pero lo que vamos a hacer es decirle al navegador que vaya para atrás
driver.back()

In [19]:
#Introducir texto de busqueda
cuadro_busqueda = driver.find_element(By.XPATH, '//*[@id="twotabsearchtextbox"]')

#Vamos a hacer una busqueda de partituras mozart:
cuadro_busqueda.send_keys('zapatillas')

In [18]:
#Y ahora le damos a enter
cuadro_busqueda.submit()

In [38]:
#MODO NINJA ACTIVADO
cuadro_busqueda = driver.find_element(By.XPATH, '//*[@id="twotabsearchtextbox"]')

#Queremos escribir juguetes lego, pero vamos a hacerlo letra a letra como lo haría un humano
time.sleep(1)

#Borramos la busqueda anterior:
cuadro_busqueda.clear()
time.sleep(2)
#Y ahora vamos a escribir letra a letra:
termino_busqueda = 'juguetes lego'
for letra in termino_busqueda:
    cuadro_busqueda.send_keys(letra)
    time.sleep(random.uniform(0.1,0.25))
cuadro_busqueda.submit()

### Como usar nuestras contraseñas sin mostrarlas por pantalla

Vamos a hacer uso de la librería *dotenv* (punto env) de Python.

Guardaremos nuestras contraseñas en un archivo `.env` y las cargaremos en nuestro script.

In [165]:
from dotenv import load_dotenv #load_dotenv busca un archivo .env y carga las variables de entorno

In [166]:
#Cargamos el fichero .env
load_dotenv() #True si lo encuentra , False si no
import os

Creamos el fichero `.env` en la raíz de nuestro proyecto y vamos añadiendo todos nuestros secretos, contraseñas, usuarios, nombres de máquinas, hosts...etc que queremos que estén ocultos

```bash

user='mi_usuario'
password='mi_contraseña'
.
.
.
...(más datos)

```

In [169]:
#Puedo ir accediendo a mis datos y guardarlos en variables

usuario = os.getenv('user')
password = os.getenv('password')

In [172]:
usuario,password

('Victor', '123456')

In [108]:
#Sacamos listado de los productos de la página:
productos = driver.find_elements(By.CLASS_NAME, 'a-section.a-spacing-base')
productos.__len__()

75

In [40]:
#Le pasamos el listado de productos a Bs4
from bs4 import BeautifulSoup as bs
soup = bs(driver.page_source, 'html.parser')
productos = soup.find_all('div', class_='a-section a-spacing-base')
#Printeamos la lista de productos:
for producto in productos:
    print(producto.text)

Opción Amazonpara "juguetes lego"  LEGO Marvel Persecución en Moto: Spider-Man vs. Doc Ock, Juguete de Construcción con Cañones y Aracnoblásteres, Moto de Spidey, Regalo para Niños, Niñas y Fans de Superhéroes de 6 Años o Más 76275  4,6 de 5 estrellas 865  500+ comprados el mes pasado9,99 €9,99€Ahorra 5 % al comprar 4 de esta selecciónEntrega GRATIS el sáb, 28 de sept en tu primer pedidoEntrega más rápida el jue, 26 de sept Vendido por: AmazonMás opciones de compra8,42 €(49 ofertas usadas y nuevas)Edades: 6 años y más
LEGO Creator 3 en 1 Dragón Rojo de Juguete Convertible en Figura de Pez o Ave Fénix, Juego Infantil de Animales como Regalo para Niños y Niñas de 6 Años o Más de Temática de Año Nuevo Chino 31145  4,8 de 5 estrellas 1.211  500+ comprados el mes pasado9,99 €9,99€Ahorra 5 % al comprar 4 de esta selecciónEntrega GRATIS el sáb, 28 de sept en tu primer pedidoEntrega más rápida el jue, 26 de sept Vendido por: AmazonMás opciones de compra8,80 €(58 nuevas ofertas)Edades: 6 años y

In [41]:
productos[60].text.split('\n')

['LEGO Ninjago Ataque Rising Dragon de NYA Articulado de Juguete, Juego de Construcción con Figura de Acción y Minifigura Ninja con Mini Catana, Regalo para Niños y Niñas de 6 Años o Más 71802  4,8 de 5 estrellas 325  50+ comprados el mes pasado7,49\xa0€7,49€ PVPR: 9,99\xa0€9,99€Entrega GRATIS el sáb, 28 de sept en tu primer pedidoEntrega más rápida mañana, 25 de sept Vendido por: AmazonEdades: 6 años y más']

In [43]:
print(productos[0].prettify())

<div class="a-section a-spacing-base">
 <div class="a-section a-spacing-none puis-status-badge-container aok-relative s-grid-status-badge-container puis-expand-height">
  <span aria-label="Opción Amazon">
   <a class="a-link-normal s-underline-text s-underline-link-text s-link-style" href="/LEGO-Marvel-Persecuci%C3%B3n-Moto-Aracnobl%C3%A1steres/dp/B0CFW36SSM/ref=ice_ac_b_dpb?__mk_es_ES=%C3%85M%C3%85%C5%BD%C3%95%C3%91&amp;crid=3S067YZQN1TJ5&amp;dib=eyJ2IjoiMSJ9.zhUrcY5uBDTMszKHOqW27zpnv3d8OrW57yCX5RNhIgygGTchnQbeVxuQhGZk_7oF2VdC1r4Y5d3D5VuC1jGMYtwSosk6_DFyt6q03dBF5OxdU_g3ukVERk-V4sMAFa3_mkO5DwRzIopNSVzZ5LngP6qI2quLxsh-IhG-gabPGKpNcckIig3VllVKypIyWF1OZILx1HKtjhab9RyP_Wkdypi7RFcuk9e5k5GJRtcRAENMxLCmR1DgY2zP5UeAQOGSxOIEBa1J2BywdGJ1DIPK1GNWuTYHjF3zZ8ULR4MFJfQ.bXu85brkA3kq8wycorsrIr-0QwCA0yUNt5kS48xDvnI&amp;dib_tag=se&amp;keywords=juguetes+lego&amp;qid=1727196297&amp;sprefix=juguetes+lego%2Caps%2C108&amp;sr=8-1">
    <span class="rush-component" data-component-id="17" data-component-props='{

In [77]:
producto = productos[0]

#Link del producto:
prefijo_url = 'https://www.amazon.es'
link_parcial = producto.find('a',{'class':'a-link-normal s-underline-text s-underline-link-text s-link-style a-text-normal'}).attrs['href']
link_producto = prefijo_url+link_parcial

#Nombre producto
nombre = producto.find('span', {'class':'a-size-base-plus a-color-base a-text-normal'}).text

#Precio
precio = float(producto.find('span', {'class':'a-offscreen'}).text.split('\xa0')[0].replace(',','.'))

#Estrellas
valoracion = float(producto.find('span', {'class':'a-icon-alt'}).text.split(' ')[0].replace(',','.'))


In [103]:
import pandas as pd
info_productos = []
for i, producto in enumerate(productos):
    print(i)
    dicc_prod = {}
    #Link del producto:
    prefijo_url = 'https://www.amazon.es'
    link_parcial = producto.find('a',{'class':'a-link-normal s-underline-text s-underline-link-text s-link-style a-text-normal'}).attrs['href']
    link_producto = prefijo_url+link_parcial
    dicc_prod['link_producto'] = link_producto
    #Nombre producto
    nombre = producto.find('span', {'class':'a-size-base-plus a-color-base a-text-normal'}).text
    dicc_prod['nombre'] = nombre
    #Precio
    try:
        etiqueta = producto.find(('span', {'class':'a-offscreen'}))
        #for e in etiquetas:
        if '€' in e.text:
            precio = float(etiqueta.text.split('\xa0')[0].replace(',','.'))
            dicc_prod['precio'] = precio

    except:
        etiquetas = producto.find_all(('span', {'class':'a-color-base'}))
        for e in etiquetas:
            if '€' in e.text:
                precio = float(e.text.split('\xa0')[0].replace(',','.').replace('€',''))
                dicc_prod['precio'] = precio
            
    #Estrellas
    valoracion = float(producto.find('span', {'class':'a-icon-alt'}).text.split(' ')[0].replace(',','.'))
    dicc_prod['valoracion'] = valoracion

    info_productos.append(dicc_prod)
df_prod = pd.DataFrame(info_productos)
df_prod

0


ValueError: could not convert string to float: ''

In [104]:
producto

<div class="a-section a-spacing-base"><div class="a-section a-spacing-none puis-status-badge-container aok-relative s-grid-status-badge-container puis-expand-height"><span aria-label="Opción Amazon"><a class="a-link-normal s-underline-text s-underline-link-text s-link-style" href="/LEGO-Marvel-Persecuci%C3%B3n-Moto-Aracnobl%C3%A1steres/dp/B0CFW36SSM/ref=ice_ac_b_dpb?__mk_es_ES=%C3%85M%C3%85%C5%BD%C3%95%C3%91&amp;crid=3S067YZQN1TJ5&amp;dib=eyJ2IjoiMSJ9.zhUrcY5uBDTMszKHOqW27zpnv3d8OrW57yCX5RNhIgygGTchnQbeVxuQhGZk_7oF2VdC1r4Y5d3D5VuC1jGMYtwSosk6_DFyt6q03dBF5OxdU_g3ukVERk-V4sMAFa3_mkO5DwRzIopNSVzZ5LngP6qI2quLxsh-IhG-gabPGKpNcckIig3VllVKypIyWF1OZILx1HKtjhab9RyP_Wkdypi7RFcuk9e5k5GJRtcRAENMxLCmR1DgY2zP5UeAQOGSxOIEBa1J2BywdGJ1DIPK1GNWuTYHjF3zZ8ULR4MFJfQ.bXu85brkA3kq8wycorsrIr-0QwCA0yUNt5kS48xDvnI&amp;dib_tag=se&amp;keywords=juguetes+lego&amp;qid=1727196297&amp;sprefix=juguetes+lego%2Caps%2C108&amp;sr=8-1"><span class="rush-component" data-component-id="17" data-component-props='{"asin":"B0CFW3

In [106]:
etiquetas = producto.find_all(('span', {'class':'a-color-base'}))
for e in etiquetas:
    if '€' in e.text:
        print(e.text)

9,99 €9,99€
9,99 €
9,99€
€
8,42 €


In [105]:
print(producto.prettify())

<div class="a-section a-spacing-base">
 <div class="a-section a-spacing-none puis-status-badge-container aok-relative s-grid-status-badge-container puis-expand-height">
  <span aria-label="Opción Amazon">
   <a class="a-link-normal s-underline-text s-underline-link-text s-link-style" href="/LEGO-Marvel-Persecuci%C3%B3n-Moto-Aracnobl%C3%A1steres/dp/B0CFW36SSM/ref=ice_ac_b_dpb?__mk_es_ES=%C3%85M%C3%85%C5%BD%C3%95%C3%91&amp;crid=3S067YZQN1TJ5&amp;dib=eyJ2IjoiMSJ9.zhUrcY5uBDTMszKHOqW27zpnv3d8OrW57yCX5RNhIgygGTchnQbeVxuQhGZk_7oF2VdC1r4Y5d3D5VuC1jGMYtwSosk6_DFyt6q03dBF5OxdU_g3ukVERk-V4sMAFa3_mkO5DwRzIopNSVzZ5LngP6qI2quLxsh-IhG-gabPGKpNcckIig3VllVKypIyWF1OZILx1HKtjhab9RyP_Wkdypi7RFcuk9e5k5GJRtcRAENMxLCmR1DgY2zP5UeAQOGSxOIEBa1J2BywdGJ1DIPK1GNWuTYHjF3zZ8ULR4MFJfQ.bXu85brkA3kq8wycorsrIr-0QwCA0yUNt5kS48xDvnI&amp;dib_tag=se&amp;keywords=juguetes+lego&amp;qid=1727196297&amp;sprefix=juguetes+lego%2Caps%2C108&amp;sr=8-1">
    <span class="rush-component" data-component-id="17" data-component-props='{

In [111]:
#Vamos a sacar el nombre del producto, el precio , el link y las estrellas

for i,producto in enumerate(productos):
    try:
       nombre = producto.find_element(By.CLASS_NAME, 'a-size-base-plus').text
    except: # Exception as e:
        nombre = (f"El producto[{i}] sin nombre")#-->error: {e}
        print(nombre)

    try:
        precio = producto.find_element(By.CLASS_NAME, 'a-price-whole').text
    except:
        precio = (f"El producto[{i}] sin precio")
        print(precio)
    try:
        link = producto.find_element(By.CLASS_NAME, 'a-link-normal.a-text-normal').get_attribute('href')
    except:
        link = (f"El producto[{i}] sin link")
        print(link)
    #print(nombre, precio, link)

El producto[57] sin precio
El producto[62] sin precio
El producto[68] sin nombre
El producto[68] sin precio
El producto[68] sin link
El producto[69] sin nombre
El producto[69] sin precio
El producto[69] sin link
El producto[70] sin nombre
El producto[70] sin precio
El producto[70] sin link
El producto[71] sin nombre
El producto[71] sin precio
El producto[71] sin link
El producto[72] sin nombre
El producto[72] sin precio
El producto[72] sin link
El producto[73] sin nombre
El producto[73] sin precio
El producto[73] sin link
El producto[74] sin nombre
El producto[74] sin precio
El producto[74] sin link


In [124]:
productos[57].get_attribute('innerHTML')

'<div class="s-product-image-container aok-relative s-text-center s-image-overlay-grey puis-image-overlay-grey s-padding-left-small s-padding-right-small puis-spacing-small s-height-equalized puis puis-v2fl5pkubaqu126k6zseo6li6q" data-cy="image-container" style="padding-top: 0px !important;"><span data-component-type="s-product-image" class="rush-component" data-version-id="v2fl5pkubaqu126k6zseo6li6q" data-render-id="r3r41o9six00we2aqjmhxqinn9v"><a class="a-link-normal s-no-outline" tabindex="-1" href="/LEGO-Super-Mario-Expansi%C3%B3n-Coleccionable/dp/B0CFVYJRZX/ref=sr_1_50?__mk_es_ES=%C3%85M%C3%85%C5%BD%C3%95%C3%91&amp;crid=3S067YZQN1TJ5&amp;dib=eyJ2IjoiMSJ9.zhUrcY5uBDTMszKHOqW27zpnv3d8OrW57yCX5RNhIgygGTchnQbeVxuQhGZk_7oF2VdC1r4Y5d3D5VuC1jGMYtwSosk6_DFyt6q03dBF5OxdU_g3ukVERk-V4sMAFa3_mkO5DwRzIopNSVzZ5LngP6qI2quLxsh-IhG-gabPGKpNcckIig3VllVKypIyWF1OZILx1HKtjhab9RyP_Wkdypi7RFcuk9e5k5GJRtcRAENMxLCmR1DgY2zP5UeAQOGSxOIEBa1J2BywdGJ1DIPK1GNWuTYHjF3zZ8ULR4MFJfQ.bXu85brkA3kq8wycorsrIr-0QwCA0yUN

In [125]:
driver.quit()

# MARCA

Esperas hasta que un botón sea clickable.

In [134]:
url = 'https://www.marca.com/'
driver = webdriver.Chrome(options=opciones)
driver.get(url)
#Cookies
cookies = driver.find_element(By.XPATH,'//*[@id="ue-accept-notice-button"]')
cookies.click()
#Enlace Radio
radio = driver.find_element(By.XPATH,'/html/body/header/div[1]/div/div[2]/ul/li[2]/a/strong')
radio.click()
#Play
play = driver.find_element(By.XPATH, '//*[@id="player-plugin"]/section/div/div/div[2]/div[1]/div[3]/div[1]/button[2]')
play.click()

In [None]:
driver.quit()

In [137]:
url = 'https://www.marca.com/'
driver = webdriver.Chrome(options=opciones)
driver.get(url)

#Esperar hasta que el botón esté disponible
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.ID, 'ue-accept-notice-button'))).click()
#Boton de la radio (X)
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.XPATH,'/html/body/header/div[1]/div/div[2]/ul/li[2]/a/strong'))).click()
#Boton acceder a la radio
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.XPATH, '//*[@id="player-plugin"]/section/div/div/div[2]/div[1]/div[3]/div[1]/button[2]'))).click()

In [138]:
driver.quit()