# EJERCICIOS Selenium

Escribe un script en Python utilizando Selenium que realice las siguientes tareas en la página web del Decathlon:

1. Abra una el navegador y maximice la ventana.

2. Acceda al sitio web de Decathlon en la URL "https://www.decathlon.es/".

3. Haga clic en el botón "Aceptar" en la notificación de cookies utilizando su selector CSS.

4. Solicite al usuario que ingrese una búsqueda (por ejemplo, un producto deportivo) mediante una entrada de texto.

5. Utilice el texto ingresado para buscar productos en el sitio web de Decathlon y presione la tecla "Enter" para iniciar la búsqueda.

6. Inicialice un diccionario llamado `diccionario_resultados` con tres listas vacías: "nombre", "precio" y "puntuación".

7. Itere sobre los primeros 5 resultados de la búsqueda y realice las siguientes acciones:

    a. Haga clic en un resultado específico.
    b. Recopile el nombre del producto, el precio y la puntuación del producto y almacénelos en las listas correspondientes en el diccionario `diccionario_resultados`.

    c. Navegue de regreso a los resultados de búsqueda.

8. Cierre el navegador Chrome.

El resultado final debería ser un diccionario con información sobre los primeros 5 productos encontrados durante la búsqueda en el sitio web de Decathlon, incluyendo el nombre del producto, el precio y la puntuación. Muestralo en un DataFrame similar al ves a continuación: 

| nombre                                             | precio    | puntuacion |
|----------------------------------------------------|-----------|------------|
| Camiseta Real Madrid Local Adulto Temporada 23/24  | 99,99 €   | 5/5        |
| Camiseta térmica interior de esquí y nieve Muj... | 6,99 €    | 4.7/5      |
| Camiseta running térmica transpirable Mujer Ki... | 19,99 €   | 4.8/5      |
| Camiseta térmica running Mujer negra              | 14,99 €   | 4.7/5      |
| Camiseta de fútbol Adulto Kipsta F100 roja         | 5,99 €    | 4.5/5      |


In [1]:
# Importar librerías para tratamiento de datos
# -----------------------------------------------------------------------
import pandas as pd  # Pandas es una poderosa librería para manipulación y análisis de datos en Python.

# Importar librerías para web scraping y manipulación de datos
# -----------------------------------------------------------------------
from bs4 import BeautifulSoup
import requests

# Importar librerías para automatización de navegadores web con Selenium
# -----------------------------------------------------------------------
from selenium import webdriver  # Selenium es una herramienta para automatizar la interacción con navegadores web.
from webdriver_manager.chrome import ChromeDriverManager  # ChromeDriverManager gestiona la instalación del controlador de Chrome.
from selenium.webdriver.common.keys import Keys  # Keys es útil para simular eventos de teclado en Selenium.
from selenium.webdriver.support.ui import Select  # Select se utiliza para interactuar con elementos <select> en páginas web.

# Importar librerías para pausar la ejecución
# -----------------------------------------------------------------------
from time import sleep  # Sleep se utiliza para pausar la ejecución del programa por un número de segundos.

# Configuraciones
# -----------------------------------------------------------------------
pd.set_option('display.max_columns', None)  # Establece una opción de Pandas para mostrar todas las columnas de un DataFrame.

In [14]:
def buscar_productos_decathlon():
    """
    Realiza una búsqueda de productos en el sitio web de Decathlon y recopila información sobre los primeros 5 resultados.

    Returns:
    dict: Un diccionario con información sobre los productos encontrados, incluyendo nombres, precios y puntuaciones.
    """
    
    # Inicializar el controlador de Chrome
    driver = webdriver.Chrome()

    # Maximizar la ventana del navegador
    driver.maximize_window()

    # Acceder al sitio web de Decathlon
    driver.get("https://www.decathlon.es/")

    # Esperar 3 segundos para cargar la página
    sleep(3)

    # Hacer clic en el botón de aceptar las cookies utilizando su selector CSS
    driver.find_element("css selector", "#didomi-notice-agree-button").click()

    # Solicitar al usuario que ingrese qué producto desea buscar
    eleccion_usuario = input("¿Qué quieres buscar?")

    # Esperar 2 segundos para dar tiempo al usuario a ingresar su elección
    sleep(2)

    # Utilizar la entrada de texto para buscar productos y presionar la tecla "Enter"
    driver.find_element("css selector", "#search-bar > div > form > div > input").send_keys(eleccion_usuario, Keys.ENTER)

    # Esperar 2 segundos para que se muestren los resultados de la búsqueda
    sleep(2)

    # Inicializar un diccionario para almacenar los resultados
    diccionario_resultados = {"nombre": [], "precio": [], "puntuacion": []}
    
    # Iterar sobre los primeros 5 resultados de búsqueda
    for i in range(1, 5):
        
        # Hacer clic en un resultado específico
        
        driver.find_element("css selector", f"#app > main > div.list-body.svelte-duar7s > section.listing-section.svelte-duar7s > div > div:nth-child({i}) > div.product-block-top-main.vtmn-relative.vtmn-flex.vtmn-flex-col.vtmn-w-full.vtmn-items-start > div.dpb-models.vtmn-relative.vtmn-self-center.svelte-1ambt2m > div > a > img").click()

        sleep(3)

        # Recopilar el nombre del producto
        nombre = driver.find_element("css selector", "#app > main > article > div.vtmn-relative.vtmn-z-\[2\] > section > h1").text
        diccionario_resultados["nombre"].append(nombre)

        # Recopilar el precio del producto
        precio = driver.find_element("css selector","#app > main > article > div.vtmn-relative.vtmn-z-\[2\] > section > div.price-presentation.vtmn-flex.vtmn-flex-col.vtmn-items-start.vtmn-leading-tight.vtmn-mt-2.svelte-1wujduz > div > div > div > span").text
        diccionario_resultados["precio"].append(precio)

        # Recopilar la puntuación del producto
        puntuacion = driver.find_element("xpath", '//*[@id="app"]/main/article/div[2]/section/div[2]/button/div[1]/span[6]').text
        diccionario_resultados["puntuacion"].append(puntuacion)

        sleep(3)
        
        # Navegar de regreso a los resultados de búsqueda
        driver.back()

    # Cerrar el navegador
    driver.close()

    # Retornar el diccionario con los resultados
    return diccionario_resultados

In [15]:
# Ejemplo de uso:
resultados = buscar_productos_decathlon()
resultados

{'nombre': ['Camiseta Fitness 100 Sportee Hombre Negra',
  'Camiseta fitness 500 essential Domyos Mujer azul índigo',
  'Camiseta fitness manga corta transpirable cuello redondo Hombre Domyos azul',
  'Camiseta Active Fitness Puma Hombre Negro Manga Corta Algodón'],
 'precio': ['4,99€', '5,99€', '5,99€', '13,99€'],
 'puntuacion': ['4.5/5', '4.6/5', '4.7/5', '4.8/5']}

In [16]:
# convertir a DataFrame
df_productos = pd.DataFrame(resultados)
df_productos

Unnamed: 0,nombre,precio,puntuacion
0,Camiseta Fitness 100 Sportee Hombre Negra,"4,99€",4.5/5
1,Camiseta fitness 500 essential Domyos Mujer az...,"5,99€",4.6/5
2,Camiseta fitness manga corta transpirable cuel...,"5,99€",4.7/5
3,Camiseta Active Fitness Puma Hombre Negro Mang...,"13,99€",4.8/5


In [17]:
driver = webdriver.Chrome()
driver.get("https://beta.adalab.es/online_supermarket/")
driver.maximize_window()
driver.find_element("css selector", "body > div.__variable_a6519f > div > div > button.CookieConsent_acceptButton__Mb_bR.CookieConsent_acceptAllButton__yhaaI").click()
sleep(3)
driver.find_element("css selector", ".HamburgerMenu_hamburgerMenu__fcrHL").click()
sleep(3)
link = driver.find_element("xpath", "/html/body/div/header/div/div[2]/ul/li[2]/a")
link.click()
sleep(5)
diccionario_fruta = {"nombres": [], "precios": []}
for i in range (1, 6):
                nombre = driver.find_element("css selector", f"body > main > div > div:nth-child({i}) > div.ProductCard_details__ElEDC > h3").text
                diccionario_fruta["nombres"].append(nombre)
                precio = driver.find_element("css selector", f"body > main > div > div:nth-child({i}) > div.ProductCard_details__ElEDC > p > span:nth-child(1)").text
                diccionario_fruta["precios"].append(precio)
diccionario_fruta


{'nombres': ['Manzanas Golden, bandeja 1 Kg aprox.',
  'Plátanos de Canarias, mano 1 Kg aprox.',
  'Tomates pera, bandeja 1 Kg aprox.',
  'Naranjas de mesa, malla 2 Kg aprox.',
  'Cebollas dulces, malla 1.5 Kg aprox.'],
 'precios': ['2.49 €', '2.89 €', '2.35 €', '3.49 €', '1.99 €']}

In [18]:
diccionario_fruta

{'nombres': ['Manzanas Golden, bandeja 1 Kg aprox.',
  'Plátanos de Canarias, mano 1 Kg aprox.',
  'Tomates pera, bandeja 1 Kg aprox.',
  'Naranjas de mesa, malla 2 Kg aprox.',
  'Cebollas dulces, malla 1.5 Kg aprox.'],
 'precios': ['2.49 €', '2.89 €', '2.35 €', '3.49 €', '1.99 €']}

In [19]:
df_frutas = pd.DataFrame(diccionario_fruta)
df_frutas

Unnamed: 0,nombres,precios
0,"Manzanas Golden, bandeja 1 Kg aprox.",2.49 €
1,"Plátanos de Canarias, mano 1 Kg aprox.",2.89 €
2,"Tomates pera, bandeja 1 Kg aprox.",2.35 €
3,"Naranjas de mesa, malla 2 Kg aprox.",3.49 €
4,"Cebollas dulces, malla 1.5 Kg aprox.",1.99 €
