# Ejercicios
Escribe un script en Python utilizando Selenium que realice las siguientes tareas en la página web del Decathlon:

1. Abra una el navegador y maximice la ventana.

2. Acceda al sitio web de Decathlon en la URL "https://www.decathlon.es/".

3. Haga clic en el botón "Aceptar" en la notificación de cookies utilizando su selector CSS.

4. Solicite al usuario que ingrese una búsqueda (por ejemplo, un producto deportivo) mediante una entrada de texto.

5. Utilice el texto ingresado para buscar productos en el sitio web de Decathlon y presione la tecla "Enter" para iniciar la búsqueda.

6. Inicialice un diccionario llamado `diccionario_resultados` con tres listas vacías: "nombre", "precio" y "puntuación".

7. Itere sobre los primeros 5 resultados de la búsqueda y realice las siguientes acciones:

    a. Haga clic en un resultado específico.
    b. Recopile el nombre del producto, el precio y la puntuación del producto y almacénelos en las listas correspondientes en el diccionario `diccionario_resultados`.

    c. Navegue de regreso a los resultados de búsqueda.

8. Cierre el navegador Chrome.

El resultado final debería ser un diccionario con información sobre los primeros 5 productos encontrados durante la búsqueda en el sitio web de Decathlon, incluyendo el nombre del producto, el precio y la puntuación. Muestralo en un DataFrame similar al ves a continuación: 

| nombre                                             | precio    | puntuacion |
|----------------------------------------------------|-----------|------------|
| Camiseta Real Madrid Local Adulto Temporada 23/24  | 99,99 €   | 5/5        |
| Camiseta térmica interior de esquí y nieve Muj... | 6,99 €    | 4.7/5      |
| Camiseta running térmica transpirable Mujer Ki... | 19,99 €   | 4.8/5      |
| Camiseta térmica running Mujer negra              | 14,99 €   | 4.7/5      |
| Camiseta de fútbol Adulto Kipsta F100 roja         | 5,99 €    | 4.5/5      |


**1. Importar librerias** 

In [70]:
# Importar librerías para tratamiento de datos
# -----------------------------------------------------------------------
import pandas as pd  # Pandas es una poderosa librería para manipulación y análisis de datos en Python.

# Importar librerías para web scraping y manipulación de datos
# -----------------------------------------------------------------------
from bs4 import BeautifulSoup
import requests

# Importar librerías para automatización de navegadores web con Selenium
# -----------------------------------------------------------------------
from selenium import webdriver  # Selenium es una herramienta para automatizar la interacción con navegadores web.
from webdriver_manager.chrome import ChromeDriverManager  # ChromeDriverManager gestiona la instalación del controlador de Chrome.
from selenium.webdriver.common.keys import Keys  # Keys es útil para simular eventos de teclado en Selenium.
from selenium.webdriver.support.ui import Select  # Select se utiliza para interactuar con elementos <select> en páginas web.

# Importar librerías para pausar la ejecución
# -----------------------------------------------------------------------
from time import sleep  # Sleep se utiliza para pausar la ejecución del programa por un número de segundos.

# Configuraciones
# -----------------------------------------------------------------------
pd.set_option('display.max_columns', None)  # Establece una opción de Pandas para mostrar todas las columnas de un DataFrame.


Ejercicio 
1. Abra una el navegador y maximice la ventana.

2. Acceda al sitio web de Decathlon en la URL "https://www.decathlon.es/".

3. Haga clic en el botón "Aceptar" en la notificación de cookies utilizando su selector CSS.

4. Solicite al usuario que ingrese una búsqueda (por ejemplo, un producto deportivo) mediante una entrada de texto.

5. Utilice el texto ingresado para buscar productos en el sitio web de Decathlon y presione la tecla "Enter" para iniciar la búsqueda.

In [71]:
# Inicializa el navegador Chrome
driver = webdriver.Chrome()

# Navega a la página web "https://www.decathlon.es/"
driver.get("https://www.decathlon.es")

#Maximiza la página
driver.maximize_window()

sleep(3)
# Acepta las cookies haciendo clic en el elemento con el selector CSS "#didomi-notice-agree-button"
driver.find_element("css selector", "#didomi-notice-agree-button").click()

# Realizar un scroll hacia abajo en la página web utilizando execute_script
# En este caso, el scroll desplazará la página hasta que el eje vertical tenga un valor de 1000 píxeles
#driver.execute_script("window.scrollTo(0,1000)") 

sleep(3)

# Solicitud all usuario de búsqueda de un producto deportivo

busqueda_usuario= str(input('Escribe el elemento que quieres buscar'))

#Busqueda del producto en la página web

driver.find_element("css selector", "#search-bar > div > form > div > input").send_keys({busqueda_usuario},Keys.ENTER)
# Otra opcion
# driver.find_element("css selector", "#search-bar > div > form > div > input= {busqueda_usuario}).click()

sleep(5)

# Realizar un scroll hacia abajo en la página web utilizando execute_script
# En este caso, el scroll desplazará la página hasta que el eje vertical tenga un valor de 1000 píxeles
#driver.execute_script("window.scrollTo(0,1000)") 


#Lista vacia para agregara URL_productos

lista_url_productos=[]

 
#Iteramos para seleccionar solo algunos productos

for producto  in range(1,6):
    lista_url_productos.append(driver.find_element("xpath", f'//*[@id="app"]/main/div[2]/section[2]/div/div[{producto}]/div[3]/a[1]').get_attribute("href"))

driver.close()

KeyboardInterrupt: 

In [None]:

diccionario_resultados1 = {'nombre':[],'precio':[] ,'puntuacion':[]}

for i in range(1,5):
    driver.find_element("css selector", f"#app > main > div.list-body.svelte-duar7s > section.listing-section.svelte-duar7s > div > div:nth-child({i})> div.product-block-top-main.vtmn-relative.vtmn-flex.vtmn-flex-col.vtmn-w-full.vtmn-items-start").click()
    
    driver.find_element( "css selector",f"#app > main > div.list-body.svelte-duar7s > section.listing-section.svelte-duar7s > div > div:nth-child({i}) > div.product-block-top-main.vtmn-relative.vtmn-flex.vtmn-flex-col.vtmn-w-full.vtmn-items-start > div.dpb-models.vtmn-relative.vtmn-self-center.svelte-1ambt2m",).click()

    #Nombre de producto
    nombre_acrticulo = driver.find_element("css selector", "#app > main > article > div.vtmn-relative.vtmn-z-\[2\] > section > h1").text
    diccionario_resultados1["nombre"].append(nombre_acrticulo)
    

Xpath
//*[@id="app"]/main/div[2]/section[2]/div/div[1]/div[3]/a[1]
//*[@id="app"]/main/div[2]/section[2]/div/div[3]/div[3]/a[1]

//*[@id="app"]/main/div[2]/section[2]/div/div[8]/div[3]/a[1]

In [None]:
lista_url_productos

['https://www.decathlon.es/es/p/sudadera-fitness-soft-training-adidas-mujer-negro/_/R-p-X8833281',
 'https://www.decathlon.es/es/p/sudadera-capucha-fitness-mujer-500-essential-verde-azulado/_/R-p-333059',
 'https://www.decathlon.es/es/p/sudadera-fitness-con-cuello-redondo-de-mujer-domyos-100-rosa/_/R-p-310546',
 'https://www.decathlon.es/es/p/sudadera-mujer-no-dye/_/R-p-351137',
 'https://www.decathlon.es/es/p/sudadera-fitness-500-essential-mujer-verde-menta-fresca-cremallera-capucha/_/R-p-338820']

6. Inicialice un diccionario llamado `diccionario_resultados` con tres listas vacías: "nombre", "precio" y "puntuación".

7. Itere sobre los primeros 5 resultados de la búsqueda y realice las siguientes acciones:

    a. Haga clic en un resultado específico.
    b. Recopile el nombre del producto, el precio y la puntuación del producto y almacénelos en las listas correspondientes en el diccionario `diccionario_resultados`.

    c. Navegue de regreso a los resultados de búsqueda.

8. Cierre el navegador Chrome.

In [78]:


diccionario_resultados = {'nombre':[],'precio':[] ,'puntuacion':[]}
# Iteramos por la lista URL
for url in lista_url_productos:

    # Solicitud GET a la URL con User-Agent
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }
    res_tienda = requests.get(url, headers=headers)

    # Verifica si la solicitud fue exitosa
    print(res_tienda.status_code)

    # Crear un objeto BeautifulSoup para analizar el contenido HTML de la página.
    sopa_tienda = BeautifulSoup(res_tienda.content, "html.parser")

    # Extraer el nombre del producto usando solo la clase principal
    nombre = sopa_tienda.find("h1", class_="product-name")
    if nombre is not None:
        diccionario_resultados["nombre"].append(nombre.text.strip())
    else:
        diccionario_resultados["nombre"].append("N/A")

    # Extraer el precio
    precio = sopa_tienda.find("span", class_="vtmn-price vtmn-price_size--large vtmn-price_variant--accent")
    if precio is not None:
        diccionario_resultados["precio"].append(precio.text.strip())
    else:
        diccionario_resultados["precio"].append("N/A")

    # Extraer la puntuación
  # Extraer la puntuación usando selectores CSS
    puntuacion_div = sopa_tienda.find('css selector',"#reviews-floor > div > div.review-sidebar.vtmn-flex.vtmn-flex-col.vtmn-text-center.vtmn-mb-4.svelte-1tgfbu7 > h3 > span")
    if puntuacion_div is not None:
        diccionario_resultados["puntuacion"].append(puntuacion_div.text.strip())
    else:
        diccionario_resultados["puntuacion"].append("N/A")


200


AttributeError: 'str' object has no attribute 'get_attribute'

In [76]:
diccionario_resultados

{'nombre': ['Sudadera Fitness Soft Training Adidas Mujer Negro',
  'Sudadera fitness con capucha Mujer Domyos 500 sepia',
  'Sudadera fitness con cuello redondo de Mujer Domyos 100 rosa',
  'Sudadera Mujer No Dye',
  'Sudadera Cremallera Fitness Mujer 500 Essential Gris Pizarra'],
 'precio': ['28,99\xa0€', '8,99\xa0€', '9,99\xa0€', '9,99\xa0€', '14,99\xa0€'],
 'puntuacion': ['N/A', 'N/A', 'N/A', 'N/A', 'N/A']}

In [None]:
# convertir el diccionario a DataFrame
df_busqueda = pd.DataFrame(diccionario_resultados)
df_busqueda

Unnamed: 0,nombre,precio,puntuacion
0,Sudadera Fitness Soft Training Adidas Mujer Negro,"28,99 €",
1,Sudadera fitness con capucha Mujer Domyos 500 ...,"8,99 €",
2,Sudadera fitness con cuello redondo de Mujer D...,"9,99 €",
3,Sudadera Mujer No Dye,"9,99 €",
4,Sudadera Cremallera Fitness Mujer 500 Essentia...,"14,99 €",
