## DIA 064: Creación de un Web Scraper Avanzado con Selenium

Hoy aprenderemos a realizar web scraping avanzado con Selenium para automatizar la extracción de datos de sitios web dinámicos.

✅ ¿Qué aprenderemos?

📌 Usar Selenium WebDriver para interactuar con páginas web.
📌 Extraer datos de sitios dinámicos con JavaScript.
📌 Guardar la información en un archivo CSV.
✅ Ejemplo práctico:
Scrapearemos los títulos y precios de productos en una tienda en línea.

🛠️ 1. Instalación de Paquetes Necesarios
Ejecutar en la terminal:

sh
Copiar
Editar
pip install selenium pandas
📌 Descargar WebDriver:
Para usar Selenium, necesitas un WebDriver compatible con tu navegador.

Chrome: Descargar ChromeDriver
Firefox: Descargar GeckoDriver
📌 Coloca el WebDriver en la misma carpeta del script o configura el PATH.

🖥️ 2. Código Completo (scraper_selenium.py)
python
Copiar
Editar
import time
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

# ---------------------------
# 1. Configurar Selenium
# ---------------------------
options = webdriver.ChromeOptions()
options.add_argument("--headless")  # Ejecutar en segundo plano
options.add_argument("--no-sandbox")
options.add_argument("--disable-dev-shm-usage")

# Iniciar WebDriver
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=options)

# ---------------------------
# 2. Acceder a la Página Web
# ---------------------------
URL = "https://webscraper.io/test-sites/e-commerce/allinone/computers/laptops"
driver.get(URL)
time.sleep(3)  # Esperar a que cargue la página

# ---------------------------
# 3. Extraer Datos de la Página
# ---------------------------
productos = driver.find_elements(By.CLASS_NAME, "thumbnail")

data = []
for producto in productos:
    titulo = producto.find_element(By.CLASS_NAME, "title").text
    precio = producto.find_element(By.CLASS_NAME, "price").text
    data.append({"Título": titulo, "Precio": precio})

# ---------------------------
# 4. Guardar Datos en un CSV
# ---------------------------
df = pd.DataFrame(data)
df.to_csv("productos.csv", index=False)

print("✅ Datos guardados en productos.csv")

# ---------------------------
# 5. Cerrar el Navegador
# ---------------------------
driver.quit()
🚀 Cómo Ejecutar el Web Scraper
Ejecutar en la terminal:

sh
Copiar
Editar
python scraper_selenium.py
📌 Salida esperada:
✅ Datos guardados en productos.csv

📜 Ejemplo de contenido del CSV:

csv
Copiar
Editar
Título,Precio
"Laptop HP 15","$499.99"
"Dell XPS 13","$899.99"
...
🔍 Explicación de las Principales Implementaciones
🔹 📂 Uso de webdriver.Chrome() con opciones avanzadas

options.add_argument("--headless") ejecuta Selenium sin abrir el navegador.
🔹 🌍 Navegación y Esperas

driver.get(URL) abre la página web.
time.sleep(3) espera 3 segundos para que cargue el contenido.
🔹 📜 Extraer Datos con find_elements()

By.CLASS_NAME, "title" obtiene el título del producto.
By.CLASS_NAME, "price" extrae el precio.
🔹 💾 Guardado de Datos en CSV

df.to_csv("productos.csv", index=False) almacena la información en un archivo.
