## DIA 068: Creación de un Web Scraper con BeautifulSoup y Pandas

Hoy aprenderemos a realizar web scraping con BeautifulSoup para extraer información estructurada de una página web y almacenarla en Pandas para su análisis.

✅ ¿Qué aprenderemos?

📌 Usar BeautifulSoup para analizar HTML.
📌 Extraer información estructurada (títulos, precios, etc.).
📌 Almacenar los datos en Pandas y exportarlos a CSV.
✅ Ejemplo práctico:
Extraeremos datos de productos desde un sitio web de ejemplo.

🛠️ 1. Instalación de Paquetes Necesarios
Ejecutar en la terminal:

sh
Copiar
Editar
pip install requests beautifulsoup4 pandas
📌 requests permite descargar contenido de páginas web.
📌 beautifulsoup4 permite analizar y extraer datos de HTML.
📌 pandas se usa para organizar los datos en tablas.

🖥️ 2. Código Completo (scraper_bs4.py)
python
Copiar
Editar
import requests
from bs4 import BeautifulSoup
import pandas as pd

# ---------------------------
# 1. Configurar la URL y descargar contenido
# ---------------------------
URL = "https://webscraper.io/test-sites/e-commerce/allinone/computers/laptops"
headers = {"User-Agent": "Mozilla/5.0"}

response = requests.get(URL, headers=headers)

if response.status_code == 200:
    print("✅ Conexión exitosa")
else:
    print("❌ Error al acceder a la página")

# ---------------------------
# 2. Analizar el contenido con BeautifulSoup
# ---------------------------
soup = BeautifulSoup(response.text, "html.parser")

# ---------------------------
# 3. Extraer datos de los productos
# ---------------------------
productos = soup.find_all("div", class_="thumbnail")

data = []
for producto in productos:
    titulo = producto.find("a", class_="title").text.strip()
    precio = producto.find("h4", class_="price").text.strip()
    descripcion = producto.find("p", class_="description").text.strip()
    
    data.append({"Título": titulo, "Precio": precio, "Descripción": descripcion})

# ---------------------------
# 4. Almacenar datos en un DataFrame
# ---------------------------
df = pd.DataFrame(data)

# ---------------------------
# 5. Guardar en un archivo CSV
# ---------------------------
df.to_csv("productos_scraper.csv", index=False)
print("✅ Datos guardados en 'productos_scraper.csv'")

# ---------------------------
# 6. Mostrar los primeros registros
# ---------------------------
print(df.head())
🚀 Cómo Ejecutar el Web Scraper
Ejecutar en la terminal:

sh
Copiar
Editar
python scraper_bs4.py
📌 Salida esperada:
✅ Conexión exitosa
✅ Datos guardados en productos_scraper.csv

📜 Ejemplo de contenido del CSV:

cs
Copiar
Editar
Título,Precio,Descripción
"Laptop HP 15","$499.99","Laptop potente con procesador Intel i5..."
"Dell XPS 13","$899.99","Ultrabook con pantalla táctil y SSD de 512GB..."
...
🔍 Explicación de las Principales Implementaciones
🔹 📂 Descarga de contenido con requests

requests.get(URL, headers=headers) obtiene el HTML de la página.
🔹 🌍 Uso de BeautifulSoup para extraer datos

soup.find_all("div", class_="thumbnail") obtiene la lista de productos.
producto.find("a", class_="title").text.strip() extrae el título del producto.
🔹 💾 Almacenar datos en un CSV con Pandas

pd.DataFrame(data).to_csv("productos_scraper.csv", index=False) guarda los datos extraídos.