## **Instalación de Dependencias**

In [1]:
# Instalar las librerías
!pip install requests beautifulsoup4 selenium scrapy webdriver-manager

Collecting selenium
  Obtaining dependency information for selenium from https://files.pythonhosted.org/packages/91/08/10cff8463b3510b78f9e3dcef6b37c542b06d71ed1240a8940ba0c75d3bc/selenium-4.26.1-py3-none-any.whl.metadata
  Downloading selenium-4.26.1-py3-none-any.whl.metadata (7.1 kB)
Collecting scrapy
  Obtaining dependency information for scrapy from https://files.pythonhosted.org/packages/e8/43/2cc828e9b7a453d791afbe3ef36c951f4641fc1d886b6d39e9455c5468e0/Scrapy-2.12.0-py2.py3-none-any.whl.metadata
  Downloading Scrapy-2.12.0-py2.py3-none-any.whl.metadata (5.3 kB)
Collecting webdriver-manager
  Obtaining dependency information for webdriver-manager from https://files.pythonhosted.org/packages/b5/b5/3bd0b038d80950ec13e6a2c8d03ed8354867dc60064b172f2f4ffac8afbe/webdriver_manager-4.0.2-py2.py3-none-any.whl.metadata
  Downloading webdriver_manager-4.0.2-py2.py3-none-any.whl.metadata (12 kB)
Collecting trio~=0.17 (from selenium)
  Obtaining dependency information for trio~=0.17 from https

## **Scraping con BeautifulSoup**

In [2]:
import requests
from bs4 import BeautifulSoup

# URL de la página de Mercado Libre
url = 'https://listado.mercadolibre.com.co/apple'

# Realizar la solicitud GET a la página
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'
}
response = requests.get(url, headers=headers)

# Verificar si la solicitud fue exitosa
if response.status_code == 200:
    # Parsear el contenido HTML con BeautifulSoup
    soup = BeautifulSoup(response.content, 'html.parser')

    # Encontrar los productos en la página
    productos = soup.find_all('li', {'class': lambda x: x and 'ui-search-layout__item' in x})

    # Extraer información de los productos
    for producto in productos:
        # Extraer el título del producto
        titulo_elemento = producto.find('h2', class_='poly-component__title')
        titulo = titulo_elemento.text.strip() if titulo_elemento else 'N/A'

        # Extraer el precio del producto
        precio_elemento = producto.find('div', class_='poly-price__current')
        if precio_elemento:
            precio = precio_elemento.find('span', class_='andes-money-amount__fraction')
            precio = precio.text.strip() if precio else 'N/A'
        else:
            precio = 'N/A'

        # Mostrar el título y el precio de cada producto
        print(f"Título: {titulo} - Precio: {precio}")
else:
    print(f"Error al obtener la página, código de estado: {response.status_code}")

Título: Protector Acrílico Para Apple Watch Series 9-8-7-6-5-4-se-u. - Precio: 19.399
Título: Case Funda Protector Compatible Con Apple Watch Series - Precio: 18.900
Título: Apple iPhone 16 Pro Max (256 GB) - Titanio negro - Distribuidor Autorizado - Precio: 6.969.000
Título: Apple AirPods (3ª generación) con estuche de carga Lightning Bluetooth - Precio: 688.900
Título: Apple iPhone 16 (128 GB) - Blanco - Precio: 3.877.900
Título: Apple iPhone 16 Pro (128 GB) - Titanio negro - Precio: 5.144.900
Título: Apple Watch Series 9 GPS • Caja de aluminio color medianoche de 45 mm • Correa deportiva color medianoche - M/L - Precio: 2.199.900
Título: Apple iPhone 16 Plus (128 GB) - Ultramarino - Distribuidor Autorizado - Precio: 5.229.000
Título: Apple iPhone 16 (128 GB) - Verde azulado - Distribuidor Autorizado - Precio: 4.649.000
Título: Apple Pencil 2da Generación - MU8F2AM/A - Color Blanco - Precio: 447.900
Título: Apple iPhone 15 Pro Max (256 GB) - Titanio Natural - Precio: 5.919.000
Título

## **Scraping con Selenium**

In [3]:
# Importar las librerías necesarias
from selenium import webdriver
from selenium.webdriver.common.by import By
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service

# Configuración de Selenium para usar el navegador Chrome
options = webdriver.ChromeOptions()
options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')

# Iniciar el navegador con el servicio y las opciones
service = Service(ChromeDriverManager().install())
driver = webdriver.Chrome(service=service, options=options)

# URL de la página de Mercado Libre
driver.get('https://listado.mercadolibre.com.co/apple')

# Esperar un poco para que la página cargue los elementos (ajusta el tiempo si es necesario)
driver.implicitly_wait(10)

# Buscar los productos en la página
productos = driver.find_elements(By.CLASS_NAME, 'ui-search-layout__item')

# Extraer y mostrar los títulos y precios de los productos
for producto in productos:
    try:
        # Extraer el título usando la clase actualizada
        titulo = producto.find_element(By.CLASS_NAME, 'poly-component__title').text

        # Extraer el precio usando la estructura de precio
        precio_elemento = producto.find_element(By.CLASS_NAME, 'poly-price__current')
        precio = precio_elemento.find_element(By.CLASS_NAME, 'andes-money-amount__fraction').text

        print(f"Título: {titulo} - Precio: {precio}")
    except Exception as e:
        print("No se pudo extraer la información de este producto")

# Cerrar el navegador
driver.quit()

Título: Protector Acrílico Para Apple Watch Series 9-8-7-6-5-4-se-u. - Precio: 19.399
Título: Case Funda Protector Compatible Con Apple Watch Series - Precio: 18.900
Título: Apple iPhone 16 Pro Max (256 GB) - Titanio negro - Distribuidor Autorizado - Precio: 6.969.000
Título: Apple AirPods (3ª generación) con estuche de carga Lightning Bluetooth - Precio: 688.900
Título: Apple iPhone 16 (128 GB) - Blanco - Precio: 3.877.900
Título: Apple iPhone 16 Pro (128 GB) - Titanio negro - Precio: 5.144.900
Título: Apple Watch Series 9 GPS • Caja de aluminio color medianoche de 45 mm • Correa deportiva color medianoche - M/L - Precio: 2.199.900
Título: Apple iPhone 16 Plus (128 GB) - Ultramarino - Distribuidor Autorizado - Precio: 5.229.000
Título: Apple iPhone 16 (128 GB) - Verde azulado - Distribuidor Autorizado - Precio: 4.649.000
Título: Apple Pencil 2da Generación - MU8F2AM/A - Color Blanco - Precio: 447.900
Título: Apple iPhone 15 Pro Max (256 GB) - Titanio Natural - Precio: 5.919.000
Título

## **Scraping con Scrapy**

In [4]:
!scrapy startproject scrapy_mercadolibre

New Scrapy project 'scrapy_mercadolibre', using template directory '/Users/darvcode/Desarrollos/PERSONAL/IUD/Programación para Análisis de Datos/venv/lib/python3.11/site-packages/scrapy/templates/project', created in:
    /Users/darvcode/Desarrollos/PERSONAL/IUD/Programación para Análisis de Datos/notebooks/scrapy_mercadolibre

You can start your first spider with:
    cd scrapy_mercadolibre
    scrapy genspider example example.com


In [5]:
import scrapy

class MercadoLibreSpider(scrapy.Spider):
    name = 'mercadolibre'
    start_urls = ['https://listado.mercadolibre.com.co/apple']

    def parse(self, response):
        productos = response.css('li.ui-search-layout__item')

        for producto in productos:
            titulo = producto.css('h2.poly-component__title::text').get(default='N/A')
            precio = producto.css('div.poly-price__current span.andes-money-amount__fraction::text').get(default='N/A')

            yield {
                'Título': titulo,
                'Precio': precio
            }

In [6]:
!scrapy crawl mercadolibre -o resultados.json

Scrapy 2.12.0 - no active project

Unknown command: crawl

Use "scrapy" to see available commands
