In [2]:
import pandas as pd
import numpy as np
import matplotlib as plt

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager
from bs4 import BeautifulSoup
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

import requests
import time

In [3]:
## JUAN DE LA ROSA - BEBIDAS

chrome_options = Options()
chrome_options.add_argument("--headless")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--disable-dev-shm-usage")

driver = webdriver.Chrome(
    service=Service(ChromeDriverManager().install()),
    options=chrome_options
)

productos_list = []

try:
    driver.get("https://www.hipermaxi.com/cochabamba/hipermaxi-juan-de-la-rosa/categoria/bebidas")
    
    # 1. Esperar a que cargue el contenido inicial
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.CSS_SELECTOR, 'article.w-full'))
    )

    # 2. Simular scroll hasta el final para cargar todos los productos
    ultima_altura = driver.execute_script("return document.body.scrollHeight")
    while True:
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        time.sleep(5)  # Esperar a que cargue nuevo contenido
        nueva_altura = driver.execute_script("return document.body.scrollHeight")
        
        # Si la altura no cambia, significa que no hay más contenido
        if nueva_altura == ultima_altura:
            break
        
        ultima_altura = nueva_altura
    
    # 3. Parsear el HTML después del scroll completo
    soup = BeautifulSoup(driver.page_source, 'html.parser')
    articulos = soup.find_all('article', class_='w-full')

    # 4. Extraer datos
    for articulo in articulos:
        try:
            # Capturar el enlace y el nombre
            enlace = articulo.find('a', class_='hover:underline h-full leading-tight text-gray-700')
            if enlace:
                nombre = enlace.text.strip()
                url = enlace['href']
                
                # Capturar el precio
                precio_span = articulo.find('span', class_='text-black font-bold')
                precio = precio_span.text.strip() if precio_span else 'No disponible'
                
                productos_list.append({
                    'nombre': nombre,
                    'url': url,
                    'precio': precio
                })
        except Exception as e:
            print(f"Error procesando artículo: {e}")

    # Crear DataFrame
    df_bebidas = pd.DataFrame(productos_list)
    print(f"\nProductos encontrados: {len(df_bebidas)}")
    print(df_bebidas.head())

except Exception as e:
    print(f"Error general: {e}")

finally:
    driver.quit()


Productos encontrados: 1350
                                   nombre  \
0   MAS+ BY MESSI BERRY COPA CRUSH 500 ML   
1  MAS+ BY MESSI LIMON LIME LEAGUE 500 ML   
2         MAS+ BY MESSI ORANGE D OR 500ML   
3          Gaseosa Coca Cola Two Pack 3 L   
4         Hielo en Cubos Hipermaxi 1.5 kg   

                                                 url     precio  
0  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 24.90  
1  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 24.90  
2  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 24.90  
3  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 30.00  
4  /cochabamba/hipermaxi-juan-de-la-rosa/producto...   Bs. 5.50  


In [4]:
## JUAN DE LA ROSA - BEBIDAS

chrome_options = Options()
chrome_options.add_argument("--headless")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("--disable-dev-shm-usage")

driver = webdriver.Chrome(
    service=Service(ChromeDriverManager().install()),
    options=chrome_options
)

productos_list = []

try:
    driver.get("https://www.hipermaxi.com/cochabamba/hipermaxi-juan-de-la-rosa/categoria/carnes")
    
    # 1. Esperar a que cargue el contenido inicial
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.CSS_SELECTOR, 'article.w-full'))
    )

    # 2. Simular scroll hasta el final para cargar todos los productos
    ultima_altura = driver.execute_script("return document.body.scrollHeight")
    while True:
        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
        time.sleep(5)  # Esperar a que cargue nuevo contenido
        nueva_altura = driver.execute_script("return document.body.scrollHeight")
        
        # Si la altura no cambia, significa que no hay más contenido
        if nueva_altura == ultima_altura:
            break
        
        ultima_altura = nueva_altura
    
    # 3. Parsear el HTML después del scroll completo
    soup = BeautifulSoup(driver.page_source, 'html.parser')
    articulos = soup.find_all('article', class_='w-full')

    # 4. Extraer datos
    for articulo in articulos:
        try:
            # Capturar el enlace y el nombre
            enlace = articulo.find('a', class_='hover:underline h-full leading-tight text-gray-700')
            if enlace:
                nombre = enlace.text.strip()
                url = enlace['href']
                
                # Capturar el precio
                precio_span = articulo.find('span', class_='text-black font-bold')
                precio = precio_span.text.strip() if precio_span else 'No disponible'
                
                productos_list.append({
                    'nombre': nombre,
                    'url': url,
                    'precio': precio
                })
        except Exception as e:
            print(f"Error procesando artículo: {e}")

    # Crear DataFrame
    df_carnes = pd.DataFrame(productos_list)
    print(f"\nProductos encontrados: {len(df_carnes)}")
    print(df_carnes.head())

except Exception as e:
    print(f"Error general: {e}")

finally:
    driver.quit()


Productos encontrados: 58
                       nombre  \
0          Picaña Especial kg   
1     Carne Molida de Segunda   
2  Bollo Grande Especial 1 kg   
3         Cuadril Especial kg   
4   Pollerita Pura Carne 1 kg   

                                                 url     precio  
0  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 69.00  
1  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 49.00  
2  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 72.00  
3  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 69.00  
4  /cochabamba/hipermaxi-juan-de-la-rosa/producto...  Bs. 50.00  


In [5]:
df_carnes['producto_id'] = df_carnes['url'].str.extract(r'\/producto\/(\d+)')
df_carnes

Unnamed: 0,nombre,url,precio,producto_id
0,Picaña Especial kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 69.00,414069
1,Carne Molida de Segunda,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 49.00,835267
2,Bollo Grande Especial 1 kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 72.00,835247
3,Cuadril Especial kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 69.00,835439
4,Pollerita Pura Carne 1 kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 50.00,835445
5,Chuleta de Lomo kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 61.00,835509
6,Bollo Chico Especial 1 kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 71.00,835212
7,Tira de Res Primer Corte kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 50.00,835549
8,Pecho 1 kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 50.00,835430
9,Corte Español 1 kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 55.00,835623


In [6]:
df_carnes.to_csv('carnes_7.csv', index=False, encoding='utf-8')

In [7]:
df_bebidas['producto_id'] = df_bebidas['url'].str.extract(r'\/producto\/(\d+)')
df_bebidas

Unnamed: 0,nombre,url,precio,producto_id
0,MAS+ BY MESSI BERRY COPA CRUSH 500 ML,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 24.90,629750
1,MAS+ BY MESSI LIMON LIME LEAGUE 500 ML,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 24.90,629749
2,MAS+ BY MESSI ORANGE D OR 500ML,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 24.90,629751
3,Gaseosa Coca Cola Two Pack 3 L,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 30.00,658233
4,Hielo en Cubos Hipermaxi 1.5 kg,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 5.50,658434
...,...,...,...,...
1345,Vino San Rafael Fino Tinto 700 ml,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 35.00,677563
1346,Four Loko Purple 693 ml,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 38.00,031121
1347,Vape Umo Mint Mc 2000 Puffs,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 54.90,030114
1348,Cerveza Paulaner Weissbier 500 ml,/cochabamba/hipermaxi-juan-de-la-rosa/producto...,Bs. 27.50,104678


In [8]:
df_bebidas.to_csv('bebidas_7.csv', index=False, encoding='utf-8')