In [1]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import re

def amazon_a_camel_url(amazon_url: str) -> str:
    """Convierte una URL de Amazon a una URL de CamelCamelCamel usando el ASIN."""
    # Extraer el ASIN de la URL de Amazon
    asin_match = re.search(r'/dp/([A-Z0-9]{10})', amazon_url)
    if asin_match:
        asin = asin_match.group(1)
        # Construir la URL de CamelCamelCamel
        camel_url = f"https://camelcamelcamel.com/product/{asin}"
        return camel_url
    else:
        raise ValueError("No se pudo extraer el ASIN de la URL de Amazon")

# Ejemplo de URL de Amazon
url_amazon: str = "https://www.amazon.com/dp/B000VXO4L2?tag=camelweb-20&linkCode=ogi&th=1&psc=1&language=en_US"

# Convertir a URL de CamelCamelCamel
url: str = amazon_a_camel_url(url_amazon)

# Configurar el servicio de Chrome
service = Service(ChromeDriverManager().install())

# Iniciar el navegador Chrome
driver = webdriver.Chrome(service=service)

# Navegar a la página de CamelCamelCamel
driver.get(url)

# Buscar la tabla que contiene los precios
tabla_precios = driver.find_element(By.CLASS_NAME, 'camelegend')

# Extraer los datos de la tabla
datos: list[list[str]] = []
filas = tabla_precios.find_elements(By.TAG_NAME, 'tr')
for fila in filas[1:]:  # Omitir la cabecera de la tabla
    celdas = fila.find_elements(By.TAG_NAME, 'td')
    tipo_precio: str = celdas[0].text.strip()
    mas_bajo: str = celdas[1].text.strip()
    mas_alto: str = celdas[2].text.strip()
    actual: str = celdas[3].text.strip()
    media: str = celdas[4].text.strip()
    datos.append([tipo_precio, mas_bajo, mas_alto, actual, media])

# Crear el DataFrame
df = pd.DataFrame(datos, columns=['Tipo de Precio', 'Más Bajo', 'Más Alto', 'Actual', 'Media'])

# Mostrar datos al usuario
print(df)

# Guardar los datos en un archivo CSV
df.to_csv('historial_precios.csv', index=False)

# Cerrar el navegador
driver.quit()

   Tipo de Precio                   Más Bajo                    Más Alto  \
0          Amazon  $5.48 (11 de feb de 2020)  $21.49 (24 de abr de 2022)   
1  3ª Parte Nuevo  $0.99 (03 de ago de 2019)  $39.90 (21 de abr de 2022)   
2  3ª Parte Usado  $3.98 (09 de mar de 2016)  $53.32 (30 de may de 2013)   

                      Actual   Media  
0  $8.27 (25 de ago de 2024)   $9.93  
1                          -  $15.99  
2                          -   $9.47  


In [2]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
import re
from datetime import datetime

def amazon_a_camel_url(amazon_url: str) -> str:
    """Convierte una URL de Amazon a una URL de CamelCamelCamel usando el ASIN."""
    asin_match = re.search(r'/dp/([A-Z0-9]{10})', amazon_url)
    if asin_match:
        asin = asin_match.group(1)
        camel_url = f"https://camelcamelcamel.com/product/{asin}"
        return camel_url
    else:
        raise ValueError("No se pudo extraer el ASIN de la URL de Amazon")

def extraer_precio_y_fecha(texto: str):
    """Extrae el precio y la fecha del texto proporcionado."""
    precio_match = re.search(r'\$(\d+\.\d{2})', texto)
    fecha_match = re.search(r'\((\d{2} de \w+ de \d{4})\)', texto)
    
    precio = float(precio_match.group(1)) if precio_match else None
    fecha_str = fecha_match.group(1) if fecha_match else None
    
    # Mapear los meses abreviados en español
    meses = {
        'ene': '01',
        'feb': '02',
        'mar': '03',
        'abr': '04',
        'may': '05',
        'jun': '06',
        'jul': '07',
        'ago': '08',
        'sep': '09',
        'oct': '10',
        'nov': '11',
        'dic': '12'
    }
    
    if fecha_str:
        for mes_abrev, mes_num in meses.items():
            fecha_str = fecha_str.replace(f" de {mes_abrev} de ", f"-{mes_num}-")
        fecha = datetime.strptime(fecha_str, '%d-%m-%Y')
    else:
        fecha = None
    
    return precio, fecha

# Ejemplo de URL de Amazon
url_amazon: str = "https://www.amazon.com/dp/B000VXO4L2?tag=camelweb-20&linkCode=ogi&th=1&psc=1&language=en_US"

# Convertir a URL de CamelCamelCamel
url: str = amazon_a_camel_url(url_amazon)

# Configurar el servicio de Chrome
service = Service(ChromeDriverManager().install())

# Iniciar el navegador Chrome
driver = webdriver.Chrome(service=service)

# Navegar a la página de CamelCamelCamel
driver.get(url)

# Buscar la tabla que contiene los precios
tabla_precios = driver.find_element(By.CLASS_NAME, 'camelegend')

# Extraer los datos de la tabla
datos: list[list] = []
filas = tabla_precios.find_elements(By.TAG_NAME, 'tr')
for fila in filas[1:]:  # Omitir la cabecera de la tabla
    celdas = fila.find_elements(By.TAG_NAME, 'td')
    tipo_precio = celdas[0].text.strip()
    
    mas_bajo_precio, mas_bajo_fecha = extraer_precio_y_fecha(celdas[1].text.strip())
    mas_alto_precio, mas_alto_fecha = extraer_precio_y_fecha(celdas[2].text.strip())
    actual_precio, actual_fecha = extraer_precio_y_fecha(celdas[3].text.strip())
    
    media_precio = float(re.search(r'\$(\d+\.\d{2})', celdas[4].text.strip()).group(1)) if celdas[4].text.strip() else None
    
    datos.append([tipo_precio, mas_bajo_precio, mas_bajo_fecha, mas_alto_precio, mas_alto_fecha,
                  actual_precio, actual_fecha, media_precio])

# Crear el DataFrame con las nuevas columnas
df = pd.DataFrame(datos, columns=['Tipo de Precio', 'Más Bajo', 'Más Bajo Fecha',
                                  'Más Alto', 'Más Alto Fecha', 'Actual', 'Actual Fecha', 'Media'])

# Cerrar el navegador
driver.quit()

In [3]:
# Mostrar datos al usuario
print(df)

# Guardar los datos en un archivo CSV
df.to_csv('historial_precios.csv', index=False)

   Tipo de Precio  Más Bajo Más Bajo Fecha  Más Alto Más Alto Fecha  Actual  \
0          Amazon      5.48     2020-02-11     21.49     2022-04-24    8.27   
1  3ª Parte Nuevo      0.99     2019-08-03     39.90     2022-04-21     NaN   
2  3ª Parte Usado      3.98     2016-03-09     53.32     2013-05-30     NaN   

  Actual Fecha  Media  
0   2024-08-25   9.93  
1          NaT  15.99  
2          NaT   9.47  


In [4]:
df

Unnamed: 0,Tipo de Precio,Más Bajo,Más Bajo Fecha,Más Alto,Más Alto Fecha,Actual,Actual Fecha,Media
0,Amazon,5.48,2020-02-11,21.49,2022-04-24,8.27,2024-08-25,9.93
1,3ª Parte Nuevo,0.99,2019-08-03,39.9,2022-04-21,,NaT,15.99
2,3ª Parte Usado,3.98,2016-03-09,53.32,2013-05-30,,NaT,9.47
