In [1]:
# !pip install pandas

In [2]:
from bs4 import BeautifulSoup
import unicodedata
import requests
import json

def limpiar_unicode(texto):
    if texto:
        return unicodedata.normalize('NFKD', texto).encode('ascii', 'ignore').decode('ascii')
    return texto

def obtener_precio_actual(soup):
    try:
        precio_actual = soup.find('span', {'class': 'a-price-whole'}).get_text(strip=True)
        precio_decimal = soup.find('span', {'class': 'a-price-fraction'}).get_text(strip=True)
        precio_actual = precio_actual + '.' + precio_decimal + ' €'
        return limpiar_unicode(precio_actual)
    except:
        return None

def obtener_precio_anterior(soup):
    try:
        precio_anterior = soup.find('span', {'class': 'a-price a-text-price'}).find('span', {'class': 'a-offscreen'}).get_text(strip=True)
        return limpiar_unicode(precio_anterior)
    except:
        return None

def obtener_detalles_tecnicos(soup):
    detalles_tecnicos = {}
    global ids_noobtenidos
    try:
        tabla_detalles = soup.find('table', {'id': 'productDetails_techSpec_section_1'})
        if tabla_detalles:
            filas = tabla_detalles.find_all('tr')
            for fila in filas:
                clave = fila.find('th').get_text(strip=True)
                valor = fila.find('td').get_text(strip=True)
                detalles_tecnicos[limpiar_unicode(clave)] = limpiar_unicode(valor)
        else:
            ids_noobtenidos = ids_noobtenidos + 1
            print("No se ha podido obtener los detalles de este id")
            return None
    except Exception as e:
        ids_noobtenidos = ids_noobtenidos + 1
        print("No se ha podido obtener los detalles de este id")
        print(e)
        return None
    return detalles_tecnicos


def obtener_soup(api_key, product_id):
    url = 'https://www.amazon.es/dp/' + product_id
    params = {
        'api_key': api_key,
        'url': url,
        'country_code': 'ES'
    }
    response = requests.get('https://api.scraperapi.com/', params=params)
    if response.status_code == 200:
        return BeautifulSoup(response.text, 'html.parser')
    else:
        print(f'Error: {response.status_code}')
        return None

def obtener_datos_producto(api_key, product_id):
    soup = obtener_soup(api_key, product_id)
    if soup:
        precio_actual = obtener_precio_actual(soup)
        precio_anterior = obtener_precio_anterior(soup)
        detalles_tecnicos = obtener_detalles_tecnicos(soup)
        if detalles_tecnicos:
            return {
            'product_id': product_id,
            'precio_actual': precio_actual,
            'precio_anterior': precio_anterior,
            **detalles_tecnicos
            }
    return None

fichero = "../res/ids.json"
with open(fichero, 'r') as file:
    product_ids = json.load(file)

API_KEY = '1d8a83a5b3d3bfb0e635d9319bf08dd0'
ids_noobtenidos = 0

fichero_detalles = "../res/mobiles.json"
with open(fichero_detalles, "w") as outfile:
    outfile.write("[")
    first = True
    for product_id in product_ids:
        print(f"Obteniendo datos de {product_id}")
        detalles = obtener_datos_producto(API_KEY, product_id)
        if detalles:
            if not first:
                outfile.write(",\n")
            json.dump(detalles, outfile, ensure_ascii=False, indent=4)
            first = False
    outfile.write("\n]")
print(f"No se han podido obtener {ids_noobtenidos} IDs.")
print("Datos guardados en mobiles.json")

Obteniendo datos de B0CCW32ZH2
Obteniendo datos de B0DNK3Y6HK
Obteniendo datos de B07QZN6DGK
Obteniendo datos de B0DDL1DMZ2
Obteniendo datos de B09MJQGX2W
No se ha podido obtener los detalles de este id
Obteniendo datos de B0CY8D7L7F
Obteniendo datos de B0CVQ6SYFK
Obteniendo datos de B0CSFVKV5S
Obteniendo datos de B0DCBYCTJP
No se ha podido obtener los detalles de este id
Obteniendo datos de B0BSLJNW5G
Obteniendo datos de B0CWTPTF51
No se ha podido obtener los detalles de este id
Obteniendo datos de B0DJD3S5GQ
Obteniendo datos de B0D47GS8PW
Obteniendo datos de B0DGLLWPMM
Obteniendo datos de B08VW9J5GV
Obteniendo datos de B0DKP8CT9W
Obteniendo datos de B0CR3XCB81
Obteniendo datos de B0CTHX8WYP
Obteniendo datos de B0CCYPD7MS
Obteniendo datos de B0BW68WVK3
Obteniendo datos de B0DR8X2Y1Z
Obteniendo datos de B09SGKMMVS
Obteniendo datos de B0CQHTLPFC
Obteniendo datos de B0D929RCTB
Obteniendo datos de B0CWS285P6
Obteniendo datos de B0D8TCDJ97
Obteniendo datos de B0D9LNR55Z
Obteniendo datos de