In [15]:
import json
import csv
import pandas as pd

# Cargar el archivo JSON
with open('mobiles.json', 'r', encoding='utf-8') as file:
    data = json.load(file)

# Asegurar que data es una lista de diccionarios
if isinstance(data, dict):
    data = [data]
elif isinstance(data, list):
    data = [item for item in data if isinstance(item, dict)]
else:
    raise ValueError("El JSON no contiene una estructura válida de datos.")

# Lista de columnas a excluir
columnas_excluidas = {
    "Numero de pilas de ion de litio", "Que hay en la caja?", "Formatos compatibles", "Tiene estabilizador de imagen", 
    "Tipo de medio", "Aparatos compatibles","Descripcion de la interfaz de red", "Tecnologia del microfono", "Resolucion vertical max.", 
    "Tecnologia de comunicacion inalámbrica"," Proveedor de conexion inalambrica","Velocidad de transferencia de datos", "Descripcion de la bateria", "Duracion de la bateria media (en horas)", 
    "Marca de la tarjeta grafica","Relacion de aspecto de imagen", "Dimensiones del paquete", "Embalaje de la bateria de litio", "Tipo de dispositivo", 
    "Actualizaciones de software garantizadas hasta", "Tecnologia de comunicacion inalambrica","Compilador", "Numero de pilas de metal de litio", "Voltaje", 
    "Resolucion de pantalla","Tiempo de conversacion telefonica", "Numero de puertos USB", "Contenido de energia de la bateria de litio", "Lector", 
    "Marimba", "Tipo de material", "Incluye bateria recargable", "Tiene vision nocturna", "Pantalla a color", 
    "Proveedor de conexion inalámbrica", "Tipo de lente","Descripcion de la tarjeta grafica", "GPS", "Otras caracteristicas de la pantalla", 
    "Tipo de conexion inalámbrica", "Numero de puertos"
}

# Obtener todas las claves únicas de detalles_tecnicos, excluyendo las no deseadas
all_keys = set()
for item in data:
    if isinstance(item.get('detalles_tecnicos', {}), dict):
        all_keys.update(k for k in item['detalles_tecnicos'].keys() if k not in columnas_excluidas)

# Definir los nombres de las columnas
fieldnames = ['product_id', 'precio_actual', 'precio_anterior'] + list(all_keys)

# Abrir un archivo CSV para escritura
with open('mobiles.csv', 'w', newline='', encoding='utf-8') as csvfile:
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
    
    # Escribir la cabecera
    writer.writeheader()
    
    # Escribir los datos
    for item in data:
        row = {
            'product_id': item.get('product_id', ''),
            'precio_actual': item.get('precio_actual', ''),
            'precio_anterior': item.get('precio_anterior', '')
        }
        detalles = item.get('detalles_tecnicos', {})
        if isinstance(detalles, dict):
            for key in all_keys:
                row[key] = detalles.get(key, '')
        writer.writerow(row)

print("Archivo CSV generado exitosamente: mobiles.csv")



Archivo CSV generado exitosamente: mobiles.csv


In [16]:
datos = pd.read_csv("mobiles.csv")
datos.head

<bound method NDFrame.head of      product_id precio_actual precio_anterior Potencia nominal de la bateria  \
0    B0DR8RHJ9T       99,.99           159,99                         5000.0   
1    B0DN5YTHZ9      149,.99           139,99                            NaN   
2    B0D4R89TZV      209,.49           218,98                            NaN   
3    B0DFPZXW3P       79,.99            99,99   4300 Miliamperios hora (mAh)   
4    B0DBLX4FTT      106,.24           124,99   5000 Miliamperios hora (mAh)   
..          ...           ...             ...                            ...   
346  B0CQJRHSDR      231,.53          1299,00                            NaN   
347  B0DG2Y8PXJ       89,.99           119,99   4300 Miliamperios hora (mAh)   
348  B0C6K9BCXF      179,.00          999,99                             NaN   
349  B0DGXXTBLJ      199,.99           219,99   5010 Modificador desconocido   
350  B0CCYT8Q2X      244,.99           299,00   5000 Modificador desconocido   

    Fabri