In [None]:
import pandas as pd
import json
from google.colab import drive

# Montar Google Drive
drive.mount('/content/drive')

# Ruta al archivo JSON
ruta_json = '/content/drive/MyDrive/Colab Notebooks/emocion.json'

# Leer el JSON crudo
with open(ruta_json, 'r') as file:
    data = json.load(file)

# Inspeccionar la estructura completa del JSON
print("Estructura completa del JSON:")
print(json.dumps(data, indent=2))

# Determinar cómo convertir a DataFrame según la estructura
if isinstance(data, dict):
    # Si es un diccionario con t_id como claves
    print("\nEl JSON es un diccionario. Convirtiendo a DataFrame...")
    df = pd.DataFrame.from_dict(data, orient='index')
    df['t_id'] = df.index  # Añadir t_id como columna
    df = df.reset_index(drop=True)  # Resetear índice
else:
    # Si es una lista de diccionarios
    print("\nEl JSON es una lista. Convirtiendo a DataFrame...")
    df = pd.DataFrame(data)

# Mostrar columnas disponibles
print("\nColumnas del DataFrame:")
print(df.columns.tolist())

# Mostrar primeras filas
print("\nPrimeras 5 filas del DataFrame sin procesar:")
print(df.head())

# Ajustar nombres de columnas si es necesario
if 'emotion' in df.columns and 'emocion' not in df.columns:
    df = df.rename(columns={'emotion': 'emocion'})
    print("\nColumna renombrada de 'emotion' a 'emocion'")

# Verificar columnas nuevamente
print("\nColumnas ajustadas:")
print(df.columns.tolist())

# Traducir emociones a español
emociones_traducidas = {
    'happy': 'feliz',
    'sad': 'triste',
    'angry': 'enojado',
    'neutral': 'neutral',
    'surprise': 'sorpresa',
    'fear': 'miedo',
    'disgust': 'asco'
}
df['emocion'] = df['emocion'].map(emociones_traducidas)

# Eliminar nulos y duplicados
df = df.dropna()
df = df.drop_duplicates()

# Definir fecha base
fecha_base = pd.to_datetime('2022-09-01 00:00:00')

# Convertir tiempo_recogida a formato DATETIME legible
df['tiempo_recogida'] = fecha_base + pd.to_timedelta(df['tiempo_recogida'], unit='h')
df = df.rename(columns={'tiempo_recogida': 'fecha_hora'})

# Verificar resultado
print("\nPrimeras 5 filas del DataFrame procesado:")
print(df.head())

# Guardar el CSV
ruta_csv = '/content/drive/MyDrive/Colab Notebooks/emocion_limpio_corregido.csv'
df.to_csv(ruta_csv, index=False, date_format='%Y-%m-%d %H:%M:%S')
print(f"Datos guardados en '{ruta_csv}'")

[1;30;43mStreaming output truncated to the last 5000 lines.[0m
    "t_id": "PublicTest_79151739.jpg",
    "emocion": "sad",
    "tiempo_recogida": 434
  },
  "PublicTest_79438349.jpg": {
    "t_id": "PublicTest_79438349.jpg",
    "emocion": "sad",
    "tiempo_recogida": 712
  },
  "PublicTest_79513692.jpg": {
    "t_id": "PublicTest_79513692.jpg",
    "emocion": null,
    "tiempo_recogida": 551
  },
  "PublicTest_79756832.jpg": {
    "t_id": "PublicTest_79756832.jpg",
    "emocion": "sad",
    "tiempo_recogida": 604
  },
  "PublicTest_79808156.jpg": {
    "t_id": "PublicTest_79808156.jpg",
    "emocion": "sad",
    "tiempo_recogida": 627
  },
  "PublicTest_8012914.jpg": {
    "t_id": "PublicTest_8012914.jpg",
    "emocion": "sad",
    "tiempo_recogida": 174
  },
  "PublicTest_8018896.jpg": {
    "t_id": "PublicTest_8018896.jpg",
    "emocion": "sad",
    "tiempo_recogida": 361
  },
  "PublicTest_80404392.jpg": {
    "t_id": "PublicTest_80404392.jpg",
    "emocion": "sad",
    "tiempo