In [None]:
import os
import json
import pandas as pd

# Ruta principal
data_path = r"C:\Users\carda\Downloads\Data Science Henry DataFt25\PF Henry\data\Google Maps"

# Función para cargar y validar archivos JSON
def load_and_validate_json_files(path):
    data_frames = []
    print(f"Cargando y corrigiendo archivos en: {path}...\n")

    for root, dirs, files in os.walk(path):
        json_files = [f for f in files if f.endswith('.json')]

        if json_files:
            print(f"Procesando carpeta: {root}")

        for file in json_files:
            file_path = os.path.join(root, file)
            try:
                with open(file_path, 'r', encoding='utf-8') as f:
                    content = json.load(f)
                    # Validar si el contenido es un diccionario o lista
                    if isinstance(content, dict):
                        content = [content]
                    elif not isinstance(content, list):
                        print(f"Formato no válido en {file_path}")
                        continue
                    
                    # Crear DataFrame y agregar a la lista
                    df = pd.DataFrame(content)
                    if not df.empty:
                        data_frames.append(df)

            except json.JSONDecodeError as e:
                print(f"Error al procesar {file_path}: {e}")
            except Exception as e:
                print(f"Error inesperado en {file_path}: {e}")

    if data_frames:
        return pd.concat(data_frames, ignore_index=True)
    else:
        print("No se encontraron archivos JSON válidos.")
        return None

# Cargar y procesar metadata-sitios
metadata_path = os.path.join(data_path, "metadata-sitios-20250117T011207Z-001", "metadata-sitios")
print("Cargando y procesando metadata-sitios...")
metadata_df = load_and_validate_json_files(metadata_path)
if metadata_df is not None:
    print(f"Metadata cargada con éxito: {metadata_df.shape[0]} filas y {metadata_df.shape[1]} columnas.\n")
else:
    print("No se pudo cargar la metadata-sitios.\n")

# Cargar y procesar reviews-estados
reviews_path = os.path.join(data_path, "reviews-estados-20250117T011342Z-009", "reviews-estados")
print("Cargando y procesando reviews-estados...")
reviews_df = load_and_validate_json_files(reviews_path)
if reviews_df is not None:
    print(f"Reviews cargadas con éxito: {reviews_df.shape[0]} filas y {reviews_df.shape[1]} columnas.\n")
else:
    print("No se pudo cargar las reviews-estados.\n")

# Guardar los resultados en CSV si se cargaron correctamente
if metadata_df is not None:
    metadata_csv_path = os.path.join(data_path, "metadata_sitios_processed.csv")
    metadata_df.to_csv(metadata_csv_path, index=False, encoding='utf-8')
    print(f"Metadata guardada en: {metadata_csv_path}")

if reviews_df is not None:
    reviews_csv_path = os.path.join(data_path, "reviews_estados_processed.csv")
    reviews_df.to_csv(reviews_csv_path, index=False, encoding='utf-8')
    print(f"Reviews guardadas en: {reviews_csv_path}")
