# 

In [7]:
import pandas as pd
import json

# === CONFIG ===
INPUT_FILE = "patentes-limpio-v3.xlsx"   # Nombre de tu archivo Excel
OUTPUT_FILE = "patentes_convertidas.json"  # Salida en JSON

# === MAPEADO ENTRE COLUMNAS DEL EXCEL Y NUEVO SCHEMA ===
column_mapping = {
    "Universidad de origen": "Universidad de origen",
    "Título de la patente": "Titulo de la patente",
    "Nº referencia de la solicitud": "Numero de referencia de la solicitud",
    "Tipo": "Tipo",
    "Autores": "Autores",
    "Titular de los derechos": "Titular de los derechos",
    "Fecha solicitud": "Fecha de solicitud",
    "Denegada": "Denegada",
    "Concedida": "Concedida",
    "Abandonada": "Abandonada",
    "Breve Descripción/Resumen": "Breve descripción/Resumen",
    "Palabras Clave": "Palabras Clave",
    "País/es de prioridad": "Pais de prioridad",
    "Área Nacional": "Area Nacional",
    "Área Europea": "Area Europea",
    "Área PCT (Tratado de Cooperación en materia de Patentes)": "Area PCT",
    "Otros (especificar)": "Otros",
    "Estudio previo (si/no)": "Estudio previo",
    "Plan de comecialización (si/no)": "Plan de comercializacion",
    "Plan de negocio (si/no)": "Plan de negocio"
}

# === LECTURA DEL EXCEL ===
df = pd.read_excel(INPUT_FILE)

# Renombrar columnas al nuevo esquema
df = df.rename(columns=column_mapping)

# Quedarnos solo con las columnas que estén en el mapping
cols_existentes = [col for col in column_mapping.values() if col in df.columns]
df = df[cols_existentes]

# Reemplazar valores vacíos con "No disponible"
df = df.fillna("No disponible")

# Convertir fechas a string (dd/mm/yyyy)
if "Fecha de solicitud" in df.columns:
    df["Fecha de solicitud"] = pd.to_datetime(df["Fecha de solicitud"], errors="coerce")
    df["Fecha de solicitud"] = df["Fecha de solicitud"].apply(
        lambda x: x.strftime("%d/%m/%Y") if pd.notnull(x) else "No disponible"
    )

# Convertir a lista de diccionarios
data = df.to_dict(orient="records")

# Guardar en JSON
with open(OUTPUT_FILE, "w", encoding="utf-8") as f:
    json.dump(data, f, indent=2, ensure_ascii=False)

print(f"✅ Archivo convertido y guardado en {OUTPUT_FILE}")


✅ Archivo convertido y guardado en patentes_convertidas.json
