# üöÄ Grafo V3: Evaluaci√≥n Booleana Exhaustiva

Este notebook implementa **la versi√≥n m√°s robusta** con evaluaci√≥n expl√≠cita de TODOS los c√≥digos.

## üéØ Mejoras sobre V2

**Problema en V2:** Si encuentra 1 c√≥digo hist√≥rico, NO genera nuevos ‚Üí Pierde conceptos

**Soluci√≥n en V3:**
- ‚úÖ Eval√∫a **TODOS** los c√≥digos con True/False + confianza
- ‚úÖ Identifica **gaps de cobertura** (qu√© NO est√° cubierto)
- ‚úÖ Captura casos **mixtos** naturalmente

---


## üîß Instalaci√≥n de Dependencias

Si encuentras errores de import, ejecuta esta celda:


In [15]:
# Ejecuta esto si tienes errores de import
%pip install grandalf langchain langchain-openai langgraph python-dotenv pandas openpyxl tenacity

print("üí° Si necesitas instalar dependencias, descomenta la l√≠nea de arriba")


Note: you may need to restart the kernel to use updated packages.
üí° Si necesitas instalar dependencias, descomenta la l√≠nea de arriba



[notice] A new release of pip is available: 25.2 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


In [16]:
# üõ†Ô∏è UTILIDADES Y MEJORAS

from tenacity import retry, stop_after_attempt, wait_exponential, retry_if_exception_type
import re
from typing import Tuple, Optional, List, Dict

# ========== 1. RETRY LOGIC ==========
def llamada_llm_con_retry(chain, input_data, max_intentos=3):
    """
    Ejecuta una llamada al LLM con retry autom√°tico en caso de error.
    
    Args:
        chain: Cadena de LangChain a ejecutar
        input_data: Datos de entrada para el chain
        max_intentos: N√∫mero m√°ximo de intentos (default: 3)
    
    Returns:
        Resultado de la llamada al LLM
    """
    @retry(
        stop=stop_after_attempt(max_intentos),
        wait=wait_exponential(multiplier=1, min=2, max=10),
        retry=retry_if_exception_type((Exception,)),
        reraise=True
    )
    def _intentar_llamada():
        try:
            return chain.invoke(input_data)
        except Exception as e:
            print(f"   ‚ö†Ô∏è  Error en LLM: {type(e).__name__}, reintentando...")
            raise
    
    return _intentar_llamada()

# ========== 2. DETECCI√ìN TEMPRANA DE RESPUESTAS ESPECIALES ==========
PATRONES_ESPECIALES = {
    # Patrones para c√≥digo 90: Ninguno
    r'\b(ninguno|ninguna|nada de eso|ninguno de|ninguna de)\b': 90,
    # Patrones para c√≥digo 91: No Recuerda
    r'\b(no recuerdo|no me acuerdo|no recuerdo|olvid√©|olvid√©)\b': 91,
    # Patrones para c√≥digo 92: No Sabe
    r'\b(no s√©|no se|no conozco|no tengo idea|no lo s√©|no lo se)\b': 92,
    # Patrones para c√≥digo 93: No Responde
    r'^[\s\-\.]+$|^$': 93,  # Vac√≠o, solo espacios, guiones o puntos
    # Patrones para c√≥digo 94: Cualquiera
    r'\b(cualquiera|cualquier|da igual|me da igual|es igual)\b': 94,
    # Patrones para c√≥digo 95: Todos
    r'\b(todos|todas|todos los|todas las)\b': 95,
    # Patrones para c√≥digo 96: No Aplica
    r'\b(no aplica|no corresponde|no es para m√≠|no es mi caso)\b': 96,
    # Patrones para c√≥digo 97: Ning√∫n Otro
    r'\b(ning√∫n otro|ninguna otra|ninguno m√°s|ninguna m√°s)\b': 97,
    # Patrones para c√≥digo 98: Nada
    r'^\s*(nada|nada m√°s|nada en particular|nada especial)\s*$': 98,
}

def detectar_codigo_especial(texto: str) -> Optional[int]:
    """
    Detecta si una respuesta corresponde a un c√≥digo especial (90-98).
    
    Args:
        texto: Texto de la respuesta a analizar
    
    Returns:
        C√≥digo especial si se detecta, None en caso contrario
    """
    texto_lower = texto.lower().strip()
    
    # Verificar patrones
    for patron, codigo in PATRONES_ESPECIALES.items():
        if re.search(patron, texto_lower, re.IGNORECASE):
            return codigo
    
    return None

# ========== 3. DEDUPLICACI√ìN DE C√ìDIGOS SIMILARES ==========
def normalizar_texto(texto: str) -> str:
    """Normaliza texto para comparaci√≥n (lowercase, sin acentos b√°sicos)"""
    texto = texto.lower().strip()
    # Reemplazos b√°sicos
    texto = texto.replace("√°", "a").replace("√©", "e").replace("√≠", "i").replace("√≥", "o").replace("√∫", "u")
    return texto

def son_conceptos_similares(desc1: str, desc2: str) -> bool:
    """
    Determina si dos descripciones representan el mismo concepto.
    
    Args:
        desc1: Primera descripci√≥n
        desc2: Segunda descripci√≥n
    
    Returns:
        True si son similares, False en caso contrario
    """
    # Definir palabras comunes al inicio
    palabras_comunes = ["para", "de", "en", "con", "sin", "por", "la", "el", "un", "una"]
    
    desc1_norm = normalizar_texto(desc1)
    desc2_norm = normalizar_texto(desc2)
    
    # Coincidencia exacta
    if desc1_norm == desc2_norm:
        return True
    
    # Una contiene a la otra (concepto m√°s general vs espec√≠fico)
    if desc1_norm in desc2_norm or desc2_norm in desc1_norm:
        # Verificar que no sea solo una palabra com√∫n
        if desc1_norm not in palabras_comunes and desc2_norm not in palabras_comunes:
            return True
    
    # Palabras clave similares (ej: "saludable", "salud", "salubre")
    palabras1 = set(desc1_norm.split())
    palabras2 = set(desc2_norm.split())
    
    # Si comparten m√°s del 50% de palabras significativas
    palabras_significativas = palabras1 | palabras2
    palabras_significativas = {p for p in palabras_significativas if len(p) > 3 and p not in palabras_comunes}
    
    if palabras_significativas:
        interseccion = palabras1 & palabras2
        if len(interseccion) / len(palabras_significativas) > 0.5:
            return True
    
    return False

def deduplicar_codigos_batch(conceptos_batch: List[Dict]) -> List[Dict]:
    """
    Deduplica c√≥digos similares dentro de un batch, agrup√°ndolos bajo el mismo c√≥digo.
    
    Args:
        conceptos_batch: Lista de conceptos nuevos generados en el batch
    
    Returns:
        Lista de conceptos deduplicados
    """
    if not conceptos_batch:
        return []
    
    # Agrupar conceptos similares
    grupos = []
    codigos_usados = {}  # descripcion_normalizada -> (codigo, descripcion_final)
    
    for concepto in conceptos_batch:
        desc = concepto.get("descripcion", "")
        codigo = concepto.get("codigo")
        
        # Buscar si ya existe un concepto similar
        encontrado = False
        for desc_existente, (cod_existente, desc_final) in codigos_usados.items():
            if son_conceptos_similares(desc, desc_existente):
                # Usar el c√≥digo existente
                concepto["codigo"] = cod_existente
                concepto["descripcion"] = desc_final  # Usar la descripci√≥n m√°s general
                encontrado = True
                break
        
        if not encontrado:
            # Nuevo concepto √∫nico
            desc_norm = normalizar_texto(desc)
            codigos_usados[desc_norm] = (codigo, desc)
    
    return conceptos_batch

# ========== 4. VALIDACI√ìN Y CORRECCI√ìN DE C√ìDIGOS GENERADOS ==========
def validar_y_corregir_codigos(conceptos_nuevos: List[Dict], codigo_base: int) -> Tuple[List[Dict], int]:
    """
    Valida y corrige c√≥digos generados para asegurar secuencialidad.
    
    Args:
        conceptos_nuevos: Lista de conceptos nuevos generados por el LLM
        codigo_base: C√≥digo base esperado para empezar
    
    Returns:
        Tupla con (conceptos_corregidos, siguiente_codigo)
    """
    if not conceptos_nuevos:
        return [], codigo_base
    
    conceptos_corregidos = []
    codigo_actual = codigo_base
    
    # Ordenar por c√≥digo original para mantener orden l√≥gico
    conceptos_ordenados = sorted(conceptos_nuevos, key=lambda x: x.get("codigo", codigo_actual))
    
    for concepto in conceptos_ordenados:
        codigo_original = concepto.get("codigo", codigo_actual)
        
        # Si el c√≥digo est√° fuera de secuencia, corregirlo
        if codigo_original < codigo_base:
            print(f"   ‚ö†Ô∏è  C√≥digo {codigo_original} fuera de secuencia, corrigiendo a {codigo_actual}")
            concepto["codigo"] = codigo_actual
        elif codigo_original != codigo_actual:
            # Si hay un salto, usar el c√≥digo actual
            print(f"   ‚ö†Ô∏è  Salto en secuencia: {codigo_original} -> {codigo_actual}, corrigiendo")
            concepto["codigo"] = codigo_actual
        
        conceptos_corregidos.append(concepto)
        codigo_actual += 1
    
    return conceptos_corregidos, codigo_actual

# ========== 4. M√âTRICAS Y LOGGING ==========
def inicializar_metricas() -> Dict:
    """Inicializa el diccionario de m√©tricas"""
    return {
        "inicio_tiempo": time.time(),
        "llamadas_llm": 0,
        "errores_llm": 0,
        "reintentos": 0,
        "respuestas_especiales_detectadas": 0,
        "codigos_corregidos": 0,
        "tokens_estimados": 0,
        "tiempo_por_nodo": {}
    }

def registrar_tiempo_nodo(metricas: Dict, nombre_nodo: str, tiempo: float):
    """Registra el tiempo de ejecuci√≥n de un nodo"""
    if nombre_nodo not in metricas["tiempo_por_nodo"]:
        metricas["tiempo_por_nodo"][nombre_nodo] = []
    metricas["tiempo_por_nodo"][nombre_nodo].append(tiempo)

def imprimir_metricas(metricas: Dict):
    """Imprime un resumen de las m√©tricas"""
    tiempo_total = time.time() - metricas["inicio_tiempo"]
    print(f"\n{'='*60}")
    print(f"üìä M√âTRICAS DE EJECUCI√ìN")
    print(f"{'='*60}")
    print(f"‚è±Ô∏è  Tiempo total: {tiempo_total:.2f}s")
    print(f"ü§ñ Llamadas LLM: {metricas['llamadas_llm']}")
    print(f"‚ùå Errores LLM: {metricas['errores_llm']}")
    print(f"üîÑ Reintentos: {metricas['reintentos']}")
    print(f"üéØ Respuestas especiales detectadas: {metricas['respuestas_especiales_detectadas']}")
    print(f"üîß C√≥digos corregidos: {metricas['codigos_corregidos']}")
    
    if metricas["tiempo_por_nodo"]:
        print(f"\n‚è±Ô∏è  Tiempo por nodo:")
        for nodo, tiempos in metricas["tiempo_por_nodo"].items():
            promedio = sum(tiempos) / len(tiempos)
            total = sum(tiempos)
            print(f"   ‚Ä¢ {nodo}: {promedio:.2f}s promedio ({total:.2f}s total, {len(tiempos)} ejecuciones)")

print("‚úÖ Utilidades y mejoras cargadas")


‚úÖ Utilidades y mejoras cargadas


In [17]:
import os
import sys
from pathlib import Path
from datetime import datetime
from typing import TypedDict, List, Dict, Literal, Optional
import pandas as pd
import time

# Configurar paths
project_root = Path.cwd().parent
sys.path.append(str(project_root / "backend" / "src"))

# Cargar variables de entorno
from dotenv import load_dotenv
load_dotenv(project_root / ".env")

# Verificar API key
assert os.getenv("OPENAI_API_KEY"), "‚ùå Falta OPENAI_API_KEY en .env"

# Imports de LangChain
from langgraph.graph import StateGraph, END
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from pydantic import BaseModel, Field

print("‚úÖ Setup completo")
print(f"üìÇ Ruta del proyecto: {project_root}")


‚úÖ Setup completo
üìÇ Ruta del proyecto: c:\Users\ivan\Documents\cod-script


In [18]:
# CONFIGURACI√ìN
ARCHIVO_RESPUESTAS = project_root / "temp" / "P2 - copia.xlsx"
USAR_CATALOGO_HISTORICO = False
ARCHIVO_CATALOGO = project_root / "result" / "modelos" / "catalogo_propuestos.xlsx"
MAX_RESPUESTAS = None
BATCH_SIZE = 10

# üÜï MODO DATO AUXILIAR (Din√°mico - sin categor√≠as hardcodeadas)
# Formato del archivo con dato auxiliar:
# - Columna 1: ID
# - Columna 2: Pregunta (opcional, para referencia)
# - Columna 3: Respuesta abierta
# - Columna 4: Dato auxiliar (categor√≠a - puede ser cualquier valor: "Desconfianza", "Felicidad", "Categor√≠a A", etc.)
# 
# El sistema identificar√° autom√°ticamente las categor√≠as desde el dato auxiliar y generar√°
# c√≥digos secuenciales independientes para cada categor√≠a.
USAR_DATO_AUXILIAR = False  # Cambiar a True si el archivo tiene datos auxiliares

# Modelos disponibles: "gpt-5", "gpt-4o", "gpt-4o-mini", "gpt-4-turbo"
MODELO_GPT = "gpt-5"  # üÜï GPT-5 disponible desde 2025

# C√ìDIGOS ESPECIALES (siempre disponibles)
CODIGOS_ESPECIALES = [
    {"codigo": 90, "descripcion": "Ninguno", "seccion": None, "seccion_clave": None},
    {"codigo": 91, "descripcion": "No Recuerda", "seccion": None, "seccion_clave": None},
    {"codigo": 92, "descripcion": "No Sabe", "seccion": None, "seccion_clave": None},
    {"codigo": 93, "descripcion": "No Responde", "seccion": None, "seccion_clave": None},
    {"codigo": 94, "descripcion": "Cualquiera", "seccion": None, "seccion_clave": None},
    {"codigo": 95, "descripcion": "Todos", "seccion": None, "seccion_clave": None},
    {"codigo": 96, "descripcion": "No Aplica", "seccion": None, "seccion_clave": None},
    {"codigo": 97, "descripcion": "Ning√∫n Otro", "seccion": None, "seccion_clave": None},
    {"codigo": 98, "descripcion": "Nada", "seccion": None, "seccion_clave": None}
]

print(f"üìÑ Archivo: {ARCHIVO_RESPUESTAS.name}")
print(f"üìö Cat√°logo: {'‚úÖ S√≠' if USAR_CATALOGO_HISTORICO else '‚ùå No'}")
print(f"ü§ñ Modelo: {MODELO_GPT}")
print(f"üî¢ C√≥digos especiales: {len(CODIGOS_ESPECIALES)} (90-98)")

üìÑ Archivo: P2 - copia.xlsx
üìö Cat√°logo: ‚ùå No
ü§ñ Modelo: gpt-5
üî¢ C√≥digos especiales: 9 (90-98)


In [19]:
def cargar_respuestas(archivo_excel, max_respuestas=None):
    """
    Carga respuestas del Excel
    
    Formato:
    - Primera columna = ID
    - Segunda columna = Respuestas
    """
    df = pd.read_excel(archivo_excel)
    
    # Primera columna = ID
    columna_id = df.columns[0]
    # Segunda columna = Respuestas
    columna_respuestas = df.columns[1]
    nombre_pregunta = columna_respuestas
    
    respuestas = []
    for idx, row in df.iterrows():
        texto = str(row[columna_respuestas]).strip()
        if texto and texto.lower() not in ['nan', 'none', '-', '.']:
            # Obtener ID de la primera columna
            id_valor = row[columna_id]
            if pd.isna(id_valor):
                id_valor = idx + 1
            
            respuestas.append({
                "id": id_valor,
                "fila_excel": idx + 2,
                "texto": texto
            })
        
        if max_respuestas and len(respuestas) >= max_respuestas:
            break
    
    return respuestas, nombre_pregunta

def cargar_catalogo(archivo_catalogo, nombre_pregunta):
    """Carga cat√°logo hist√≥rico de la hoja que coincida con el nombre"""
    try:
        # Intentar cargar el archivo
        excel_file = pd.ExcelFile(archivo_catalogo)
        hojas_disponibles = excel_file.sheet_names
        
        print(f"\nüìö Hojas disponibles en cat√°logo:")
        for hoja in hojas_disponibles:
            print(f"   ‚Ä¢ {hoja}")
        
        # Buscar hoja que coincida con la pregunta
        hoja_encontrada = None
        
        # B√∫squeda exacta
        if nombre_pregunta in hojas_disponibles:
            hoja_encontrada = nombre_pregunta
        else:
            # B√∫squeda flexible (normalizar nombres)
            nombre_norm = nombre_pregunta.lower().strip()
            for hoja in hojas_disponibles:
                hoja_norm = hoja.lower().strip()
                if nombre_norm in hoja_norm or hoja_norm in nombre_norm:
                    hoja_encontrada = hoja
                    break
        
        if not hoja_encontrada:
            print(f"\n‚ö†Ô∏è  No se encontr√≥ hoja para: '{nombre_pregunta}'")
            return []
        
        print(f"\n‚úÖ Usando hoja: '{hoja_encontrada}'")
        
        # Cargar cat√°logo
        df = pd.read_excel(archivo_catalogo, sheet_name=hoja_encontrada)
        
        if 'COD' not in df.columns or 'TEXTO' not in df.columns:
            print(f"‚ö†Ô∏è  Hoja sin columnas COD/TEXTO")
            return []
        
        catalogo = []
        for _, row in df.iterrows():
            if pd.notna(row['COD']) and pd.notna(row['TEXTO']):
                codigo = int(row['COD'])
                # Evitar duplicar c√≥digos especiales
                if codigo not in [c["codigo"] for c in CODIGOS_ESPECIALES]:
                    catalogo.append({
                        "codigo": codigo,
                        "descripcion": str(row['TEXTO']).strip()
                    })
        
        # SIEMPRE agregar c√≥digos especiales al final
        catalogo.extend(CODIGOS_ESPECIALES)
        
        print(f"‚úÖ Cat√°logo cargado: {len(catalogo)} c√≥digos (incluye {len(CODIGOS_ESPECIALES)} c√≥digos especiales)")
        return catalogo
        
    except Exception as e:
        print(f"\n‚ùå Error al cargar cat√°logo: {str(e)}")
        return []

# Cargar datos
respuestas_reales, nombre_pregunta = cargar_respuestas(ARCHIVO_RESPUESTAS, MAX_RESPUESTAS)
print(f"‚úÖ Respuestas cargadas: {len(respuestas_reales)}")
print(f"‚úÖ Pregunta: {nombre_pregunta}")

if USAR_CATALOGO_HISTORICO:
    catalogo_historico = cargar_catalogo(ARCHIVO_CATALOGO, nombre_pregunta)
    print(f"‚úÖ Cat√°logo: {len(catalogo_historico)} c√≥digos")
else:
    catalogo_historico = []
    print("‚ö†Ô∏è  Sin cat√°logo hist√≥rico")

# SIEMPRE agregar c√≥digos especiales al cat√°logo (aunque no haya cat√°logo hist√≥rico)
# Evitar duplicados si ya est√°n en el cat√°logo
codigos_existentes = {c["codigo"] for c in catalogo_historico}
for cod_esp in CODIGOS_ESPECIALES:
    if cod_esp["codigo"] not in codigos_existentes:
        catalogo_historico.append(cod_esp.copy())
        codigos_existentes.add(cod_esp["codigo"])

print(f"‚úÖ Cat√°logo final: {len(catalogo_historico)} c√≥digos (incluye c√≥digos especiales 90-98)")

‚úÖ Respuestas cargadas: 14
‚úÖ Pregunta: P2
‚ö†Ô∏è  Sin cat√°logo hist√≥rico
‚úÖ Cat√°logo final: 9 c√≥digos (incluye c√≥digos especiales 90-98)


In [20]:
# ESQUEMAS PYDANTIC V3

# 1Ô∏è‚É£ Validaci√≥n
class ValidacionRespuesta(BaseModel):
    respuesta_id: int
    es_valida: bool
    razon: str

class ResultadoValidacion(BaseModel):
    validaciones: List[ValidacionRespuesta]

# 2Ô∏è‚É£ Evaluaci√≥n Booleana (NUEVO)
class EvaluacionCodigo(BaseModel):
    codigo: int
    aplica: bool  # True/False expl√≠cito
    confianza: float = Field(ge=0.0, le=1.0)

class EvaluacionCatalogo(BaseModel):
    respuesta_id: int
    evaluaciones: List[EvaluacionCodigo]

class ResultadoEvaluacion(BaseModel):
    evaluaciones: List[EvaluacionCatalogo]

# 3Ô∏è‚É£ An√°lisis de Cobertura (NUEVO)
class ConceptoNuevo(BaseModel):
    codigo: int  # ID num√©rico secuencial
    descripcion: str
    texto_original: str

class AnalisisCobertura(BaseModel):
    respuesta_id: int
    respuesta_cubierta_completamente: bool
    conceptos_nuevos: List[ConceptoNuevo] = Field(default_factory=list)

class ResultadoCobertura(BaseModel):
    analisis: List[AnalisisCobertura]

# 4Ô∏è‚É£ Justificaci√≥n
class Justificacion(BaseModel):
    respuesta_id: int
    justificacion: str

class ResultadoJustificacion(BaseModel):
    justificaciones: List[Justificacion]

print("‚úÖ Esquemas Pydantic V3 definidos")

‚úÖ Esquemas Pydantic V3 definidos


In [21]:
# NODO 1: VALIDAR (con detecci√≥n temprana de c√≥digos especiales)
def nodo_validar(state):
    inicio_tiempo = time.time()
    print(f"\n‚úÖ Validando {len(state['batch_respuestas'])} respuestas...")
    
    # üÜï MEJORA: Detecci√≥n temprana de c√≥digos especiales
    respuestas_para_validar = []
    respuestas_especiales = {}  # respuesta_id -> codigo_especial
    
    for i, resp in enumerate(state["batch_respuestas"]):
        codigo_especial = detectar_codigo_especial(resp["texto"])
        if codigo_especial:
            respuestas_especiales[i + 1] = codigo_especial
            # Actualizar m√©tricas
            if "metricas" in state:
                state["metricas"]["respuestas_especiales_detectadas"] += 1
            print(f"   üéØ Respuesta {i+1} detectada como c√≥digo especial {codigo_especial}")
        else:
            respuestas_para_validar.append((i, resp))
    
    # Si todas son especiales, crear validaciones directamente
    if not respuestas_para_validar:
        validaciones = []
        for i, resp in enumerate(state["batch_respuestas"]):
            codigo_esp = respuestas_especiales.get(i + 1)
            validaciones.append({
                "respuesta_id": i + 1,
                "es_valida": True,  # Las especiales son v√°lidas
                "razon": f"C√≥digo especial {codigo_esp} detectado autom√°ticamente"
            })
        
        tiempo_nodo = time.time() - inicio_tiempo
        if "metricas" in state:
            registrar_tiempo_nodo(state["metricas"], "validar", tiempo_nodo)
        
        return {
            **state,
            "validaciones_batch": validaciones,
            "respuestas_especiales": respuestas_especiales  # Guardar para usar despu√©s
        }
    
    # Validar las que no son especiales con LLM
    respuestas_str = "\n".join([
        f"{i+1}. {r['texto']}"
        for i, r in respuestas_para_validar
    ])
    
    prompt = ChatPromptTemplate.from_messages([
        ("system", """Eres un experto en filtrar respuestas de encuestas.

RECHAZAR si:
- Est√° vac√≠a o solo tiene \"-\" o \".\"
- Es incomprensible
- No responde a la pregunta

ACEPTAR si tiene contenido relevante. Responde en JSON."""),
        ("user", "PREGUNTA: {pregunta}\n\nRESPUESTAS:\n{respuestas}")
    ])
    
    llm = ChatOpenAI(model=state["modelo_gpt"], temperature=0)
    chain = prompt | llm.with_structured_output(ResultadoValidacion)
    
    # üÜï MEJORA: Usar retry
    try:
        if "metricas" in state:
            state["metricas"]["llamadas_llm"] += 1
        resultado = llamada_llm_con_retry(chain, {
            "pregunta": state["pregunta"],
            "respuestas": respuestas_str
        })
    except Exception as e:
        if "metricas" in state:
            state["metricas"]["errores_llm"] += 1
        print(f"   ‚ùå Error en validaci√≥n: {e}")
        raise
    
    # Combinar validaciones: especiales + LLM
    validaciones = []
    idx_llm = 0
    for i, resp in enumerate(state["batch_respuestas"]):
        if (i + 1) in respuestas_especiales:
            validaciones.append({
                "respuesta_id": i + 1,
                "es_valida": True,
                "razon": f"C√≥digo especial {respuestas_especiales[i+1]} detectado autom√°ticamente"
            })
        else:
            validaciones.append(resultado.validaciones[idx_llm].model_dump())
            idx_llm += 1
    
    validas = sum(1 for v in validaciones if v["es_valida"])
    print(f"   ‚úÖ V√°lidas: {validas}/{len(validaciones)}")
    
    tiempo_nodo = time.time() - inicio_tiempo
    if "metricas" in state:
        registrar_tiempo_nodo(state["metricas"], "validar", tiempo_nodo)
    
    return {
        **state,
        "validaciones_batch": validaciones,
        "respuestas_especiales": respuestas_especiales
    }

print("‚úÖ Nodo validar definido")

‚úÖ Nodo validar definido


In [22]:
# NODO 2: EVALUAR_CATALOGO (BOOLEANO EXHAUSTIVO)
def nodo_evaluar_catalogo_v3(state):
    validas = [
        (i, resp) 
        for i, (resp, val) in enumerate(zip(
            state["batch_respuestas"],
            state["validaciones_batch"]
        ))
        if val["es_valida"]
    ]
    
    if not validas or not state["catalogo"]:
        print(f"   ‚ö†Ô∏è  Sin respuestas v√°lidas o sin cat√°logo")
        return {**state, "evaluaciones_batch": []}
    
    print(f"\nüìä Evaluando cat√°logo para {len(validas)} respuestas...")
    
    respuestas_str = "\n".join([f"{idx+1}. {resp['texto']}" for idx, resp in validas])
    
    # Separar c√≥digos especiales del resto
    codigos_normales = [c for c in state["catalogo"] if c["codigo"] < 90]
    codigos_especiales = [c for c in state["catalogo"] if c["codigo"] >= 90]
    
    # Limitar c√≥digos normales a 30 para no saturar el prompt
    catalogo_str = "\n".join([
        f"  {c['codigo']}. {c['descripcion']}"
        for c in codigos_normales[:30]
    ])
    
    # Siempre incluir c√≥digos especiales completos
    if codigos_especiales:
        catalogo_str += "\n\n**C√ìDIGOS ESPECIALES (90-98):**\n"
        catalogo_str += "\n".join([
            f"  {c['codigo']}. {c['descripcion']}"
            for c in codigos_especiales
        ])
    
    prompt = ChatPromptTemplate.from_messages([
        ("system", f"""Eres un experto en codificaci√≥n de respuestas de encuestas.

CAT√ÅLOGO HIST√ìRICO:
{catalogo_str}

**TU TAREA:**
Para CADA respuesta, eval√∫a CADA c√≥digo del cat√°logo:
- aplica = True: Si el c√≥digo describe el contenido de la respuesta
- aplica = False: Si NO es relevante
- confianza: 0.0 a 1.0 (qu√© tan seguro est√°s)

**REGLAS DE EVALUACI√ìN:**

1. **Considera el nivel de especificidad del c√≥digo:**
   - Los c√≥digos son GENERALES pero CLAROS
   - Ejemplo: Si el c√≥digo dice "Apto para diabetes", aplica a respuestas que mencionen diabetes, endulzante para diab√©ticos, etc.
   - NO busques coincidencias exactas de palabras, busca la IDEA CENTRAL

2. **Una respuesta puede tener m√∫ltiples c√≥digos aplicables:**
   - Si la respuesta toca varios temas del cat√°logo, marca aplica=True para TODOS los relevantes
   - Ejemplo: "Es apto para diabetes y no tiene calor√≠as" ‚Üí aplica=True para "Apto para diabetes" Y "Sin calor√≠as"

3. **Confianza:**
   - 0.95-1.0: Coincidencia clara y directa (SOLO estos se aplicar√°n)
   - 0.85-0.94: Coincidencia probable pero con alguna variaci√≥n (NO se aplicar√°n)
   - <0.85: No aplica (marca aplica=False)

4. **S√© MUY CONSERVADOR:**
   - Solo marca aplica=True si est√°s MUY seguro (confianza >= 0.95)
   - Precisi√≥n > Cobertura: Mejor dejar sin c√≥digo que asignar incorrecto
   - El umbral de confianza es ALTO (0.95) para asegurar asignaciones correctas

5. **C√ìDIGOS ESPECIALES (90-98):**
   - Usa estos c√≥digos cuando la respuesta indique:
     * 90 "Ninguno": La respuesta dice "ninguno", "ninguna", "nada de eso"
     * 91 "No Recuerda": La respuesta dice "no recuerdo", "no me acuerdo"
     * 92 "No Sabe": La respuesta dice "no s√©", "no conozco", "no tengo idea"
     * 93 "No Responde": La respuesta est√° vac√≠a, es "-", ".", o no responde
     * 94 "Cualquiera": La respuesta dice "cualquiera", "cualquier", "da igual"
     * 95 "Todos": La respuesta dice "todos", "todas", "todos los"
     * 96 "No Aplica": La respuesta indica que la pregunta no aplica a su caso
     * 97 "Ning√∫n Otro": La respuesta dice "ning√∫n otro", "ninguna otra"
     * 98 "Nada": La respuesta dice "nada", "nada m√°s", "nada en particular"
   - Estos c√≥digos pueden aplicarse SOLOS o junto con otros c√≥digos seg√∫n el contexto

Eval√∫a TODOS los c√≥digos para TODAS las respuestas.
Responde en JSON."""),
        ("user", "PREGUNTA: {pregunta}\n\nRESPUESTAS:\n{respuestas}")
    ])
    
    llm = ChatOpenAI(model=state["modelo_gpt"], temperature=0)
    chain = prompt | llm.with_structured_output(ResultadoEvaluacion)
    
    # üÜï MEJORA: Usar retry y m√©tricas
    inicio_tiempo = time.time()
    try:
        if "metricas" in state:
            state["metricas"]["llamadas_llm"] += 1
        resultado = llamada_llm_con_retry(chain, {
            "pregunta": state["pregunta"],
            "respuestas": respuestas_str
        })
    except Exception as e:
        if "metricas" in state:
            state["metricas"]["errores_llm"] += 1
        print(f"   ‚ùå Error en evaluaci√≥n: {e}")
        raise
    
    matches = sum(
        1 for ev in resultado.evaluaciones
        for cod in ev.evaluaciones
        if cod.aplica and cod.confianza >= 0.95
    )
    
    print(f"   ‚úÖ Matches (confianza >= 0.95): {matches}")
    
    tiempo_nodo = time.time() - inicio_tiempo
    if "metricas" in state:
        registrar_tiempo_nodo(state["metricas"], "evaluar_catalogo", tiempo_nodo)
    
    return {
        **state,
        "evaluaciones_batch": [ev.model_dump() for ev in resultado.evaluaciones]
    }

print("‚úÖ Nodo evaluar_catalogo_v3 definido")

‚úÖ Nodo evaluar_catalogo_v3 definido


In [23]:
# NODO 3: IDENTIFICAR_CONCEPTOS_NUEVOS (DETECTAR GAPS)
def nodo_identificar_conceptos_v3(state):
    # Obtener TODAS las respuestas v√°lidas (con o sin cat√°logo)
    validas_con_eval = []
    
    for i, (resp, val) in enumerate(zip(
        state["batch_respuestas"],
        state["validaciones_batch"]
    )):
        if not val["es_valida"]:
            continue
        
        resp_id = i + 1
        
        # Buscar evaluaci√≥n (puede estar vac√≠o si no hay cat√°logo)
        evaluacion = next(
            (ev for ev in state["evaluaciones_batch"] if ev["respuesta_id"] == resp_id),
            None
        )
        
        if evaluacion:
            # Hay cat√°logo: obtener c√≥digos aplicados (solo con confianza >= 0.95)
            codigos_aplicados = [
                cod["codigo"] for cod in evaluacion["evaluaciones"]
                if cod["aplica"] and cod["confianza"] >= 0.95
            ]
        else:
            # NO hay cat√°logo o no hay evaluaci√≥n: c√≥digos_asignados = []
            codigos_aplicados = []
        
        # SIEMPRE agregar la respuesta v√°lida (con o sin c√≥digos hist√≥ricos)
        validas_con_eval.append({
            "respuesta_id": resp_id,
            "texto": resp["texto"],
            "codigos_asignados": codigos_aplicados
        })
    
    if not validas_con_eval:
        print(f"   ‚ö†Ô∏è  Sin respuestas v√°lidas")
        return {**state, "cobertura_batch": []}
    
    # Usar el contador global de c√≥digos nuevos
    codigo_base = state["proximo_codigo_nuevo"]
    
    print(f"\nüîç Analizando cobertura para {len(validas_con_eval)} respuestas...")
    print(f"   (C√≥digos nuevos empezar√°n desde: {codigo_base})")
    
    # Recolectar c√≥digos ya creados en batches anteriores para evitar duplicados
    codigos_ya_creados = {}
    if state.get("codificaciones"):
        for cod in state["codificaciones"]:
            if cod.get("codigos_nuevos"):
                for nuevo in cod["codigos_nuevos"]:
                    cod_id = nuevo.get("codigo")
                    desc = nuevo.get("descripcion", "")
                    if cod_id and desc:
                        codigos_ya_creados[cod_id] = desc
    
    # Construir string de c√≥digos ya creados para el prompt
    codigos_existentes_str = ""
    if codigos_ya_creados:
        codigos_existentes_str = "\n**C√ìDIGOS NUEVOS YA CREADOS EN BATCHES ANTERIORES:**\n"
        for cod_id in sorted(codigos_ya_creados.keys()):
            codigos_existentes_str += f"  {cod_id}: {codigos_ya_creados[cod_id]}\n"
        codigos_existentes_str += "\n**IMPORTANTE:** Si encuentras un concepto similar a uno de estos, NO crees un c√≥digo nuevo. El sistema los agrupar√° despu√©s.\n"
    
    respuestas_str = ""
    for item in validas_con_eval:
        resp_id = item["respuesta_id"]
        texto = item["texto"]
        codigos = item["codigos_asignados"]
        
        if codigos and state["catalogo"]:
            # Hay c√≥digos asignados: mostrar descripciones
            descrips = []
            for cod_id in codigos:
                desc = next(
                    (c["descripcion"] for c in state["catalogo"] if c["codigo"] == cod_id),
                    f"C√≥digo {cod_id}"
                )
                descrips.append(f"[{cod_id}: {desc}]")
            
            respuestas_str += f"{resp_id}. \"{texto}\"\n   C√≥digos asignados: {', '.join(descrips)}\n\n"
        else:
            # NO hay c√≥digos: toda la respuesta necesita c√≥digos nuevos
            respuestas_str += f"{resp_id}. \"{texto}\"\n   C√≥digos asignados: NINGUNO (generar c√≥digos para TODA la respuesta)\n\n"
    
    prompt = ChatPromptTemplate.from_messages([
        ("system", f"""Eres un experto en codificaci√≥n de respuestas de encuestas de opini√≥n p√∫blica.

**PREGUNTA DE LA ENCUESTA:**
{{pregunta}}

**PROCESO DE TRABAJO - SEGUIR EN ESTE ORDEN:**

**PASO 1: LEE TODAS LAS RESPUESTAS PRIMERO**
- Antes de crear cualquier c√≥digo, lee y analiza TODAS las respuestas del batch
- Identifica los conceptos √∫nicos que aparecen en todas las respuestas
- NO crees c√≥digos de forma aislada para cada respuesta
- Compara conceptos entre respuestas para identificar duplicados

**PASO 2: IDENTIFICA CONCEPTOS √öNICOS Y AGR√öPALOS**
- Agrupa respuestas que mencionan el mismo concepto
- Ejemplo: Si varias respuestas mencionan "saludable", "es saludable", "muy saludable" ‚Üí Es el MISMO concepto ‚Üí UN SOLO c√≥digo
- Ejemplo: Si varias respuestas mencionan "apto para diabetes", "para diab√©ticos", "endulzante para personas con diabetes" ‚Üí Es el MISMO concepto ‚Üí UN SOLO c√≥digo
- **CR√çTICO:** Si ya identificaste un concepto en una respuesta anterior, REUTILIZA ese mismo c√≥digo para respuestas similares

**PASO 3: CREA C√ìDIGOS CON REDACCI√ìN COHERENTE Y √öNICA**
- Asigna UN c√≥digo a cada concepto √∫nico identificado
- La redacci√≥n debe ser COHERENTE: no muy general, no muy espec√≠fica
- ‚úÖ CORRECTO: "Saludable", "Apto para diabetes", "Sin calor√≠as", "Versatilidad de uso"
- ‚ùå MUY GENERAL: "Bueno", "√ötil", "Me gusta"
- ‚ùå MUY ESPEC√çFICO: "Saludable para personas con diabetes tipo 2 que buscan endulzantes naturales", "Versatilidad de uso en comidas y bebidas calientes"

**REGLAS CR√çTICAS DE ESPECIFICIDAD Y UNICIDAD:**

1. **Precisi√≥n > Cobertura** (mejor dejar sin c√≥digo que asignar incorrecto)

2. **Nivel de especificidad - CR√çTICO:**
   - ‚úÖ CORRECTO: "Versatilidad de uso", "Apto para diabetes", "Sin calor√≠as", "Sabor", "Textura"
   - ‚ùå MUY GENERAL: "Bueno", "√ötil", "Me gusta", "Calidad"
   - ‚ùå MUY ESPEC√çFICO: "Versatilidad de uso en comidas", "Apto para personas con diabetes tipo 2", "Sabor dulce natural sin qu√≠micos"
   - **Principio:** Si dos descripciones comparten la MISMA IDEA CENTRAL, deben usar el MISMO c√≥digo

3. **Agrupa bajo el MISMO c√≥digo si:**
   - Comparten el tema/concepto principal
   - Solo difieren en detalles o contexto espec√≠fico
   - Ejemplo: "Sabor agradable", "Buen sabor", "Sabor rico" ‚Üí MISMO c√≥digo "Sabor"
   - Ejemplo: "Apto para diabetes", "Para diab√©ticos", "Endulzante para personas con diabetes" ‚Üí MISMO c√≥digo "Apto para diabetes"

4. **Crea C√ìDIGOS SEPARADOS solo si:**
   - Son temas REALMENTE distintos e independientes
   - No se pueden agrupar bajo una categor√≠a com√∫n
   - Ejemplo: "Sabor" vs "Textura" vs "Precio" ‚Üí Diferentes c√≥digos
   - Ejemplo: "Apto para diabetes" vs "Sin calor√≠as" vs "Versatilidad de uso" ‚Üí Diferentes c√≥digos

5. **Descripciones GENERALES pero CLARAS:**
   - ‚úÖ BIEN: "Precio accesible", "Sabor", "Textura", "Calidad nutricional", "Apto para diabetes", "Sin calor√≠as"
   - ‚ùå MAL: "Precio accesible para familias", "Sabor dulce natural", "Textura suave", "Apto para personas con diabetes tipo 2"
   - Usa el nivel de abstracci√≥n del cat√°logo hist√≥rico como referencia (si existe)

6. **NO uses frases como:** "Menci√≥n sobre...", "Referencias a...", "Menciones de...", "Percepci√≥n de..."

7. **UNICIDAD Y REUTILIZACI√ìN - CR√çTICO:**
   - Cada c√≥digo = Un concepto √∫nico
   - Si encuentras el mismo concepto en m√∫ltiples respuestas, REUTILIZA el mismo c√≥digo
   - NO crees c√≥digos diferentes para el mismo concepto con diferentes redacciones
   - **Ejemplo PROHIBIDO:** NO crees c√≥digo {codigo_base} para "Saludable" y luego c√≥digo {codigo_base + 1} para "Es saludable" o c√≥digo {codigo_base + 2} para "Muy saludable"
   - **TODOS deben usar el MISMO c√≥digo {codigo_base} con la MISMA descripci√≥n "Saludable"**

8. **COHERENCIA EN LA REDACCI√ìN:**
   - Si ya creaste un c√≥digo para un concepto, usa la MISMA redacci√≥n para ese concepto en todas las respuestas
   - NO crees c√≥digos diferentes con redacciones diferentes para el mismo concepto
   - Mant√©n consistencia: misma descripci√≥n = mismo c√≥digo

**FORMATO DE C√ìDIGOS:**
- codigo: N√∫mero secuencial √öNICO empezando desde {codigo_base}
- descripcion: Descripci√≥n COHERENTE (equilibrio entre general y espec√≠fico)
- texto_original: Fragmento del texto que justifica el c√≥digo

**SECUENCIALIDAD:**
- Primer c√≥digo nuevo: {codigo_base}
- Segundo c√≥digo nuevo: {codigo_base + 1}
- Tercer c√≥digo nuevo: {codigo_base + 2}
- etc.

**DECISIONES:**
- Si NO hay c√≥digos asignados: respuesta_cubierta_completamente=False, generar c√≥digos
- Si hay c√≥digos pero faltan conceptos: respuesta_cubierta_completamente=False, agregar c√≥digos
- Si est√° completamente cubierta: respuesta_cubierta_completamente=True, conceptos_nuevos=[]
- Puedes generar M√öLTIPLES c√≥digos por respuesta si toca temas distintos

**RECORDATORIO CR√çTICO - LEE ANTES DE RESPONDER:**
1. LEE TODAS LAS RESPUESTAS PRIMERO (no crees c√≥digos aislados)
2. IDENTIFICA CONCEPTOS √öNICOS (agrupa similares bajo el mismo c√≥digo)
3. CREA UN C√ìDIGO POR CONCEPTO √öNICO (no repitas c√≥digos con el mismo texto)
4. REUTILIZA EL MISMO C√ìDIGO para el mismo concepto en diferentes respuestas
5. MANT√âN COHERENCIA en la redacci√≥n (misma descripci√≥n para el mismo concepto)
6. NO crees c√≥digos diferentes para variaciones del mismo concepto (ej: "Saludable", "Es saludable", "Muy saludable" ‚Üí TODOS el mismo c√≥digo)

Responde en JSON."""),
        ("user", "PREGUNTA: {pregunta}\n{codigos_existentes}RESPUESTAS:\n{respuestas}")
    ])
    
    llm = ChatOpenAI(model=state["modelo_gpt"], temperature=0)
    chain = prompt | llm.with_structured_output(ResultadoCobertura)
    
    # üÜï MEJORA: Usar retry y m√©tricas
    inicio_tiempo = time.time()
    try:
        if "metricas" in state:
            state["metricas"]["llamadas_llm"] += 1
        resultado = llamada_llm_con_retry(chain, {
            "pregunta": state["pregunta"],
            "codigos_existentes": codigos_existentes_str,
            "respuestas": respuestas_str
        })
    except Exception as e:
        if "metricas" in state:
            state["metricas"]["errores_llm"] += 1
        print(f"   ‚ùå Error en identificaci√≥n: {e}")
        raise
    
    # üÜï MEJORA: Deduplicaci√≥n autom√°tica como respaldo (solo si el modelo no lo hizo bien)
    # Recolectar TODOS los conceptos del batch
    todos_conceptos_batch = []
    for analisis in resultado.analisis:
        for concepto in analisis.conceptos_nuevos:
            concepto_dict = concepto.model_dump()
            concepto_dict["_respuesta_id"] = analisis.respuesta_id
            todos_conceptos_batch.append(concepto_dict)
    
    # Detectar duplicados obvios (descripciones id√©nticas o muy similares)
    grupos_similares = {}  # descripcion_normalizada -> lista de conceptos
    for concepto in todos_conceptos_batch:
        desc = concepto.get("descripcion", "")
        desc_norm = normalizar_texto(desc)
        
        # Buscar si ya existe un grupo similar
        encontrado = False
        for desc_existente, grupo in grupos_similares.items():
            if son_conceptos_similares(desc, desc_existente):
                grupo.append(concepto)
                encontrado = True
                break
        
        if not encontrado:
            grupos_similares[desc_norm] = [concepto]
    
    # Crear mapeo solo para duplicados obvios (descripciones id√©nticas o casi id√©nticas)
    mapeo_deduplicacion = {}  # descripcion_normalizada -> codigo_unificado
    codigo_unificado = codigo_base
    descripciones_finales = {}  # codigo_unificado -> descripcion_final
    
    duplicados_detectados = 0
    for desc_norm, grupo in grupos_similares.items():
        # Solo agrupar si hay m√°s de un concepto (duplicado obvio)
        if len(grupo) > 1:
            # Usar la descripci√≥n m√°s corta como representante
            desc_final = min(grupo, key=lambda x: len(x.get("descripcion", ""))).get("descripcion", "")
            mapeo_deduplicacion[desc_norm] = codigo_unificado
            descripciones_finales[codigo_unificado] = desc_final
            
            duplicados_detectados += len(grupo) - 1
            descs_originales = [c.get("descripcion", "") for c in grupo]
            print(f"   üîó Agrupando {len(grupo)} conceptos similares bajo c√≥digo {codigo_unificado}: {desc_final}")
            print(f"      Originales: {', '.join(set(descs_originales))}")
            
            codigo_unificado += 1
        else:
            # Concepto √∫nico, mantener su c√≥digo original
            concepto = grupo[0]
            cod_orig = concepto.get("codigo", codigo_unificado)
            mapeo_deduplicacion[desc_norm] = cod_orig
            descripciones_finales[cod_orig] = concepto.get("descripcion", "")
            codigo_unificado = max(codigo_unificado, cod_orig + 1)
    
    if duplicados_detectados > 0:
        print(f"   ‚úÖ Duplicados detectados y agrupados: {duplicados_detectados}")
    
    # Aplicar deduplicaci√≥n solo a duplicados obvios
    analisis_corregidos = []
    codigo_actual = codigo_base

    for analisis in resultado.analisis:
        conceptos_nuevos = [c.model_dump() for c in analisis.conceptos_nuevos]

        # Aplicar deduplicaci√≥n solo si hay duplicados obvios
        conceptos_dedup = []
        codigos_vistos = set()

        for concepto in conceptos_nuevos:
            desc = concepto.get("descripcion", "")
            desc_norm = normalizar_texto(desc)

            # Solo aplicar deduplicaci√≥n si est√° en el mapeo (duplicado detectado)
            if desc_norm in mapeo_deduplicacion:
                codigo_final = mapeo_deduplicacion[desc_norm]
                desc_final = descripciones_finales.get(codigo_final, desc)
            else:
                # Mantener c√≥digo original del modelo
                codigo_final = concepto.get("codigo", codigo_actual)
                desc_final = desc

            # Evitar duplicados en la misma respuesta
            if codigo_final not in codigos_vistos:
                codigos_vistos.add(codigo_final)
                concepto_final = {
                    "codigo": codigo_final,
                    "descripcion": desc_final,
                    "texto_original": concepto.get("texto_original", "")
                }
                conceptos_dedup.append(concepto_final)

        # NO volver a renumerar aqu√≠: usamos directamente conceptos_dedup
        analisis_corregidos.append({
            "respuesta_id": analisis.respuesta_id,
            "respuesta_cubierta_completamente": analisis.respuesta_cubierta_completamente,
            "conceptos_nuevos": conceptos_dedup
        })

    # Actualizar el siguiente c√≥digo global: tomar el m√°ximo c√≥digo usado en el batch + 1
    if todos_conceptos_batch:
        max_codigo = max(
            c["codigo"] for c in todos_conceptos_batch
            if c.get("codigo") is not None
        )
        codigo_actual = max(max_codigo + 1, codigo_base)

    cubiertas = sum(1 for a in analisis_corregidos if a["respuesta_cubierta_completamente"])
    con_nuevos = sum(1 for a in analisis_corregidos if len(a["conceptos_nuevos"]) > 0)
    total_conceptos = sum(len(a["conceptos_nuevos"]) for a in analisis_corregidos)

    print(f"   ‚úÖ Completamente cubiertas: {cubiertas}/{len(analisis_corregidos)}")
    print(f"   üÜï Con conceptos nuevos: {con_nuevos}/{len(analisis_corregidos)}")
    print(f"   üÜï Total conceptos nuevos: {total_conceptos}")

    tiempo_nodo = time.time() - inicio_tiempo
    if "metricas" in state:
        registrar_tiempo_nodo(state["metricas"], "identificar_conceptos", tiempo_nodo)

    return {
        **state,
        "cobertura_batch": analisis_corregidos,
        "proximo_codigo_nuevo": codigo_actual  # Actualizar para el siguiente batch
    }

def procesar_grupo_respuestas(respuestas_grupo, state, codigo_base, codigos_historicos_categoria, categoria):
    """
    Procesa un grupo de respuestas (con o sin categor√≠a)
    
    Args:
        respuestas_grupo: Lista de respuestas del mismo grupo
        state: Estado del grafo
        codigo_base: C√≥digo base para empezar a generar c√≥digos nuevos
        codigos_historicos_categoria: C√≥digos hist√≥ricos relacionados con esta categor√≠a (para referencia)
        categoria: Nombre de la categor√≠a (o None si no hay categor√≠a)
    """
    # Recolectar c√≥digos ya creados en batches anteriores para esta categor√≠a
    codigos_ya_creados = {}
    if state.get("codificaciones"):
        for cod in state["codificaciones"]:
            # Solo incluir c√≥digos de la misma categor√≠a
            if categoria and cod.get("dato_auxiliar") != categoria:
                continue
            if cod.get("codigos_nuevos"):
                for nuevo in cod["codigos_nuevos"]:
                    cod_id = nuevo.get("codigo")
                    desc = nuevo.get("descripcion", "")
                    if cod_id and desc:
                        codigos_ya_creados[cod_id] = desc
    
    # Construir string de c√≥digos ya creados
    codigos_existentes_str = ""
    if codigos_ya_creados:
        codigos_existentes_str = "\n**C√ìDIGOS NUEVOS YA CREADOS EN BATCHES ANTERIORES:**\n"
        for cod_id in sorted(codigos_ya_creados.keys()):
            codigos_existentes_str += f"  {cod_id}: {codigos_ya_creados[cod_id]}\n"
        codigos_existentes_str += "\n**IMPORTANTE:** Si encuentras un concepto similar a uno de estos, NO crees un c√≥digo nuevo. El sistema los agrupar√° despu√©s.\n"
    
    # Construir string de respuestas
    respuestas_str = ""
    for item in respuestas_grupo:
        resp_id = item["respuesta_id"]
        texto = item["texto"]
        codigos = item["codigos_asignados"]
        
        if codigos and state["catalogo"]:
            descrips = []
            for cod_id in codigos:
                desc = next(
                    (c["descripcion"] for c in state["catalogo"] if c["codigo"] == cod_id),
                    f"C√≥digo {cod_id}"
                )
                descrips.append(f"[{cod_id}: {desc}]")
            respuestas_str += f"{resp_id}. \"{texto}\"\n   C√≥digos asignados: {', '.join(descrips)}\n\n"
        else:
            respuestas_str += f"{resp_id}. \"{texto}\"\n   C√≥digos asignados: NINGUNO (generar c√≥digos para TODA la respuesta)\n\n"
    
    # Construir prompt con informaci√≥n de categor√≠a si hay
    info_categoria = ""
    if categoria:
        info_categoria = f"""
**INFORMACI√ìN DE CATEGOR√çA:**
- Esta respuesta pertenece a la categor√≠a: **{categoria}**
- Los c√≥digos nuevos para esta categor√≠a empezar√°n desde: **{codigo_base}**
- Genera c√≥digos secuenciales dentro de esta categor√≠a: {codigo_base}, {codigo_base + 1}, {codigo_base + 2}, etc.
"""
        if codigos_historicos_categoria:
            info_categoria += f"- Hay {len(codigos_historicos_categoria)} c√≥digos hist√≥ricos relacionados con esta categor√≠a (para referencia)\n"
    
    prompt = ChatPromptTemplate.from_messages([
        ("system", f"""Eres un experto en codificaci√≥n de respuestas de encuestas de opini√≥n p√∫blica.

Tu trabajo:
1. Si NO hay c√≥digos asignados ‚Üí Crear c√≥digos para TODA la respuesta
2. Si hay c√≥digos asignados ‚Üí Identificar conceptos NO CUBIERTOS
{info_categoria}
**REGLAS CR√çTICAS DE ESPECIFICIDAD:**

1. **Nivel de especificidad - CR√çTICO:**
   - ‚úÖ CORRECTO: "Versatilidad de uso", "Apto para diabetes", "Sin calor√≠as"
   - ‚ùå INCORRECTO: "Versatilidad de uso en comidas", "Apto para personas con diabetes tipo 2", "Sin calor√≠as adicionales al consumirlo"
   - Principio: Si dos descripciones comparten la MISMA IDEA CENTRAL, deben usar el MISMO c√≥digo

2. **Agrupa bajo el MISMO c√≥digo si:**
   - Comparten el tema/concepto principal
   - Solo difieren en detalles o contexto espec√≠fico
   - Ejemplo: "Sabor agradable", "Buen sabor", "Sabor rico" ‚Üí MISMO c√≥digo "Sabor"
   - Ejemplo: "Apto para diabetes", "Para diab√©ticos", "Endulzante para personas con diabetes" ‚Üí MISMO c√≥digo "Apto para diabetes"

3. **Crea C√ìDIGOS SEPARADOS solo si:**
   - Son temas REALMENTE distintos e independientes
   - No se pueden agrupar bajo una categor√≠a com√∫n
   - Ejemplo: "Sabor" vs "Textura" vs "Precio" ‚Üí Diferentes c√≥digos
   - Ejemplo: "Apto para diabetes" vs "Sin calor√≠as" vs "Versatilidad de uso" ‚Üí Diferentes c√≥digos

4. **Descripciones GENERALES pero CLARAS:**
   - ‚úÖ BIEN: "Precio accesible", "Sabor", "Textura", "Calidad nutricional", "Apto para diabetes", "Sin calor√≠as"
   - ‚ùå MAL: "Precio accesible para familias", "Sabor dulce natural", "Textura suave", "Apto para personas con diabetes tipo 2"

5. **NO uses frases como:** "Menci√≥n sobre...", "Referencias a...", "Menciones de...", "Percepci√≥n de..."

6. **CADA c√≥digo debe ser √öNICO:**
   - Un c√≥digo = Un concepto espec√≠fico
   - NO reutilices el mismo c√≥digo para conceptos diferentes
   - Si encuentras un concepto similar a uno ya creado, REUTILIZA ese c√≥digo

**FORMATO DE C√ìDIGOS:**
- codigo: N√∫mero secuencial √öNICO empezando desde {codigo_base}
- descripcion: Descripci√≥n GENERAL pero CLARA (sin detalles espec√≠ficos)
- texto_original: Fragmento del texto que justifica el c√≥digo

**SECUENCIALIDAD:**
- Primer c√≥digo nuevo: {codigo_base}
- Segundo c√≥digo nuevo: {codigo_base + 1}
- Tercer c√≥digo nuevo: {codigo_base + 2}
- etc.

**DECISIONES:**
- Si NO hay c√≥digos asignados: respuesta_cubierta_completamente=False, generar c√≥digos
- Si hay c√≥digos pero faltan conceptos: respuesta_cubierta_completamente=False, agregar c√≥digos
- Si est√° completamente cubierta: respuesta_cubierta_completamente=True, conceptos_nuevos=[]
- Puedes generar M√öLTIPLES c√≥digos por respuesta si toca temas distintos

**IMPORTANTE:** 
- Revisa si un concepto similar ya fue creado en respuestas anteriores del batch
- Si es similar, REUTILIZA el c√≥digo existente en lugar de crear uno nuevo
- Cada c√≥digo debe representar UN SOLO concepto √∫nico
- NO crees c√≥digos diferentes para variaciones del mismo concepto
- Ejemplo: Si ya creaste c√≥digo {codigo_base} para "Apto para diabetes", NO crees otro c√≥digo para "Para diab√©ticos" o "Endulzante para personas con diabetes"

Responde en JSON."""),
        ("user", "PREGUNTA: {pregunta}\n{codigos_existentes}RESPUESTAS:\n{respuestas}")
    ])
    
    llm = ChatOpenAI(model=state["modelo_gpt"], temperature=0)
    chain = prompt | llm.with_structured_output(ResultadoCobertura)
    
    resultado = chain.invoke({
        "pregunta": state["pregunta"],
        "codigos_existentes": codigos_existentes_str,
        "respuestas": respuestas_str
    })
    
    # Los c√≥digos generados son secuenciales dentro de la categor√≠a
    # No hay validaci√≥n de rangos - el sistema conf√≠a en que el LLM genere c√≥digos correctos
    # Si hay problemas, se pueden ajustar manualmente despu√©s
    
    cubiertas = sum(1 for a in resultado.analisis if a.respuesta_cubierta_completamente)
    con_nuevos = sum(1 for a in resultado.analisis if len(a.conceptos_nuevos) > 0)
    total_conceptos = sum(len(a.conceptos_nuevos) for a in resultado.analisis)
    
    print(f"   ‚úÖ Completamente cubiertas: {cubiertas}/{len(resultado.analisis)}")
    print(f"   üÜï Con conceptos nuevos: {con_nuevos}/{len(resultado.analisis)}")
    print(f"   üÜï Total conceptos nuevos: {total_conceptos}")
    
    return [a.model_dump() for a in resultado.analisis]

print("‚úÖ Nodo identificar_conceptos_v3 definido")

‚úÖ Nodo identificar_conceptos_v3 definido


In [24]:
# NODO 4: JUSTIFICAR
def nodo_justificar_v3(state):
    print(f"\nüìù Generando justificaciones...")
    
    resumen = []
    for i, (resp, val) in enumerate(zip(state["batch_respuestas"], state["validaciones_batch"])):
        resp_id = i + 1
        
        if not val["es_valida"]:
            resumen.append(f"{resp_id}. RECHAZADA: {val['razon']}")
            continue
        
        evaluacion = next((ev for ev in state["evaluaciones_batch"] if ev["respuesta_id"] == resp_id), {"evaluaciones": []})
        codigos_hist = [cod["codigo"] for cod in evaluacion.get("evaluaciones", []) if cod["aplica"] and cod["confianza"] >= 0.95]
        
        cobertura = next((cob for cob in state["cobertura_batch"] if cob["respuesta_id"] == resp_id), {"conceptos_nuevos": []})
        conceptos_nuevos = cobertura.get("conceptos_nuevos", [])
        
        resumen.append(f"{resp_id}. Hist:{len(codigos_hist)} Nuevos:{len(conceptos_nuevos)}")
    
    prompt = ChatPromptTemplate.from_messages([
        ("system", """Genera justificaciones BREVES (1-2 oraciones).
S√© CONCISO. Responde en JSON."""),
        ("user", "DECISIONES:\n{resumen}")
    ])
    
    llm = ChatOpenAI(model=state["modelo_gpt"], temperature=0)
    chain = prompt | llm.with_structured_output(ResultadoJustificacion)
    
    # üÜï MEJORA: Usar retry y m√©tricas
    inicio_tiempo = time.time()
    try:
        if "metricas" in state:
            state["metricas"]["llamadas_llm"] += 1
        resultado = llamada_llm_con_retry(chain, {"resumen": "\n".join(resumen)})
    except Exception as e:
        if "metricas" in state:
            state["metricas"]["errores_llm"] += 1
        print(f"   ‚ùå Error en justificaci√≥n: {e}")
        raise
    
    print(f"   ‚úÖ Justificaciones generadas")
    
    tiempo_nodo = time.time() - inicio_tiempo
    if "metricas" in state:
        registrar_tiempo_nodo(state["metricas"], "justificar", tiempo_nodo)
    
    return {**state, "justificaciones_batch": [j.model_dump() for j in resultado.justificaciones]}

# NODO 5: ENSAMBLAR
def nodo_ensamblar_v3(state):
    print(f"\nüîß Ensamblando resultados...")
    
    codificaciones_batch = []
    
    for i, (resp, val) in enumerate(zip(state["batch_respuestas"], state["validaciones_batch"])):
        resp_id = i + 1
        justif = next((j for j in state["justificaciones_batch"] if j["respuesta_id"] == resp_id), {"justificacion": "Sin justificaci√≥n"})
        
        if not val["es_valida"]:
            codificaciones_batch.append({
                "fila_excel": resp["fila_excel"],
                "texto": resp["texto"],
                "decision": "rechazar",
                "codigos_historicos": [],
                "codigos_nuevos": [],
                "justificacion": justif["justificacion"]
            })
            continue
        
        # üÜï MEJORA: Verificar si tiene c√≥digo especial detectado
        codigo_especial = state.get("respuestas_especiales", {}).get(resp_id)
        
        if codigo_especial:
            # Respuesta con c√≥digo especial detectado autom√°ticamente
            codigos_hist = [codigo_especial]
            codigos_nuevos = []
            decision = "historico"  # Los especiales son hist√≥ricos
        else:
            evaluacion = next((ev for ev in state["evaluaciones_batch"] if ev["respuesta_id"] == resp_id), {"evaluaciones": []})
            codigos_hist = [cod["codigo"] for cod in evaluacion.get("evaluaciones", []) if cod["aplica"] and cod["confianza"] >= 0.95]
            
            cobertura = next((cob for cob in state["cobertura_batch"] if cob["respuesta_id"] == resp_id), {"conceptos_nuevos": []})
            # C√≥digos nuevos con ID y descripci√≥n
            codigos_nuevos = [
                {"codigo": c["codigo"], "descripcion": c["descripcion"]} 
                for c in cobertura.get("conceptos_nuevos", [])
            ]
            
            if codigos_hist and codigos_nuevos:
                decision = "mixto"
            elif codigos_hist:
                decision = "historico"
            elif codigos_nuevos:
                decision = "nuevo"
            else:
                decision = "rechazar"
        
        codificaciones_batch.append({
            "fila_excel": resp["fila_excel"],
            "texto": resp["texto"],
            "decision": decision,
            "codigos_historicos": codigos_hist,
            "codigos_nuevos": codigos_nuevos,
            "justificacion": justif["justificacion"]
        })
    
    decisiones = {}
    for cod in codificaciones_batch:
        dec = cod["decision"]
        decisiones[dec] = decisiones.get(dec, 0) + 1
    
    print(f"   üìä Decisiones: {decisiones}")
    
    return {
        **state,
        "codificaciones": state["codificaciones"] + codificaciones_batch
    }

print("‚úÖ Nodos justificar_v3 y ensamblar_v3 definidos")

‚úÖ Nodos justificar_v3 y ensamblar_v3 definidos


In [25]:
# NODOS AUXILIARES (reutilizamos del notebook 03)
def nodo_preparar_batch(state):
    inicio = state["batch_actual"] * state["batch_size"]
    fin = inicio + state["batch_size"]
    batch = state["respuestas"][inicio:fin]
    return {**state, "batch_respuestas": batch}

def decidir_continuar(state):
    if (state["batch_actual"] + 1) * state["batch_size"] < len(state["respuestas"]):
        return "preparar_batch"
    return "finalizar"

# Estado
class EstadoCodificacionV3(TypedDict):
    pregunta: str
    modelo_gpt: str
    batch_size: int
    respuestas: List[Dict]
    catalogo: List[Dict]
    batch_actual: int
    batch_respuestas: List[Dict]
    codificaciones: List[Dict]
    validaciones_batch: List[Dict]
    evaluaciones_batch: List[Dict]
    cobertura_batch: List[Dict]
    justificaciones_batch: List[Dict]
    proximo_codigo_nuevo: int  # üÜï Contador global de c√≥digos nuevos
    metricas: Dict  # üÜï M√©tricas de ejecuci√≥n
    respuestas_especiales: Dict[int, int]  # üÜï respuesta_id -> codigo_especial

# CONSTRUIR GRAFO V3
workflow_v3 = StateGraph(EstadoCodificacionV3)

workflow_v3.add_node("preparar_batch", nodo_preparar_batch)
workflow_v3.add_node("validar", nodo_validar)
workflow_v3.add_node("evaluar_catalogo", nodo_evaluar_catalogo_v3)
workflow_v3.add_node("identificar_conceptos", nodo_identificar_conceptos_v3)
workflow_v3.add_node("justificar", nodo_justificar_v3)
workflow_v3.add_node("ensamblar", nodo_ensamblar_v3)
workflow_v3.add_node("finalizar", lambda state: {**state, "batch_actual": state["batch_actual"] + 1})

workflow_v3.set_entry_point("preparar_batch")
workflow_v3.add_edge("preparar_batch", "validar")
workflow_v3.add_edge("validar", "evaluar_catalogo")
workflow_v3.add_edge("evaluar_catalogo", "identificar_conceptos")
workflow_v3.add_edge("identificar_conceptos", "justificar")
workflow_v3.add_edge("justificar", "ensamblar")
workflow_v3.add_edge("ensamblar", "finalizar")
workflow_v3.add_conditional_edges(
    "finalizar",
    decidir_continuar,
    {"preparar_batch": "preparar_batch", "finalizar": END}
)

app_v3 = workflow_v3.compile()

print("‚úÖ Grafo V3 compilado")
print("\nüìä Nodos:")
for nodo in app_v3.get_graph().nodes.keys():
    print(f"   ‚Ä¢ {nodo}")

‚úÖ Grafo V3 compilado

üìä Nodos:
   ‚Ä¢ __start__
   ‚Ä¢ preparar_batch
   ‚Ä¢ validar
   ‚Ä¢ evaluar_catalogo
   ‚Ä¢ identificar_conceptos
   ‚Ä¢ justificar
   ‚Ä¢ ensamblar
   ‚Ä¢ finalizar
   ‚Ä¢ __end__


In [26]:
# EJECUTAR GRAFO V3

# Verificar datos antes de ejecutar
print("="*60)
print("üîç VERIFICACI√ìN PRE-EJECUCI√ìN")
print("="*60)
print(f"\nüìä Respuestas cargadas: {len(respuestas_reales)}")
print(f"üìö Cat√°logo hist√≥rico: {len(catalogo_historico)} c√≥digos")
if len(catalogo_historico) == 0:
    print("\n‚ö†Ô∏è  ADVERTENCIA: Sin cat√°logo hist√≥rico!")
    print("   Solo se generar√°n c√≥digos nuevos.")
else:
    print(f"\n‚úÖ Cat√°logo cargado correctamente")
    print(f"   Primeros 3 c√≥digos:")
    for c in catalogo_historico[:3]:
        print(f"   ‚Ä¢ [{c['codigo']}] {c['descripcion']}")

# Calcular l√≠mite de recursi√≥n necesario
batches_esperados = (len(respuestas_reales) + BATCH_SIZE - 1) // BATCH_SIZE
# Cada batch ejecuta ~7 nodos + decisi√≥n = ~8 pasos
# Agregar margen de seguridad 20%
recursion_limit = max(batches_esperados * 10, 100)

print(f"\nüßÆ Batches esperados: {batches_esperados}")
print(f"‚öôÔ∏è  L√≠mite de recursi√≥n: {recursion_limit}")

# Calcular el c√≥digo inicial para nuevos c√≥digos
# üÜï CORRECCI√ìN: Excluir c√≥digos especiales (90-98) del c√°lculo
if catalogo_historico:
    # Solo considerar c√≥digos NO especiales (< 90)
    codigos_normales = [c["codigo"] for c in catalogo_historico if c["codigo"] < 90]
    if codigos_normales:
        proximo_codigo_inicial = max(codigos_normales) + 1
    else:
        # Si solo hay c√≥digos especiales, empezar desde 1
        proximo_codigo_inicial = 1
else:
    proximo_codigo_inicial = 1

print(f"üî¢ C√≥digo inicial para nuevos c√≥digos: {proximo_codigo_inicial}")
print(f"   (C√≥digos especiales 90-98 excluidos del c√°lculo)")

# üÜï MEJORA: Inicializar m√©tricas
metricas = inicializar_metricas()

estado_inicial = {
    "pregunta": nombre_pregunta,
    "modelo_gpt": MODELO_GPT,
    "batch_size": BATCH_SIZE,
    "respuestas": respuestas_reales,
    "catalogo": catalogo_historico,
    "batch_actual": 0,
    "batch_respuestas": [],
    "codificaciones": [],
    "validaciones_batch": [],
    "evaluaciones_batch": [],
    "cobertura_batch": [],
    "justificaciones_batch": [],
    "proximo_codigo_nuevo": proximo_codigo_inicial,
    "metricas": metricas,  # üÜï M√©tricas
    "respuestas_especiales": {}  # üÜï Respuestas especiales detectadas
}

print(f"\n{'='*60}")
print("üöÄ EJECUTANDO GRAFO V3")
print("="*60)
print(f"\nüìä Respuestas: {len(respuestas_reales)}")
print(f"üì¶ Batch size: {BATCH_SIZE}")
print(f"ü§ñ Modelo: {MODELO_GPT}")
print(f"\n{'='*60}\n")

# EJECUTAR con recursion_limit configurado
from langgraph.pregel.main import RunnableConfig

config = RunnableConfig(recursion_limit=recursion_limit)
resultado_final_v3 = app_v3.invoke(estado_inicial, config=config)

print("\n" + "="*60)
print("‚úÖ PROCESO V3 COMPLETADO")
print("="*60)

# Estad√≠sticas
decisiones = {}
for cod in resultado_final_v3["codificaciones"]:
    dec = cod["decision"]
    decisiones[dec] = decisiones.get(dec, 0) + 1

print(f"\nüìä Resultados:")
print(f"   Total respuestas: {len(resultado_final_v3['codificaciones'])}")
print(f"\nüìà Decisiones:")
for decision, cantidad in sorted(decisiones.items(), key=lambda x: -x[1]):
    porcentaje = (cantidad / len(resultado_final_v3['codificaciones'])) * 100
    print(f"   {decision:12} : {cantidad:3} ({porcentaje:.1f}%)")

# Casos mixtos
mixtos = [c for c in resultado_final_v3["codificaciones"] if c["decision"] == "mixto"]
if mixtos:
    print(f"\nüéØ Casos MIXTOS capturados: {len(mixtos)}")
    print(f"   (Respuestas con c√≥digos hist√≥ricos Y nuevos)")

# C√≥digos nuevos generados
nuevos_con_codigos = [c for c in resultado_final_v3["codificaciones"] if c["codigos_nuevos"]]
if nuevos_con_codigos:
    # Recolectar todos los c√≥digos √∫nicos
    codigos_unicos = {}
    for cod in nuevos_con_codigos:
        for nuevo in cod["codigos_nuevos"]:
            cod_id = nuevo["codigo"]
            if cod_id not in codigos_unicos:
                codigos_unicos[cod_id] = nuevo["descripcion"]
    
    print(f"\nüìã C√ìDIGOS NUEVOS GENERADOS: {len(codigos_unicos)}")
    print(f"\n   {'ID':<6} DESCRIPCI√ìN")
    print(f"   {'‚îÄ'*6} {'‚îÄ'*60}")
    for cod_id in sorted(codigos_unicos.keys()):
        print(f"   {cod_id:<6} {codigos_unicos[cod_id]}")
    
    print(f"\n   Total respuestas con c√≥digos nuevos: {len(nuevos_con_codigos)}")

# üÜï MEJORA: Mostrar m√©tricas al final
if "metricas" in resultado_final_v3:
    imprimir_metricas(resultado_final_v3["metricas"])

üîç VERIFICACI√ìN PRE-EJECUCI√ìN

üìä Respuestas cargadas: 14
üìö Cat√°logo hist√≥rico: 9 c√≥digos

‚úÖ Cat√°logo cargado correctamente
   Primeros 3 c√≥digos:
   ‚Ä¢ [90] Ninguno
   ‚Ä¢ [91] No Recuerda
   ‚Ä¢ [92] No Sabe

üßÆ Batches esperados: 2
‚öôÔ∏è  L√≠mite de recursi√≥n: 100
üî¢ C√≥digo inicial para nuevos c√≥digos: 1
   (C√≥digos especiales 90-98 excluidos del c√°lculo)

üöÄ EJECUTANDO GRAFO V3

üìä Respuestas: 14
üì¶ Batch size: 10
ü§ñ Modelo: gpt-5



‚úÖ Validando 10 respuestas...
   üéØ Respuesta 8 detectada como c√≥digo especial 90
   ‚úÖ V√°lidas: 9/10

üìä Evaluando cat√°logo para 9 respuestas...
   ‚úÖ Matches (confianza >= 0.95): 1

üîç Analizando cobertura para 9 respuestas...
   (C√≥digos nuevos empezar√°n desde: 1)
   üîó Agrupando 2 conceptos similares bajo c√≥digo 4: Confianza en la marca
      Originales: Familiaridad con la marca, Confianza en la marca
   ‚úÖ Duplicados detectados y agrupados: 1
   ‚úÖ Completamente cubiertas: 2/9
   üÜï Con conc

In [27]:
# VISUALIZACI√ìN DEL GRAFO V3
print("="*70)
print("üìä DIAGRAMA DEL GRAFO V3")
print("="*70)
print("")
print("Flujo del proceso:")
print("")
print("  START")
print("    ‚Üì")
print("  preparar_batch  ‚Üê [LOOP: toma siguiente grupo de respuestas]")
print("    ‚Üì")
print("  validar  ‚Üí Filtrar respuestas basura")
print("    ‚Üì")
print("  evaluar_catalogo  ‚Üí Evaluar TODOS los c√≥digos (True/False + confianza)")
print("    ‚Üì")
print("  identificar_conceptos  ‚Üí Detectar gaps (qu√© NO est√° cubierto)")
print("    ‚Üì")
print("  justificar  ‚Üí Explicar decisiones")
print("    ‚Üì")
print("  ensamblar  ‚Üí Combinar resultados")
print("    ‚Üì")
print("  finalizar  ‚Üí Incrementar batch_actual")
print("    ‚Üì")
print("  ¬øHay m√°s batches?")
print("    ‚îú‚îÄ S√ç ‚Üí volver a preparar_batch")
print("    ‚îî‚îÄ NO ‚Üí END")
print("")
print("="*70)
print("")
print("üéØ VENTAJA CLAVE DE V3:")
print("")
print("  ‚Ä¢ evaluar_catalogo: Eval√∫a CADA c√≥digo hist√≥rico expl√≠citamente")
print("  ‚Ä¢ identificar_conceptos: Solo genera c√≥digos para conceptos NO cubiertos")
print("  ‚Ä¢ Captura casos MIXTOS: Respuestas que necesitan hist√≥ricos + nuevos")
print("")
print("="*70)

# Diagrama ASCII del grafo
print("\nüìã Diagrama ASCII del grafo:\n")
try:
    print(app_v3.get_graph().draw_ascii())
except ImportError:
    print("‚ö†Ô∏è  Para ver el diagrama ASCII, instala: pip install grandalf")
    print("\nüìä Diagrama simplificado:\n")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ preparar_batch  ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ    validar      ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ  evaluar_catalogo   ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ identificar_conceptos     ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ   justificar    ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ    ensamblar    ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("  ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚ñº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê")
    print("  ‚îÇ   finalizar     ‚îÇ")
    print("  ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò")
    print("           ‚îÇ")
    print("     [loop o END]")

üìä DIAGRAMA DEL GRAFO V3

Flujo del proceso:

  START
    ‚Üì
  preparar_batch  ‚Üê [LOOP: toma siguiente grupo de respuestas]
    ‚Üì
  validar  ‚Üí Filtrar respuestas basura
    ‚Üì
  evaluar_catalogo  ‚Üí Evaluar TODOS los c√≥digos (True/False + confianza)
    ‚Üì
  identificar_conceptos  ‚Üí Detectar gaps (qu√© NO est√° cubierto)
    ‚Üì
  justificar  ‚Üí Explicar decisiones
    ‚Üì
  ensamblar  ‚Üí Combinar resultados
    ‚Üì
  finalizar  ‚Üí Incrementar batch_actual
    ‚Üì
  ¬øHay m√°s batches?
    ‚îú‚îÄ S√ç ‚Üí volver a preparar_batch
    ‚îî‚îÄ NO ‚Üí END


üéØ VENTAJA CLAVE DE V3:

  ‚Ä¢ evaluar_catalogo: Eval√∫a CADA c√≥digo hist√≥rico expl√≠citamente
  ‚Ä¢ identificar_conceptos: Solo genera c√≥digos para conceptos NO cubiertos
  ‚Ä¢ Captura casos MIXTOS: Respuestas que necesitan hist√≥ricos + nuevos


üìã Diagrama ASCII del grafo:

                     +-----------+          
                     | __start__ |          
                     +-----------+          
    

In [None]:
# EXPORTAR RESULTADOS

# Obtener nombre de la pregunta (columna de respuestas)
nombre_pregunta = resultado_final_v3["pregunta"]

# Crear diccionario para mapear fila_excel a ID
# Necesitamos cargar el archivo original para obtener los IDs
df_original = pd.read_excel(ARCHIVO_RESPUESTAS)
columna_id = df_original.columns[0]

# Mapeo: fila_excel -> ID
mapeo_id = {}
for idx, row in df_original.iterrows():
    fila_excel = idx + 2
    id_valor = row[columna_id]
    if pd.isna(id_valor):
        id_valor = idx + 1
    mapeo_id[fila_excel] = id_valor

# Construir datos para Excel 1: ID, [nombre_pregunta], C√≥digos asignados
datos_exportar = []

for cod in resultado_final_v3["codificaciones"]:
    # Obtener ID del mapeo
    fila_excel = cod["fila_excel"]
    id_valor = mapeo_id.get(fila_excel, fila_excel - 1)  # Fallback si no encuentra
    
    # Construir c√≥digos asignados
    codigos_asignados = []
    
    # C√≥digos hist√≥ricos (solo n√∫meros)
    if cod["codigos_historicos"]:
        codigos_asignados.extend([str(c) for c in cod["codigos_historicos"]])
    
    # C√≥digos nuevos (solo n√∫meros)
    if cod["codigos_nuevos"]:
        codigos_asignados.extend([str(nuevo["codigo"]) for nuevo in cod["codigos_nuevos"]])
    
    # Unir con punto y coma
    codigos_final = "; ".join(codigos_asignados) if codigos_asignados else ""
    
    # Construir fila de datos
    datos_exportar.append({
        "ID": id_valor,
        nombre_pregunta: cod["texto"],  # Columna con el nombre de la pregunta
        "C√≥digos asignados": codigos_final
    })

df_resultados = pd.DataFrame(datos_exportar)

# Excel 2: Crear cat√°logo de c√≥digos nuevos (solo si hay c√≥digos nuevos)
codigos_nuevos_unicos = {}
for cod in resultado_final_v3["codificaciones"]:
    if cod["codigos_nuevos"]:
        for nuevo in cod["codigos_nuevos"]:
            cod_id = nuevo["codigo"]
            if cod_id not in codigos_nuevos_unicos:
                codigos_nuevos_unicos[cod_id] = nuevo["descripcion"]

df_catalogo_nuevos = pd.DataFrame([
    {"COD": cod_id, "TEXTO": descripcion}
    for cod_id, descripcion in sorted(codigos_nuevos_unicos.items())
])

# Guardar en Excel con 2 hojas
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
archivo_salida = project_root / "notebooks" / "resultados" / f"resultados_v3_{timestamp}.xlsx"
archivo_salida.parent.mkdir(exist_ok=True)

with pd.ExcelWriter(archivo_salida, engine='openpyxl') as writer:
    # Excel 1: Resultados
    df_resultados.to_excel(writer, sheet_name='Resultados', index=False)
    
    # Excel 2: C√≥digos Nuevos (solo si hay c√≥digos nuevos)
    if not df_catalogo_nuevos.empty:
        df_catalogo_nuevos.to_excel(writer, sheet_name='C√≥digos Nuevos', index=False)

print("="*60)
print("üì• RESULTADOS EXPORTADOS")
print("="*60)
print(f"\n‚úÖ Archivo: {archivo_salida.name}")
print(f"üìä Hojas:")
print(f"   ‚Ä¢ Resultados: {len(df_resultados)} filas")
print(f"     Columnas: ID, '{nombre_pregunta}', C√≥digos asignados")
if not df_catalogo_nuevos.empty:
    print(f"   ‚Ä¢ C√≥digos Nuevos: {len(df_catalogo_nuevos)} c√≥digos")
    print(f"     Columnas: COD, TEXTO")
else:
    print(f"   ‚Ä¢ C√≥digos Nuevos: (vac√≠o - no se generaron c√≥digos nuevos)")

print(f"\nüìã Vista previa de Resultados (primeras 3 filas):\n")
print(df_resultados.head(3).to_string())
if not df_catalogo_nuevos.empty:
    print(f"\nüìã Vista previa de C√≥digos Nuevos:\n")
    print(df_catalogo_nuevos.head(10).to_string())

üì• RESULTADOS EXPORTADOS

‚úÖ Archivo: resultados_v3_20251201_104548.xlsx
üìä Hojas:
   ‚Ä¢ Resultados: 10 filas
     Columnas: ID, 'P2', C√≥digos asignados
   ‚Ä¢ C√≥digos Nuevos: 13 c√≥digos
     Columnas: COD, TEXTO

üìã Vista previa de Resultados (primeras 3 filas):

       ID                                                                                      P2 C√≥digos asignados
0  NUMERO  2.¬øPor qu√© seleccion√≥ la cara cuando vio esta imagen?Seleccion√≥ cara cuando vio imagen                  
1      11                          por que me sorprendi√≥ que tuvieran artos productos y elegantes           1; 2; 3
2      13                                     porque ya conocio la marca, asi que no me sorprendi                 4

üìã Vista previa de C√≥digos Nuevos:

   COD                   TEXTO
0    1                Sorpresa
1    2   Variedad de productos
2    3   Presentaci√≥n elegante
3    4   Confianza en la marca
4    5  Agrado por el producto
5    6   Confianza en la ma

: 

## üìã Divisi√≥n de Prompts por Nodo

### **Nodo 1: VALIDAR** ‚úÖ
- **Responsabilidad**: Filtrar respuestas basura
- **Prompt**: Simple, solo reglas de rechazo/aceptaci√≥n
- **No necesita** reglas de especificidad

### **Nodo 2: EVALUAR_CATALOGO** ‚úÖ
- **Responsabilidad**: Evaluar si c√≥digos hist√≥ricos aplican (booleano)
- **Prompt**: Mejorado con reglas de evaluaci√≥n:
  - Considera nivel de especificidad (busca idea central, no palabras exactas)
  - Permite m√∫ltiples c√≥digos por respuesta
  - Gu√≠a de confianza (0.7-1.0 para aplicar)
  - Enfoque conservador (mejor dejar sin c√≥digo que asignar incorrecto)

### **Nodo 3: IDENTIFICAR_CONCEPTOS** ‚úÖ
- **Responsabilidad**: Crear c√≥digos nuevos o identificar gaps
- **Prompt**: **COMPLETO** con todas las reglas de especificidad de `gpt_hibrido.py`
- **Incluye**: Nivel de especificidad, agrupaci√≥n, unicidad, etc.

### **Nodo 4: JUSTIFICAR** ‚úÖ
- **Responsabilidad**: Generar justificaciones breves
- **Prompt**: Muy simple, solo pide ser conciso

### **Nodo 5: ENSAMBLAR** ‚úÖ
- **Responsabilidad**: Combinar resultados
- **Sin prompt**: Solo l√≥gica de ensamblaje

**Conclusi√≥n**: Los prompts est√°n divididos correctamente. El Nodo 3 tiene todas las reglas cr√≠ticas para crear c√≥digos nuevos.

---

## üéØ Resumen de Mejoras V3

### ‚úÖ C√≥digos Secuenciales Globales
- Los c√≥digos nuevos son **secuenciales entre batches**
- Contador global `proximo_codigo_nuevo` persiste durante toda la ejecuci√≥n
- Si hay cat√°logo hist√≥rico ‚Üí empieza desde (max_codigo + 1)
- Si NO hay cat√°logo ‚Üí empieza desde 1

### ü§ñ GPT-5 Disponible
- Modelo por defecto: **gpt-5** (disponible desde 2025)
- Otros modelos: gpt-4o, gpt-4o-mini, gpt-4-turbo

### üìä Exportaci√≥n Mejorada
- **2 hojas en Excel:**
  - Resultados: Respuestas con c√≥digos asignados
  - C√≥digos Nuevos: Cat√°logo con IDs num√©ricos (COD, TEXTO)

### üî¢ Ejemplo de Secuencialidad:
```
Batch 1: Genera c√≥digos 1, 2, 3
Batch 2: Genera c√≥digos 4, 5, 6  ‚úÖ (no reinicia)
Batch 3: Genera c√≥digos 7, 8     ‚úÖ (contin√∫a)
```
