In [1]:
try:
    import google.genai
    import vertexai.preview.caching
    print("La librería google-genai y el módulo de caching de Vertex AI se importaron correctamente. ¡Listo para usar!")
except ImportError as e:
    print(f"Error al importar la librería: {e}")
    print("Parece que la librería google-genai no está instalada o no es accesible en este entorno.")

La librería google-genai y el módulo de caching de Vertex AI se importaron correctamente. ¡Listo para usar!


In [2]:
import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
# El ID de tu proyecto de Google Cloud
PROJECT_ID = 'zenda-adk'
# La ubicación requerida para Context Caching
LOCATION = "us-central1"
# El nombre del modelo Gemini 1.5 que quieres usar para el caché
# Usaremos este por ahora, es compatible con 2.5 para caching y caching explícito
MODEL_NAME = "gemini-1.5-pro-001"


# Contenido de ejemplo para cachear
# Aquí podrías poner después una pauta, una definición, etc.
# Recuerda que para que el caching explícito sea efectivo,
# el contenido debe tener al menos ~4096 tokens.
# Este es solo un ejemplo para probar la creación del recurso.
contenido_para_cachear = """
Las pautas generales de Zenda son protocolos de acompañamiento y reflexión.
Están diseñadas para guiar la conversación del agente Zenda con el cliente.
Incluyen acciones, formas de actuar (cómo) y objetivos (para qué).
Son clave para asegurar la calidad y la consistencia del servicio.
El servicio Zenda es un asistente conversacional impulsado por IA,
orientado a personas que enfrentan desafíos personales, laborales o de desarrollo.
Ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de
adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas).
Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes.
""" # He añadido un poco más de texto, aunque sigue siendo corto para el caché efectivo.

# --- Inicializar Vertex AI ---
# Esto le dice a la librería con qué proyecto y en qué región trabajar
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    # Si falla la inicialización, detenemos el proceso aquí
    # En Jupyter, puedes continuar en otra celda si corriges el problema
    raise # Relanzamos la excepción para que veas el error completo si ocurre


# --- Crear el Context Cache ---
try:
    print("Intentando crear el recurso Context Cache en Vertex AI...")
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1), # El caché durará 1 hora (TTL = Time To Live)
        display_name="zenda-ejemplo-pauta-cache" # Un nombre amigable para identificarlo
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    # Nota: cached_content_resource también tiene info como .size_bytes, .token_count, etc.

except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- Permisos insuficientes para crear recursos de caching en tu proyecto.")
    print("- Error en el nombre del modelo especificado.")
    print("- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).")
    print("- El contenido es significativamente menor al tamaño mínimo para caching explícito (~4k tokens), aunque debería permitir crear el recurso igual.")
    print("Si estás en Workbench, verifica que tienes permisos para Vertex AI.")

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI...

--- Error al crear el Context Cache ---
Mensaje de error: 404 Publisher Model `projects/378891832439/locations/us-central1/publishers/google/models/gemini-1.5-pro-001` was not found or your project does not have access to it. Please ensure you are using a valid model version. For more information, see: https://cloud.google.com/vertex-ai/generative-ai/docs/learn/model-versions
Posibles causas:
- Permisos insuficientes para crear recursos de caching en tu proyecto.
- Error en el nombre del modelo especificado.
- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).
- El contenido es significativamente menor al tamaño mínimo para caching explícito (~4k tokens), aunque debería permitir crear el recurso igual.
Si estás en Workbench, verifica que tienes permisos para Vertex AI.


In [3]:
import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
# El ID de tu proyecto de Google Cloud
PROJECT_ID = 'zenda-adk'
# La ubicación requerida para Context Caching
LOCATION = "us-central1"
# El nombre del modelo Gemini 2.5 que queremos usar para el caché
# ¡Corregimos el nombre basándonos en tus fuentes y tu necesidad de usar 2.5!
MODEL_NAME = "gemini-2.5-pro-preview-05-06" # Intentamos con este nombre de modelo 2.5


# Contenido de ejemplo para cachear
# Aquí podrías poner después una pauta, una definición, etc.
# Recuerda que para que el caching explícito sea efectivo,
# el contenido debe tener al menos ~4096 tokens.
# Este es solo un ejemplo para probar la creación del recurso.
contenido_para_cachear = """
Las pautas generales de Zenda son protocolos de acompañamiento y reflexión.
Están diseñadas para guiar la conversación del agente Zenda con el cliente.
Incluyen acciones, formas de actuar (cómo) y objetivos (para qué).
Son clave para asegurar la calidad y la consistencia del servicio.
El servicio Zenda es un asistente conversacional impulsado por IA,
orientado a personas que enfrentan desafíos personales, laborales o de desarrollo.
Ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de
adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas).
Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes.
""" # He añadido un poco más de texto, aunque sigue siendo corto para el caché efectivo.

# --- Inicializar Vertex AI ---
# Esto le dice a la librería con qué proyecto y en qué región trabajar
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    # Si falla la inicialización, detenemos el proceso aquí
    # En Jupyter, puedes continuar en otra celda si corriges el problema
    raise # Relanzamos la excepción para que veas el error completo si ocurre


# --- Crear el Context Cache ---
try:
    print(f"Intentando crear el recurso Context Cache en Vertex AI con el modelo '{MODEL_NAME}'...")
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1), # El caché durará 1 hora (TTL = Time To Live)
        display_name="zenda-ejemplo-pauta-cache" # Un nombre amigable para identificarlo
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    # Nota: cached_content_resource también tiene info como .size_bytes, .token_count, etc.

except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- Permisos insuficientes para crear recursos de caching en tu proyecto.")
    print("- Error en el nombre del modelo especificado (este es el problema más probable si no es permisos).")
    print("- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).")
    print("- El contenido es significativamente menor al tamaño mínimo para caching explícito (~4k tokens), aunque debería permitir crear el recurso igual.")
    print("Si estás en Workbench, verifica que tienes permisos para Vertex AI.")
    print(f"Intenta verificar la disponibilidad de modelos en la región '{LOCATION}' o prueba con otro nombre de modelo 2.5.")

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI con el modelo 'gemini-2.5-pro-preview-05-06'...

--- Error al crear el Context Cache ---
Mensaje de error: 400 The cached content is of 157 tokens. The minimum token count to start caching is 1024.
Posibles causas:
- Permisos insuficientes para crear recursos de caching en tu proyecto.
- Error en el nombre del modelo especificado (este es el problema más probable si no es permisos).
- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).
- El contenido es significativamente menor al tamaño mínimo para caching explícito (~4k tokens), aunque debería permitir crear el recurso igual.
Si estás en Workbench, verifica que tienes permisos para Vertex AI.
Intenta verificar la disponibilidad de modelos en la región 'us-central1' o prueba con otro nombre de modelo 2.5.


In [4]:
import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
# El ID de tu proyecto de Google Cloud
PROJECT_ID = 'zenda-adk'
# La ubicación requerida para Context Caching
LOCATION = "us-central1"
# El nombre del modelo Gemini 2.5 que queremos usar para el caché
# Usamos el nombre que pareció reconocido en el intento anterior
MODEL_NAME = "gemini-2.5-pro-preview-05-06"


# Contenido para cachear - Fragmento más extenso del documento Zenda 7
# Este texto está diseñado para superar los 1024 tokens mínimos requeridos.
contenido_para_cachear = """
Zenda es un servicio de asistencia conversacional impulsado por inteligencia artificial (IA), orientado a personas que enfrentan desafíos personales, laborales o de desarrollo. El servicio ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas) de acompañamiento, reflexión, observación emocional y evaluación del progreso. Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes. El sistema opera de manera autónoma, basado en un conjunto estructurado de pautas de intervención generales (con planes de incorporar pautas específicas post-MVP) y con mecanismos de calidad (Think Tool interno, QA post-sesión), seguridad y trazabilidad avanzados. Busca ofrecer una experiencia conversacional cálida, empática, útil y profesional.

La arquitectura general (MVP) de Zenda se compone de un Backend Principal desplegado en Google Cloud Run, utilizando contenedores Docker y Python con el Google Agent Development Kit (ADK). La Base de Datos es Supabase (PostgreSQL), alojando toda la información persistente como clientes, entidades, pautas, bitácora, sesiones, temas y especialidades. Los Agentes de IA son orquestados por ADK, incluyendo el Agente DT (Director Técnico), el Agente Zenda (Conversacional Principal con Think Tool interno) y el Agente QA (para procesamiento post-sesión). La Interfaz de Usuario (MVP) es una aplicación Streamlit. Se integran Servicios de Voz con Gemini Speech-to-Text (STT) y Text-to-Speech (TTS). Para la gestión de contexto y estado, se utiliza ADK State para datos dinámicos de la sesión y Vertex AI Context Caching (planificado post-MVP según la sección 15, pero que estamos implementando) para datos más estáticos o grandes como Pautas, Especialidades y Resumen Histórico. El Estado de Sesión usa ADK State para datos específicos de la sesión como Entidades Activas, Criterios, Preferencias.

La Gestión de Contexto, Estado y Memoria (MVP) es crucial. El ADK State (Session Scope) contiene información como Entidades Activas (personas, orgs, jargon, conceptos), Criterios Pautas (actualizados por DT), Tema Elegido, Especialidad Principal/Secundarias, Preferencias Usuario e información del turno actual. Se usa como memoria de trabajo rápida para la lógica de los agentes durante la sesión. El Vertex AI Context Caching está diseñado para contener Pautas Generales (completas), Definiciones de Especialidades y el Resumen Histórico Acumulativo. Su uso principal es proporcionar conocimiento de fondo y definiciones al LLM de Zenda sin sobrecargar el prompt directo, gestionado con TTLs apropiados. La Estrategia de Memoria Larga se basa en un resumen incremental/acumulativo generado post-sesión. Al finalizar una sesión, el proceso de QA invoca un LLM para leer la bitácora de la sesión y el resumen acumulativo previo, generando un nuevo resumen integrado que se guarda en un campo dedicado en la tabla `sesiones`. Al inicio de la siguiente sesión, el DT lee este resumen y lo carga en Context Caching (en el plan original, ahora adaptando al uso directo del recurso de caching que estamos creando).
""" # Este texto combinado debería superar los 1024 tokens.

# --- Inicializar Vertex AI ---
# Esto le dice a la librería con qué proyecto y en qué región trabajar
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    # Si falla la inicialización, detenemos el proceso aquí
    # En Jupyter, puedes continuar en otra celda si corriges el problema
    raise # Relanzamos la excepción para que veas el error completo si ocurre


# --- Crear el Context Cache ---
try:
    print(f"Intentando crear el recurso Context Cache en Vertex AI con el modelo '{MODEL_NAME}' y contenido más largo...")
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1), # El caché durará 1 hora (TTL = Time To Live)
        display_name="zenda-ejemplo-pauta-cache" # Un nombre amigable para identificarlo
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    print(f"Tamaño del contenido cacheado (tokens): {cached_content_resource.token_count}")
    print(f"Tamaño del contenido cacheado (bytes): {cached_content_resource.size_bytes}")


except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- Permisos insuficientes para crear recursos de caching en tu proyecto.")
    print("- Error en el nombre del modelo especificado (este es el problema más probable si no es permisos si el tamaño del contenido es correcto).")
    print("- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).")
    print("- **El contenido ANTERIOR era muy corto, ¡este intento debería pasar ese error!**") # Aclaramos que el error anterior ya no debería ocurrir
    print("Si estás en Workbench, verifica que tienes permisos para Vertex AI.")
    print(f"Intenta verificar la disponibilidad de modelos en la región '{LOCATION}' o prueba con otro nombre de modelo 2.5 si este falla por el modelo.")
    

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI con el modelo 'gemini-2.5-pro-preview-05-06' y contenido más largo...

--- Error al crear el Context Cache ---
Mensaje de error: 400 The cached content is of 689 tokens. The minimum token count to start caching is 1024.
Posibles causas:
- Permisos insuficientes para crear recursos de caching en tu proyecto.
- Error en el nombre del modelo especificado (este es el problema más probable si no es permisos si el tamaño del contenido es correcto).
- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).
- **El contenido ANTERIOR era muy corto, ¡este intento debería pasar ese error!**
Si estás en Workbench, verifica que tienes permisos para Vertex AI.
Intenta verificar la disponibilidad de modelos en la región 'us-central1' o prueba con otro nombre de modelo 2.5 si este falla por el modelo.


In [1]:
import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
# El ID de tu proyecto de Google Cloud
PROJECT_ID = 'zenda-adk'
# La ubicación requerida para Context Caching
LOCATION = "us-central1"
# El nombre del modelo Gemini 2.5 que queremos usar para el caché
# Usamos el nombre que pareció reconocido en el intento anterior
MODEL_NAME = "gemini-2.5-pro-preview-05-06"


# Contenido para cachear - Fragmento MUCHO más extenso del documento Zenda 7
# Este texto está diseñado para superar HOLGADAMENTE los 1024 tokens mínimos requeridos.
# Incluye partes de la introducción, arquitectura, gestión de contexto, manejo de pautas, temas, entidades y ajustes del MVP.
contenido_para_cachear = """
Zenda es un servicio de asistencia conversacional impulsado por inteligencia artificial (IA), orientado a personas que enfrentan desafíos personales, laborales o de desarrollo. El servicio ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas) de acompañamiento, reflexión, observación emocional y evaluación del progreso. Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes. El sistema opera de manera autónoma, basado en un conjunto estructurado de pautas de intervención generales (con planes de incorporar pautas específicas post-MVP) y con mecanismos de calidad (Think Tool interno, QA post-sesión), seguridad y trazabilidad avanzados. Busca ofrecer una experiencia conversacional cálida, empática, útil y profesional.

La arquitectura general (MVP) de Zenda se compone de un Backend Principal desplegado en Google Cloud Run, utilizando contenedores Docker y Python con el Google Agent Development Kit (ADK). La Base de Datos es Supabase (PostgreSQL), alojando toda la información persistente como clientes, entidades, pautas, bitácora, sesiones, temas y especialidades. Los Agentes de IA son orquestados por ADK. Para el MVP, la secuencia principal involucra al Agente DT (Director Técnico - LlmAgent), el Agente Zenda (Agente Conversacional Principal - LlmAgent con Think Tool interno) y el Agente QA (Agente de Calidad - Lógica post-sesión, LlmAgent avanzado). La Interfaz de Usuario (MVP) es una aplicación en Streamlit para interacción vía chat de texto y voz. Se integran Servicios de Voz con Gemini Speech-to-Text (STT) y Text-to-Speech (TTS). Para la gestión de contexto y estado, se utiliza ADK State (Session Scope) para datos dinámicos y Vertex AI Context Caching para datos estables/grandes (Pautas, Especialidades, Resumen Histórico), aunque la implementación explícita de este último fue ajustada para el MVP según la Sección 15.

La Gestión de Contexto, Estado y Memoria (MVP) es crucial para el desempeño de Zenda. El ADK State (Session Scope) almacena contenido como Entidades Activas (personas, orgs, jargon, conceptos), Criterios Pautas (actualizados por DT cada turno), Tema Elegido, Especialidad Principal/Secundarias, Preferencias Usuario (leídas de clientes) e Información del turno actual (emoción detectada, flags de riesgo básicos). Se usa como memoria de trabajo rápida para la lógica de los agentes (DT, Zenda) durante la sesión, actualizándose dinámicamente. El Vertex AI Context Caching está diseñado para contener Contenido como Pautas Generales (completas, desde Supabase), Definiciones de Especialidades (~35, desde Supabase) y el Resumen Histórico Acumulativo (última versión pre-calculada, desde Supabase sesiones.historical_summary). Su uso es para contexto más estático y/o voluminoso cargado al inicio de sesión, consumido principalmente por el LLM de Zenda para proporcionar conocimiento de fondo y definiciones sin sobrecargar el prompt directo, gestionado con TTLs apropiados. La Estrategia de Memoria Larga se adopta mediante el enfoque de resumen incremental/acumulativo generado post-sesión. Al final de la sesión N, el proceso de QA Post-Sesión invoca un LLM económico para leer la bitácora de la sesión N y el resumen acumulativo de N-1, generando un nuevo resumen acumulativo N que integra ambos. Este nuevo resumen se guarda en un campo dedicado (ej., historical_summary de tipo TEXT o JSONB) en la tabla `sesiones` asociada a la sesión N. Al inicio de la sesión N+1, DT (vía retrieve_summary_tool) lee este campo de la sesión N y lo carga en Context Caching (en el plan original antes de los ajustes del MVP).

El Manejo de Pautas (MVP) es fundamental. El MVP operará con el conjunto existente de ~166 pautas generales transversales (archivo Pautas.csv). Estas pautas deben ser validadas por expertos antes de usarse en el MVP. Se implementará el Mecanismo de Adherencia Obligatoria: lógica explícita en Zenda para identificar la pauta general más relevante, extraer campos clave (Accion, Como, Para) y generar un borrador de respuesta intentando cumplir estrictamente con el Como para lograr el Para. También se preparará la declaración de la pauta usada para QA. Las Pautas Pendientes incluyen desarrollar e implementar nuevas pautas específicas para guiar la fase inicial de cada sesión (Acuerdo de Sesión). Las pautas generales validadas se almacenarán en la tabla `pautas` de Supabase.

El Manejo de Temas y Especialidades (MVP) implica Definiciones: Tema (problema/objetivo del cliente) y Especialidad (enfoque profesional Zenda, ~35 tipos). El flujo de inicio de sesión implica que Cliente expone, Zenda/DT ayudan a elegir Tema, DT consulta tabla temas (vía Tool) para obtener Especialidad(es) recomendadas, y DT actualiza State. Zenda usa Especialidad(es) del State para adaptar su prompt/estilo/persona base y ayudar a contextualizar la selección de pautas generales.

El Manejo de Entidades y Contexto Específico (MVP) usa la tabla `entidades`. Su propósito MVP es almacenar actores relacionales (personas, orgs) Y contexto específico del cliente (Jerga, Conceptos, Proyectos Mencionados, etc.), no para Progreso/Objetivos en MVP. La estructura final (MVP) se basa en la imagen image_d0421e.png. Se usa tipo_entidad Extendido añadiendo valores como "Jargon", "Concepto", "ProyectoCliente". La Coordinación entidades_tool <-> ADK State implica que DT carga entidades activas iniciales en State, Zenda lee primero del State, entidades_tool maneja lectura/escritura en Supabase, y tras una escritura exitosa, Zenda actualiza la entidad correspondiente en el State. La Búsqueda Contextual Interna LLM (Optimizada) implica que Zenda usa su conocimiento interno LLM "on demand" para definir/explicar términos/conceptos, guardando (vía tools) SOLO información muy específica del cliente o muy recurrente como entidad de tipo "Jargon" o "Concepto".

Finalmente, la sección Ajustes al Alcance del MVP (Sección 15) detalla simplificaciones. En lugar de muchos agentes complejos, el MVP usa dos principales (DT y Zenda) con flujo secuencial fijo. Se eliminó el uso explícito del servicio Vertex AI Context Caching del alcance del MVP, basando el contexto de sesión en el ADK State y en incluir contexto relevante directamente en el prompt de ZendaAgentMVP (Implicit Caching). La persistencia de datos de sesión se simplificó a escrituras periódicas a una tabla intermedia y una escritura síncrona completa al final, difiriendo la pipeline asíncrona completa (Pub/Sub + Worker). Funcionalidades avanzadas como análisis emocional multimodal y detección de riesgos sofisticada se difieren, manteniendo solo interacción por voz STT/TTS y análisis emocional basado en texto. El Think Tool como callback con segundo LLM se difiere, basando la adherencia a pautas en el prompt de Zenda y la validación post-sesión del Agente QA, con DT alertando internamente. La implementación de la base de datos se enfocó solo en las tablas y campos indispensables para el MVP. El manejo de la tabla de entidades se simplificó a tipos básicos (Persona, Organizacion), difiriendo tipos extendidos como "Jargon" y relaciones detalladas. El mapeo Tema-Especialidad usa datos estáticos simples en lugar de consulta dinámica a tablas de Supabase. El front-end se enfoca en el núcleo conversacional. El registro de eventos en la bitácora se limita a eventos clave de alto nivel. El soporte multi-lenguaje es básico a nivel de infraestructura. El monitoreo se enfoca en logging estructurado de eventos clave. El proceso de despliegue es manual. El manejo de errores se enfoca en registro y robustez básica. Se mantiene el uso estratégico de Pydantic. El front-end en Streamlit es la prioridad 1 para el MVP.
""" # Este texto combinado debería superar los 1024 tokens.

# --- Inicializar Vertex AI ---
# Esto le dice a la librería con qué proyecto y en qué región trabajar
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    # Si falla la inicialización, detenemos el proceso aquí
    # En Jupyter, puedes continuar en otra celda si corriges el problema
    raise # Relanzamos la excepción para que veas el error completo si ocurre


# --- Crear el Context Cache ---
try:
    print(f"Intentando crear el recurso Context Cache en Vertex AI con el modelo '{MODEL_NAME}' y contenido más largo...")
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1), # El caché durará 1 hora (TTL = Time To Live)
        display_name="zenda-ejemplo-pauta-cache" # Un nombre amigable para identificarlo
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    print(f"Tamaño del contenido cacheado (tokens): {cached_content_resource.token_count}")
    print(f"Tamaño del contenido cacheado (bytes): {cached_content_resource.size_bytes}")


except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- Permisos insuficientes para crear recursos de caching en tu proyecto.")
    print("- Error en el nombre del modelo especificado (este es el problema más probable si no es permisos si el tamaño del contenido es correcto).")
    print("- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).")
    print("- **El contenido ANTERIOR era muy corto, ¡este intento debería pasar ese error!**")
    print("Si estás en Workbench, verifica que tienes permisos para Vertex AI.")
    print(f"Intenta verificar la disponibilidad de modelos en la región '{LOCATION}' o prueba con otro nombre de modelo 2.5 si este falla por el modelo.")

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI con el modelo 'gemini-2.5-pro-preview-05-06' y contenido más largo...

--- ¡Recurso Context Cache creado exitosamente! ---
Nombre del recurso: 800647874672066560
Fecha de creación: 2025-05-16 19:56:57.351420+00:00
Fecha de expiración: 2025-05-16 20:56:57.331324+00:00
Modelo asociado: projects/zenda-adk/locations/us-central1/publishers/google/models/gemini-2.5-pro-preview-05-06

--- Error al crear el Context Cache ---
Mensaje de error: 'CachedContent' object has no attribute 'token_count'
Posibles causas:
- Permisos insuficientes para crear recursos de caching en tu proyecto.
- Error en el nombre del modelo especificado (este es el problema más probable si no es permisos si el tamaño del contenido es correcto).
- Problemas de conexión o configuración de red (ej. VPC Service Controls si aplica).
- **El contenido AN

In [6]:
import vertexai
from vertexai.generative_models import GenerativeModel, Part
import os

# --- Configuración ---
# Asegúrate de que estas variables estén definidas,
# por ejemplo, si corriste la celda anterior con éxito, ya lo están.
# Si no, descomenta y establece sus valores correctos:
# PROJECT_ID = 'zenda-adk'
# LOCATION = "us-central1"
# MODEL_NAME = "gemini-2.5-pro-preview-05-06"

# ¡Importante! Necesitamos el objeto 'cached_content_resource'
# que fue creado en la celda anterior y contiene el nombre del recurso de caché.
# Si corriste la celda anterior exitosamente, la variable `cached_content_resource` existe.
# Su nombre único que necesitamos para referenciarlo es: cached_content_resource.name
# Si corrieras esta celda *sin* haber corrido la anterior,
# necesitarías obtener el recurso de caché de otra manera, por ejemplo:
# from vertexai.preview import caching
# resource_name = "projects/zenda-adk/locations/us-central1/cachedContents/EL_ID_QUE_TE_DIO_ANTES" # Reemplaza con el ID real si es necesario
# cached_content_resource = caching.CachedContent(resource_name)


# --- Inicializar Vertex AI (Aunque ya inicializado en la celda anterior,
#     es buena práctica incluir la inicialización si corres esta celda por separado) ---
try:
    # Usamos os.environ.get por si ya están definidas como variables de entorno
    current_project_id = os.environ.get('GOOGLE_CLOUD_PROJECT', PROJECT_ID)
    current_location = os.environ.get('GOOGLE_CLOUD_LOCATION', LOCATION)
    print(f"Asegurando inicialización de Vertex AI para el proyecto '{current_project_id}' en la región '{current_location}'...")
    vertexai.init(project=current_project_id, location=current_location)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    raise # Relanzamos la excepción


# --- Usar el Context Cache en una llamada al modelo ---
try:
    print(f"Intentando usar el caché '{cached_content_resource.name}' en una llamada al modelo '{MODEL_NAME}'...")

    # Inicializa el modelo Gemini 2.5
    # Usamos el mismo nombre de modelo que se usó para crear el caché
    model = GenerativeModel(model_name=MODEL_NAME)

    # Define tu prompt. Este prompt es la "pregunta" o instrucción que le das al modelo,
    # y el modelo usará el contenido cacheado como contexto de fondo.
    prompt_usuario = """
    Basándote EXCLUSIVAMENTE en la información que te fue proporcionada como contexto (el contenido cacheado),
    describe brevemente:
    1. ¿Qué es Zenda?
    2. ¿Cuáles son los 3 agentes principales que lo componen?
    3. ¿Qué mecanismos de gestión de contexto y memoria se mencionan?
    Responde de forma concisa.
    """

    # Llama al modelo, referenciando el recurso de caché por su nombre.
    # Aquí es donde le decimos al modelo "usa este caché como parte del contexto".
    response = model.generate_content(
        contents=[Part.from_text(prompt_usuario)], # Tu prompt aquí como una 'parte' del contenido
        cached_content=cached_content_resource.name # Referencia al recurso de caché por su nombre
        # Importante: Cuando usas cached_content, no puedes usar los parámetros
        # system_instructions, tool_config o tools directamente en esta llamada.
        # Si necesitas instrucciones del sistema, herramientas o configuración de herramientas,
        # deben estar definidas DENTRO del contenido que pusiste en el Context Cache.
    )

    print("\n--- Respuesta del modelo usando el Context Cache ---")
    print(response.text)

    # Intenta ver si hay info de uso de caché en la respuesta.
    # Esto nos puede confirmar cuántos tokens del caché se usaron.
    if hasattr(response, 'usage_metadata') and response.usage_metadata:
         print("\n--- Metadatos de uso (puede mostrar el uso del caché) ---")
         print(f"Total tokens de entrada (prompt + caché): {response.usage_metadata.total_token_count}")
         # Estos atributos pueden variar o no estar presentes según la versión específica del SDK y modelo
         try:
             print(f"Tokens cache usados: {response.usage_metadata.cached_content_token_count}")
         except AttributeError:
             print("El atributo 'cached_content_token_count' no está disponible en los metadatos.")
         try:
             print(f"Tokens solo del prompt (no cache): {response.usage_metadata.prompt_token_count}")
         except AttributeError:
             print("El atributo 'prompt_token_count' no está disponible en los metadatos.")
         try:
             print(f"Tokens de salida generados: {response.usage_metadata.candidates_token_count}")
         except AttributeError:
             print("El atributo 'candidates_token_count' no está disponible en los metadatos.")
    else:
        print("\n--- No se encontraron metadatos de uso detallados en la respuesta ---")


except Exception as e:
    print(f"\n--- Error al usar el Context Cache en la llamada al modelo ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).")
    print(f"- Problemas de conexión o configuración. Asegúrate de que estás en '{LOCATION}'.")
    print("- Error en el nombre del recurso de caché o del modelo.")
    print("- El prompt o la combinación con el caché causaron un error interno del modelo.")
    print(f"Nombre del recurso de caché usado: {cached_content_resource.name if 'cached_content_resource' in locals() else 'variable cached_content_resource no definida'}")

Asegurando inicialización de Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando usar el caché '2072914769404231680' en una llamada al modelo 'gemini-2.5-pro-preview-05-06'...

--- Error al usar el Context Cache en la llamada al modelo ---
Mensaje de error: _GenerativeModel.generate_content() got an unexpected keyword argument 'cached_content'
Posibles causas:
- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).
- Problemas de conexión o configuración. Asegúrate de que estás en 'us-central1'.
- Error en el nombre del recurso de caché o del modelo.
- El prompt o la combinación con el caché causaron un error interno del modelo.
Nombre del recurso de caché usado: 2072914769404231680


In [7]:
import vertexai
# Importamos GenerationConfig además de los otros
from vertexai.generative_models import GenerativeModel, Part, GenerationConfig
import os

# --- Configuración ---
# Estas variables deberían estar definidas si corriste la celda anterior.
# Si por alguna razón no lo están, descomenta y ajusta los valores.
# PROJECT_ID = 'zenda-adk'
# LOCATION = "us-central1"
# MODEL_NAME = "gemini-2.5-pro-preview-05-06"

# ¡Importante! Necesitamos el objeto 'cached_content_resource'
# que fue creado en la celda anterior. Contiene el nombre del recurso de caché
# (por ejemplo, 'projects/zenda-adk/locations/us-central1/cachedContents/2072914769404231680').
# Si corriste la celda anterior con éxito, esta variable existe y contiene el recurso.


# --- Inicializar Vertex AI (Precaución si corres esta celda sola) ---
try:
    # Intentamos leer de variables de entorno por si acaso
    current_project_id = os.environ.get('GOOGLE_CLOUD_PROJECT', PROJECT_ID)
    current_location = os.environ.get('GOOGLE_CLOUD_LOCATION', LOCATION)
    print(f"Asegurando inicialización de Vertex AI para el proyecto '{current_project_id}' en la región '{current_location}'...")
    vertexai.init(project=current_project_id, location=current_location)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    raise # Relanzamos la excepción


# --- Usar el Context Cache en una llamada al modelo ---
try:
    # Si la variable cached_content_resource no existe por alguna razón (ej. reiniciaste el kernel),
    # tendrías que recuperarla o crearla de nuevo. Asumimos que sí existe.
    if 'cached_content_resource' not in locals() or cached_content_resource is None:
         print("Error: La variable 'cached_content_resource' no fue encontrada. Asegúrate de haber ejecutado la celda anterior con éxito.")
         # Podrías intentar recuperarla por nombre si sabes el ID:
         # from vertexai.preview import caching
         # resource_name = f"projects/{PROJECT_ID}/locations/{LOCATION}/cachedContents/EL_ID_QUE_TE_DIO_ANTES"
         # cached_content_resource = caching.CachedContent(resource_name=resource_name)
         exit() # Detenemos la ejecución si no tenemos el recurso de caché

    print(f"Intentando usar el caché '{cached_content_resource.name}' en una llamada al modelo '{MODEL_NAME}'...")

    # Inicializa el modelo Gemini 2.5
    # Usamos el mismo nombre de modelo que se usó para crear el caché
    model = GenerativeModel(model_name=MODEL_NAME)

    # Define tu prompt. Este prompt es la "pregunta" o instrucción que le das al modelo,
    # y el modelo usará el contenido cacheado como contexto de fondo.
    # El contenido cacheado actúa como si fuera una parte MUY GRANDE del prompt de sistema o contexto inicial.
    prompt_usuario = """
    Basándote EXCLUSIVAMENTE en la información que te fue proporcionada como contexto (el contenido cacheado),
    describe brevemente:
    1. ¿Qué es Zenda?
    2. ¿Cuáles son los 3 agentes principales que lo componen?
    3. ¿Qué mecanismos de gestión de contexto y memoria se mencionan?
    Responde de forma concisa.
    """

    # --- ¡Aquí está la corrección! ---
    # Creamos un objeto GenerationConfig
    generation_config = GenerationConfig(
        cached_content=cached_content_resource.name # Pasamos el nombre del recurso de caché aquí dentro
        # Puedes añadir otros parámetros de generación si quieres, como temperature, max_output_tokens, etc.
        # Por ejemplo: temperature=0.2, max_output_tokens=100
    )

    # Llama al modelo, pasando el prompt y el objeto de configuración
    response = model.generate_content(
        contents=[Part.from_text(prompt_usuario)], # Tu prompt aquí como una lista de 'partes'
        generation_config=generation_config # Pasamos el objeto de configuración completa
        # NOTA: No puedes usar system_instructions, tools, o tool_config DIRECTAMENTE
        # en esta llamada si estás usando `cached_content`. Esos deben estar
        # definidos *dentro* del contenido que pusiste en el Context Cache si los necesitas aplicar al caché.
    )

    print("\n--- Respuesta del modelo usando el Context Cache ---")
    # El texto de la respuesta está en response.text
    print(response.text)

    # Intentamos ver si hay info de uso de caché en la respuesta.
    # Esto puede confirmar cuántos tokens del caché se usaron (si el SDK lo expone).
    print("\n--- Intentando mostrar metadatos de uso ---")
    if hasattr(response, 'usage_metadata') and response.usage_metadata:
         print("Metadatos de uso encontrados:")
         # Imprimimos todos los atributos disponibles en usage_metadata para investigar
         for attr in dir(response.usage_metadata):
             if not attr.startswith('_'): # Ignorar atributos internos de Python
                 try:
                     value = getattr(response.usage_metadata, attr)
                     print(f"- {attr}: {value}")
                 except Exception:
                     print(f"- {attr}: [No se pudo obtener el valor]")

    else:
        print("No se encontraron metadatos de uso detallados en la respuesta.")


except Exception as e:
    print(f"\n--- Error al usar el Context Cache en la llamada al modelo ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).")
    print(f"- Problemas de conexión o configuración. Asegúrate de que estás en '{LOCATION}'.")
    print("- Error en el nombre del recurso de caché o del modelo.")
    print("- El prompt o la combinación con el caché causaron un error interno del modelo.")
    # Intentamos imprimir el nombre del caché usado si la variable existe
    cache_name_to_print = "variable cached_content_resource no definida"
    if 'cached_content_resource' in locals() and cached_content_resource:
         try:
             cache_name_to_print = cached_content_resource.name
         except Exception:
              cache_name_to_print = "objeto cached_content_resource existe pero sin .name"

    print(f"Nombre del recurso de caché intentado usar: {cache_name_to_print}")

Asegurando inicialización de Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando usar el caché '2072914769404231680' en una llamada al modelo 'gemini-2.5-pro-preview-05-06'...

--- Error al usar el Context Cache en la llamada al modelo ---
Mensaje de error: GenerationConfig.__init__() got an unexpected keyword argument 'cached_content'
Posibles causas:
- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).
- Problemas de conexión o configuración. Asegúrate de que estás en 'us-central1'.
- Error en el nombre del recurso de caché o del modelo.
- El prompt o la combinación con el caché causaron un error interno del modelo.
Nombre del recurso de caché intentado usar: 2072914769404231680


In [8]:
import os
# Importamos desde google.genai ahora los módulos necesarios
import google.genai
from google.genai import types # Necesitamos types para GenerateContentConfig

# --- Configuración ---
# Estas variables deberían estar definidas si corriste la celda anterior.
# Si por alguna razón no lo están (ej. corres esta celda sola y reiniciaste el kernel),
# descomenta y establece sus valores correctos.
PROJECT_ID = 'zenda-adk'
LOCATION = "us-central1"
MODEL_NAME = "gemini-2.5-pro-preview-05-06" # El modelo usado para crear el caché

# --- Manejo del recurso de caché creado previamente ---
# ¡Importante! Necesitamos el objeto 'cached_content_resource'
# que fue creado en la celda anterior. Este objeto contiene el nombre del recurso de caché.

# --- Instrucción detallada: Cómo asegurar que 'cached_content_resource' esté disponible ---
# OPCIÓN 1 (Recomendada - Si no reiniciaste el kernel):
# Si acabas de ejecutar la celda del "Paso 2" con éxito en esta misma sesión de Jupyter
# y no reiniciaste el kernel, la variable `cached_content_resource` ya debería existir
# y estar lista para usar. No necesitas hacer nada en este bloque.

# OPCIÓN 2 (Si reiniciaste el kernel o corres esta celda sola):
# Si reiniciaste el kernel de Jupyter o estás ejecutando esta celda sin haber ejecutado la anterior
# en esta sesión, la variable `cached_content_resource` NO existirá.
# Para obtener el recurso de caché, podemos recuperarlo por su nombre COMPLETO
# (que obtuviste en la salida exitosa del Paso 2, por ejemplo, 'projects/zenda-adk/locations/us-central1/cachedContents/EL_ID_NUMERICO').
# Descomenta el siguiente bloque de código y reemplaza 'EL_ID_NUMERICO_DE_TU_CACHE' con el número de ID real de tu caché.
# Esto recuperará el objeto del recurso de caché desde Vertex AI.

# try:
#     print("OPCIÓN 2: Intentando recuperar el recurso de caché por nombre...")
#     # Reemplaza 'EL_ID_NUMERICO_DE_TU_CACHE' con el número ID que obtuviste (ej. 2072914769404231680)
#     cache_resource_id = '2072914769404231680' # <<< ¡REEMPLAZA SI TU ID ES DIFERENTE!
#     cache_resource_name_str = f"projects/{PROJECT_ID}/locations/{LOCATION}/cachedContents/{cache_resource_id}"
#
#     # Para recuperar el recurso con google.genai, necesitamos un cliente genai.
#     # Este cliente intentará usar las credenciales por defecto de tu entorno (como en Workbench).
#     genai_client_for_retrieval = google.genai.Client()
#
#     cached_content_resource = genai_client_for_retrieval.get_cached_content(name=cache_resource_name_str)
#     print(f"Recurso de caché '{cache_resource_name_str}' recuperado exitosamente.")
# except Exception as e:
#     print(f"Error al recuperar el recurso de caché por nombre: {e}")
#     print("Asegúrate de que el nombre del recurso sea correcto, que el caché no haya expirado y que tengas permisos para acceder.")
#     # Si falla la recuperación, detenemos la ejecución
#     exit() # Detiene la ejecución de la celda


# Verificamos si la variable existe después de intentar la OPCIÓN 1 o la OPCIÓN 2
if 'cached_content_resource' not in locals() or cached_content_resource is None:
     print("\n--- ERROR FATAL: La variable 'cached_content_resource' NO está disponible. ---")
     print("Necesitas ejecutar primero la celda del 'Paso 2' (Intento con Contenido Largo) CON ÉXITO")
     print("o usar la OPCIÓN 2 de recuperación de caché dentro de esta celda si reiniciaste el kernel.")
     exit() # Detiene la ejecución si el recurso no está listo


# --- Inicializar Cliente google.genai ---
# Usaremos google.genai.Client ahora. Este cliente intentará usar las credenciales
# de aplicación por defecto de tu entorno (que deberían funcionar en Vertex AI Workbench).
try:
    print(f"\nInicializando cliente google.genai...")
    genai_client = google.genai.Client()
    # El cliente genai intentará inferir el proyecto y ubicación de las credenciales o variables de entorno.
    # No siempre es necesario configurar explícitamente el endpoint si las credenciales de GCP están bien puestas.
    print("Cliente google.genai inicializado.")

except Exception as e:
    print(f"Error al inicializar cliente google.genai: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que tengas permisos de Vertex AI.")
    print("Si estás fuera de GCP (ej. en tu máquina local), quizás necesites configurar GOOGLE_APPLICATION_CREDENTIALS.")
    exit() # Detenemos la ejecución si el cliente falla


# --- Usar el Context Cache en una llamada al modelo usando el cliente genai ---
try:
    print(f"Intentando usar el caché '{cached_content_resource.name}' en una llamada al modelo '{MODEL_NAME}' usando cliente genai...")

    # Define tu prompt.
    prompt_usuario = """
    Basándote EXCLUSIVAMENTE en la información que te fue proporcionada como contexto (el contenido cacheado),
    describe brevemente:
    1. ¿Qué es Zenda?
    2. ¿Cuáles son los 3 agentes principales que lo componen?
    3. ¿Qué mecanismos de gestión de contexto y memoria se mencionan?
    Responde de forma concisa.
    """

    # --- ¡Aquí usamos la configuración con el cliente genai! ---
    # Creamos un objeto GenerateContentConfig (usando types de google.genai)
    # Y le pasamos el nombre completo del recurso de caché.
    generation_config = types.GenerateContentConfig(
        cached_content=cached_content_resource.name # Pasamos el nombre completo del recurso de caché aquí dentro
        # Puedes añadir otros parámetros de generación si quieres
        # temperature=0.2, max_output_tokens=200 # Ejemplo de otros parámetros
    )

    # Llama al modelo usando el cliente genai.models.generate_content.
    # Para este cliente, el nombre del modelo se pasa con el path completo del recurso en Vertex AI.
    full_model_name = f"projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/{MODEL_NAME}"

    print("Llamando al modelo generate_content con caché...")
    response = genai_client.models.generate_content(
        model=full_model_name, # Nombre completo del modelo como recurso de Vertex AI
        contents=[{"text": prompt_usuario}], # El prompt como una lista de dicts con clave 'text'
        generation_config=generation_config # Pasamos el objeto de configuración
    )

    print("\n--- Respuesta del modelo usando el Context Cache (cliente google.genai) ---")
    # La respuesta del texto suele estar en response.candidates[0].content.parts[0].text
    try:
        response_text = response.candidates[0].content.parts[0].text
        print(response_text)
    except Exception as e:
        print(f"No se pudo extraer el texto de la respuesta fácilmente: {e}")
        print("Estructura completa de la respuesta para depurar:")
        print(response)


    # Intenta ver si hay info de uso de caché en la respuesta.
    # La metadata de uso suele estar en response.usage_metadata
    print("\n--- Intentando mostrar metadatos de uso (cliente google.genai) ---")
    if hasattr(response, 'usage_metadata') and response.usage_metadata:
         print("Metadatos de uso encontrados:")
         # Imprimimos todos los atributos disponibles en usage_metadata
         # El conteo de tokens del caché usado debería aparecer aquí si la llamada lo reporta
         for attr in dir(response.usage_metadata):
             if not attr.startswith('_'): # Ignorar atributos internos de Python
                 try:
                     value = getattr(response.usage_metadata, attr)
                     print(f"- {attr}: {value}")
                 except Exception:
                     print(f"- {attr}: [No se pudo obtener el valor]")

    else:
        print("No se encontraron metadatos de uso detallados en la respuesta.")


except Exception as e:
    print(f"\n--- Error al usar el Context Cache en la llamada al modelo (cliente google.genai) ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).")
    print(f"- Problemas de conexión o configuración. Asegúrate de que estás en '{LOCATION}'.")
    print("- Error en el nombre del recurso de caché o del modelo.")
    print("- El prompt, el caché o la combinación causaron un error interno del modelo.")
    print("Asegúrate de que el cliente genai está inicializado y autenticado correctamente.")
    # Intentamos imprimir el nombre del caché intentado usar
    cache_name_to_print = "variable cached_content_resource no definida"
    if 'cached_content_resource' in locals() and cached_content_resource:
         try:
             cache_name_to_print = cached_content_resource.name
         except Exception:
              cache_name_to_print = "objeto cached_content_resource existe pero sin .name"
    print(f"Nombre del recurso de caché intentado usar: {cache_name_to_print}")


Inicializando cliente google.genai...
Error al inicializar cliente google.genai: Missing key inputs argument! To use the Google AI API, provide (`api_key`) arguments. To use the Google Cloud API, provide (`vertexai`, `project` & `location`) arguments.
Asegúrate de que tu entorno esté autenticado con GCP y que tengas permisos de Vertex AI.
Si estás fuera de GCP (ej. en tu máquina local), quizás necesites configurar GOOGLE_APPLICATION_CREDENTIALS.
Intentando usar el caché '2072914769404231680' en una llamada al modelo 'gemini-2.5-pro-preview-05-06' usando cliente genai...
Llamando al modelo generate_content con caché...

--- Error al usar el Context Cache en la llamada al modelo (cliente google.genai) ---
Mensaje de error: name 'genai_client' is not defined
Posibles causas:
- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).
- Problemas de conexión o configuración. Asegúrate de que estás en 'us-central1'.
- Error en el nombre del recurso de caché o del mo

In [1]:
import os
# Importamos desde google.genai ahora los módulos necesarios
import google.genai
from google.genai import types # Necesitamos types para GenerateContentConfig
import vertexai # Mantenemos vertexai importado por si acaso, aunque el cliente principal ahora sea genai

# --- Configuración ---
# Estas variables deberían estar definidas si corriste la celda anterior.
# Si por alguna razón no lo están (ej. corres esta celda sola y reiniciaste el kernel),
# descomenta y establece sus valores correctos.
PROJECT_ID = 'zenda-adk'
LOCATION = "us-central1"
MODEL_NAME = "gemini-2.5-pro-preview-05-06" # El modelo usado para crear el caché

# --- Manejo del recurso de caché creado previamente ---
# ¡Importante! Necesitamos el objeto 'cached_content_resource'
# que fue creado en la celda anterior. Este objeto contiene el nombre del recurso de caché.

# --- Instrucción detallada: Cómo asegurar que 'cached_content_resource' esté disponible ---
# OPCIÓN 1 (Recomendada - Si no reiniciaste el kernel):
# Si acabas de ejecutar la celda del "Paso 2" con éxito en esta misma sesión de Jupyter
# y no reiniciaste el kernel, la variable `cached_content_resource` ya debería existir
# y estar lista para usar. No necesitas hacer nada en este bloque.

# OPCIÓN 2 (Si reiniciaste el kernel o corres esta celda sola):
# Si reiniciaste el kernel de Jupyter o estás ejecutando esta celda sin haber ejecutado la anterior
# en esta sesión, la variable `cached_content_resource` NO existirá.
# Para obtener el recurso de caché, podemos recuperarlo por su nombre COMPLETO
# (que obtuviste en la salida exitosa del Paso 2, por ejemplo, 'projects/zenda-adk/locations/us-central1/cachedContents/EL_ID_NUMERICO').
# Descomenta el siguiente bloque de código y reemplaza 'EL_ID_NUMERICO_DE_TU_CACHE' con el número de ID real de tu caché.
# Esto recuperará el objeto del recurso de caché desde Vertex AI.

# try:
#     print("OPCIÓN 2: Intentando recuperar el recurso de caché por nombre...")
#     # Reemplaza 'EL_ID_NUMERICO_DE_TU_CACHE' con el número ID que obtuviste (ej. 2072914769404231680)
#     cache_resource_id = '2072914769404231680' # <<< ¡REEMPLAZA SI TU ID ES DIFERENTE!
#     cache_resource_name_str = f"projects/{PROJECT_ID}/locations/{LOCATION}/cachedContents/{cache_resource_id}"
#
#     # Para recuperar el recurso con google.genai, necesitamos un cliente genai.
#     # Este cliente intentará usar las credenciales por defecto de tu entorno (como en Workbench).
#     genai_client_for_retrieval = google.genai.Client() # El cliente no necesita project/location para get_cached_content si las credenciales están bien
#
#     cached_content_resource = genai_client_for_retrieval.get_cached_content(name=cache_resource_name_str)
#     print(f"Recurso de caché '{cache_resource_name_str}' recuperado exitosamente.")
# except Exception as e:
#     print(f"Error al recuperar el recurso de caché por nombre: {e}")
#     print("Asegúrate de que el nombre del recurso sea correcto, que el caché no haya expirado y que tengas permisos para acceder.")
#     # Si falla la recuperación, detenemos la ejecución
#     exit() # Detiene la ejecución de la celda


# Verificamos si la variable existe después de intentar la OPCIÓN 1 o la OPCIÓN 2
if 'cached_content_resource' not in locals() or cached_content_resource is None:
     print("\n--- ERROR FATAL: La variable 'cached_content_resource' NO está disponible. ---")
     print("Necesitas ejecutar primero la celda del 'Paso 2' (Intento con Contenido Largo) CON ÉXITO")
     print("o usar la OPCIÓN 2 de recuperación de caché dentro de esta celda si reiniciaste el kernel.")
     exit() # Detiene la ejecución si el recurso no está listo


# --- Inicializar Cliente google.genai (¡CORREGIDO!) ---
# Usaremos google.genai.Client ahora y le pasamos el proyecto y la ubicación
try:
    print(f"\nInicializando cliente google.genai para proyecto '{PROJECT_ID}' en región '{LOCATION}'...")
    # ¡CORRECCIÓN CLAVE! Pasamos project y location para que sepa conectarse a Vertex AI en tu GCP.
    genai_client = google.genai.Client(
        project=PROJECT_ID,
        location=LOCATION
        # También puedes intentar con: client_options={'api_endpoint': f"{LOCATION}-aiplatform.googleapis.com"}
        # pero pasar project/location suele ser más directo según el error.
    )
    print("Cliente google.genai inicializado correctamente.")

except Exception as e:
    print(f"Error al inicializar cliente google.genai: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que tengas permisos de Vertex AI.")
    print("Si estás fuera de GCP, verifica GOOGLE_APPLICATION_CREDENTIALS o GOOGLE_API_KEY.")
    exit() # Detenemos la ejecución si el cliente falla


# --- Usar el Context Cache en una llamada al modelo usando el cliente genai ---
try:
    print(f"Intentando usar el caché '{cached_content_resource.name}' en una llamada al modelo '{MODEL_NAME}' usando cliente genai...")

    # Define tu prompt.
    prompt_usuario = """
    Basándote EXCLUSIVAMENTE en la información que te fue proporcionada como contexto (el contenido cacheado),
    describe brevemente:
    1. ¿Qué es Zenda?
    2. ¿Cuáles son los 3 agentes principales que lo componen?
    3. ¿Qué mecanismos de gestión de contexto y memoria se mencionan?
    Responde de forma concisa.
    """

    # Creamos un objeto GenerateContentConfig (usando types de google.genai)
    # Y le pasamos el nombre completo del recurso de caché.
    # Este objeto se pasará al parámetro 'config' de generate_content.
    generation_config = types.GenerateContentConfig(
        cached_content=cached_content_resource.name # Pasamos el nombre completo del recurso de caché aquí
        # Puedes añadir otros parámetros de generación si quieres
        # temperature=0.2, max_output_tokens=200 # Ejemplo de otros parámetros
    )

    # Llama al modelo usando el cliente genai.models.generate_content.
    # Para este cliente, el nombre del modelo se pasa con el path completo del recurso en Vertex AI.
    full_model_name = f"projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/{MODEL_NAME}"

    print("Llamando al modelo generate_content con caché...")
    response = genai_client.models.generate_content(
        model=full_model_name, # Nombre completo del modelo como recurso de Vertex AI
        contents=[{"text": prompt_usuario}], # El prompt como una lista de dicts con clave 'text'
        config=generation_config # Pasamos el objeto de configuración AHORA sí al parámetro 'config'
    )

    print("\n--- Respuesta del modelo usando el Context Cache (cliente google.genai) ---")
    # La respuesta del texto suele estar en response.candidates[0].content.parts[0].text
    try:
        response_text = response.candidates[0].content.parts[0].text
        print(response_text)
    except Exception as e:
        print(f"No se pudo extraer el texto de la respuesta fácilmente: {e}")
        print("Estructura completa de la respuesta para depurar:")
        print(response)


    # Intenta ver si hay info de uso de caché en la respuesta.
    # La metadata de uso suele estar en response.usage_metadata
    print("\n--- Intentando mostrar metadatos de uso (cliente google.genai) ---")
    if hasattr(response, 'usage_metadata') and response.usage_metadata:
         print("Metadatos de uso encontrados:")
         # Imprimimos todos los atributos disponibles en usage_metadata
         # El conteo de tokens del caché usado debería aparecer aquí si la llamada lo reporta
         for attr in dir(response.usage_metadata):
             if not attr.startswith('_'): # Ignorar atributos internos de Python
                 try:
                     value = getattr(response.usage_metadata, attr)
                     print(f"- {attr}: {value}")
                 except Exception:
                     print(f"- {attr}: [No se pudo obtener el valor]")

    else:
        print("No se encontraron metadatos de uso detallados en la respuesta.")


except Exception as e:
    print(f"\n--- Error al usar el Context Cache en la llamada al modelo (cliente google.genai) ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).")
    print(f"- Problemas de conexión o configuración. Asegúrate de que estás en '{LOCATION}'.")
    print("- Error en el nombre del recurso de caché o del modelo.")
    print("- El prompt, el caché o la combinación causaron un error interno del modelo.")
    print("Asegúrate de que el cliente genai está inicializado y autenticado correctamente.")
    # Intentamos imprimir el nombre del caché intentado usar
    cache_name_to_print = "variable cached_content_resource no definida"
    if 'cached_content_resource' in locals() and cached_content_resource:
         try:
             cache_name_to_print = cached_content_resource.name
         except Exception:
              cache_name_to_print = "objeto cached_content_resource existe pero sin .name"
    print(f"Nombre del recurso de caché intentado usar: {cache_name_to_print}")


--- ERROR FATAL: La variable 'cached_content_resource' NO está disponible. ---
Necesitas ejecutar primero la celda del 'Paso 2' (Intento con Contenido Largo) CON ÉXITO
o usar la OPCIÓN 2 de recuperación de caché dentro de esta celda si reiniciaste el kernel.

Inicializando cliente google.genai para proyecto 'zenda-adk' en región 'us-central1'...
Error al inicializar cliente google.genai: Missing key inputs argument! To use the Google AI API, provide (`api_key`) arguments. To use the Google Cloud API, provide (`vertexai`, `project` & `location`) arguments.
Asegúrate de que tu entorno esté autenticado con GCP y que tengas permisos de Vertex AI.
Si estás fuera de GCP, verifica GOOGLE_APPLICATION_CREDENTIALS o GOOGLE_API_KEY.

--- Error al usar el Context Cache en la llamada al modelo (cliente google.genai) ---
Mensaje de error: name 'cached_content_resource' is not defined
Posibles causas:
- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).
- Problemas de 

In [2]:
import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
# El ID de tu proyecto de Google Cloud
PROJECT_ID = 'zenda-adk'
# La ubicación requerida para Context Caching
LOCATION = "us-central1"
# El nombre del modelo Gemini 2.5 que queremos usar para el caché
# Usamos el nombre que pareció reconocido en el intento anterior
MODEL_NAME = "gemini-2.5-pro-preview-05-06"


# Contenido para cachear - Fragmento MUCHO más extenso del documento Zenda 7
# Este texto está diseñado para superar HOLGADAMENTE los 1024 tokens mínimos requeridos.
# Incluye partes de la introducción, arquitectura, gestión de contexto, manejo de pautas, temas, entidades y ajustes del MVP.
contenido_para_cachear = """
Zenda es un servicio de asistencia conversacional impulsado por inteligencia artificial (IA), orientado a personas que enfrentan desafíos personales, laborales o de desarrollo. El servicio ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas) de acompañamiento, reflexión, observación emocional y evaluación del progreso. Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes. El sistema opera de manera autónoma, basado en un conjunto estructurado de pautas de intervención generales (con planes de incorporar pautas específicas post-MVP) y con mecanismos de calidad (Think Tool interno, QA post-sesión), seguridad y trazabilidad avanzados. Busca ofrecer una experiencia conversacional cálida, empática, útil y profesional.

La arquitectura general (MVP) de Zenda se compone de un Backend Principal desplegado en Google Cloud Run, utilizando contenedores Docker y Python con el Google Agent Development Kit (ADK). La Base de Datos es Supabase (PostgreSQL), alojando toda la información persistente como clientes, entidades, pautas, bitácora, sesiones, temas y especialidades. Los Agentes de IA son orquestados por ADK. Para el MVP, la secuencia principal involucra al Agente DT (Director Técnico - LlmAgent), el Agente Zenda (Agente Conversacional Principal - LlmAgent con Think Tool interno) y el Agente QA (Agente de Calidad - Lógica post-sesión, LlmAgent avanzado). La Interfaz de Usuario (MVP) es una aplicación en Streamlit para interacción vía chat de texto y voz. Se integran Servicios de Voz con Gemini Speech-to-Text (STT) y Text-to-Speech (TTS). Para la gestión de contexto y estado, se utiliza ADK State (Session Scope) para datos dinámicos y Vertex AI Context Caching para datos estables/grandes (Pautas, Especialidades, Resumen Histórico), aunque la implementación explícita de este último fue ajustada para el MVP según la Sección 15.

La Gestión de Contexto, Estado y Memoria (MVP) es crucial para el desempeño de Zenda. El ADK State (Session Scope) almacena contenido como Entidades Activas (personas, orgs, jargon, conceptos), Criterios Pautas (actualizados por DT cada turno), Tema Elegido, Especialidad Principal/Secundarias, Preferencias Usuario (leídas de clientes) e Información del turno actual (emoción detectada, flags de riesgo básicos). Se usa como memoria de trabajo rápida para la lógica de los agentes (DT, Zenda) durante la sesión, actualizándose dinámicamente. El Vertex AI Context Caching está diseñado para contener Contenido como Pautas Generales (completas, desde Supabase), Definiciones de Especialidades (~35, desde Supabase) y el Resumen Histórico Acumulativo (última versión pre-calculada, desde Supabase sesiones.historical_summary). Su uso es para contexto más estático y/o voluminoso cargado al inicio de sesión, consumido principalmente por el LLM de Zenda para proporcionar conocimiento de fondo y definiciones sin sobrecargar el prompt directo, gestionado con TTLs apropiados. La Estrategia de Memoria Larga se adopta mediante el enfoque de resumen incremental/acumulativo generado post-sesión. Al final de la sesión N, el proceso de QA Post-Sesión invoca un LLM económico para leer la bitácora de la sesión N y el resumen acumulativo de N-1, generando un nuevo resumen acumulativo N que integra ambos. Este nuevo resumen se guarda en un campo dedicado (ej., historical_summary de tipo TEXT o JSONB) en la tabla `sesiones` asociada a la sesión N. Al inicio de la sesión N+1, DT (vía retrieve_summary_tool) lee este campo de la sesión N y lo carga en Context Caching (en el plan original antes de los ajustes del MVP).

El Manejo de Pautas (MVP) es fundamental. El MVP operará con el conjunto existente de ~166 pautas generales transversales (archivo Pautas.csv). Estas pautas deben ser validadas por expertos antes de usarse en el MVP. Se implementará el Mecanismo de Adherencia Obligatoria: lógica explícita en Zenda para identificar la pauta general más relevante, extraer campos clave (Accion, Como, Para) y generar un borrador de respuesta intentando cumplir estrictamente con el Como para lograr el Para. También se preparará la declaración de la pauta usada para QA. Las Pautas Pendientes incluyen desarrollar e implementar nuevas pautas específicas para guiar la fase inicial de cada sesión (Acuerdo de Sesión). Las pautas generales validadas se almacenarán en la tabla `pautas` de Supabase.

El Manejo de Temas y Especialidades (MVP) implica Definiciones: Tema (problema/objetivo del cliente) y Especialidad (enfoque profesional Zenda, ~35 tipos). El flujo de inicio de sesión implica que Cliente expone, Zenda/DT ayudan a elegir Tema, DT consulta tabla temas (vía Tool) para obtener Especialidad(es) recomendadas, y DT actualiza State. Zenda usa Especialidad(es) del State para adaptar su prompt/estilo/persona base y ayudar a contextualizar la selección de pautas generales.

El Manejo de Entidades y Contexto Específico (MVP) usa la tabla `entidades`. Su propósito MVP es almacenar actores relacionales (personas, orgs) Y contexto específico del cliente (Jerga, Conceptos, Proyectos Mencionados, etc.), no para Progreso/Objetivos en MVP. La estructura final (MVP) se basa en la imagen image_d0421e.png. Se usa tipo_entidad Extendido añadiendo valores como "Jargon", "Concepto", "ProyectoCliente". La Coordinación entidades_tool <-> ADK State implica que DT carga entidades activas iniciales en State, Zenda lee primero del State, entidades_tool maneja lectura/escritura en Supabase, y tras una escritura exitosa, Zenda actualiza la entidad correspondiente en el State. La Búsqueda Contextual Interna LLM (Optimizada) implica que Zenda usa su conocimiento interno LLM "on demand" para definir/explicar términos/conceptos, guardando (vía tools) SOLO información muy específica del cliente o muy recurrente como entidad de tipo "Jargon" o "Concepto".

Finalmente, la sección Ajustes al Alcance del MVP (Sección 15) detalla simplificaciones. En lugar de muchos agentes complejos, el MVP usa dos principales (DT y Zenda) con flujo secuencial fijo. Se eliminó el uso explícito del servicio Vertex AI Context Caching del alcance del MVP, basando el contexto de sesión en el ADK State y en incluir contexto relevante directamente en el prompt de ZendaAgentMVP (Implicit Caching). La persistencia de datos de sesión se simplificó a escrituras periódicas a una tabla intermedia y una escritura síncrona completa al final, difiriendo la pipeline asíncrona completa (Pub/Sub + Worker). Funcionalidades avanzadas como análisis emocional multimodal y detección de riesgos sofisticada se difieren, manteniendo solo interacción por voz STT/TTS y análisis emocional basado en texto. El Think Tool como callback con segundo LLM se difiere, basando la adherencia a pautas en el prompt de Zenda y la validación post-sesión del Agente QA, con DT alertando internamente. La implementación de la base de datos se enfocó solo en las tablas y campos indispensables para el MVP. El manejo de la tabla de entidades se simplificó a tipos básicos (Persona, Organizacion), difiriendo tipos extendidos como "Jargon" y relaciones detalladas. El mapeo Tema-Especialidad usa datos estáticos simples en lugar de consulta dinámica a tablas de Supabase. El front-end se enfoca en el núcleo conversacional. El registro de eventos en la bitácora se limita a eventos clave de alto nivel. El soporte multi-lenguaje es básico a nivel de infraestructura. El monitoreo se enfoca en logging estructurado de eventos clave. El proceso de despliegue es manual. El manejo de errores se enfoca en registro y robustez básica. Se mantiene el uso estratégico de Pydantic. El front-end en Streamlit es la prioridad 1 para el MVP.
""" # Este texto combinado debería superar los 1024 tokens.

# --- Inicializar Vertex AI ---
# Esto le dice a la librería con qué proyecto y en qué región trabajar
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    # Si falla la inicialización, detenemos el proceso aquí
    # En Jupyter, puedes continuar en otra celda si corriges el problema
    raise # Relanzamos la excepción para que veas el error completo si ocurre


# --- Crear el Context Cache ---
try:
    print(f"Intentando crear el recurso Context Cache en Vertex AI con el modelo '{MODEL_NAME}' y contenido más largo...")
    # La creación retorna el objeto del recurso cacheado
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1), # El caché durará 1 hora (TTL = Time To Live)
        display_name="zenda-ejemplo-pauta-cache" # Un nombre amigable para identificarlo
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    # Aquí intentamos imprimir los atributos, que causaron el error anterior, pero la creación SÍ funcionó
    try:
        print(f"Tamaño del contenido cacheado (tokens): {cached_content_resource.token_count}")
    except AttributeError:
         print("Nota: No se pudo obtener el conteo de tokens directamente del objeto cached_content_resource.")
    try:
        print(f"Tamaño del contenido cacheado (bytes): {cached_content_resource.size_bytes}")
    except AttributeError:
         print("Nota: No se pudo obtener el tamaño en bytes directamente del objeto cached_content_resource.")


except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- Permisos insuficientes para crear recursos de caching en tu proyecto.")
    print("- Error en el nombre del modelo especificado.")
    print("- Problemas de conexión o configuración de red.")
    print("- El contenido es menor a 1024 tokens.")
    print("Si estás en Workbench, verifica que tienes permisos para Vertex AI.")
    print(f"El contenido tenía {len(contenido_para_cachear.split())} palabras (estimado de tokens).") # Estimación simple

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI con el modelo 'gemini-2.5-pro-preview-05-06' y contenido más largo...

--- ¡Recurso Context Cache creado exitosamente! ---
Nombre del recurso: 6811827477304836096
Fecha de creación: 2025-05-16 19:59:48.893480+00:00
Fecha de expiración: 2025-05-16 20:59:48.878533+00:00
Modelo asociado: projects/zenda-adk/locations/us-central1/publishers/google/models/gemini-2.5-pro-preview-05-06
Nota: No se pudo obtener el conteo de tokens directamente del objeto cached_content_resource.
Nota: No se pudo obtener el tamaño en bytes directamente del objeto cached_content_resource.


In [3]:
import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
# El ID de tu proyecto de Google Cloud
PROJECT_ID = 'zenda-adk'
# La ubicación requerida para Context Caching
LOCATION = "us-central1"
# El nombre del modelo Gemini 2.5 que queremos usar para el caché
# Usamos el nombre que pareció reconocido en el intento anterior
MODEL_NAME = "gemini-2.5-pro-preview-05-06"


# Contenido para cachear - Fragmento MUCHO más extenso del documento Zenda 7
# Este texto está diseñado para superar HOLGADAMENTE los 1024 tokens mínimos requeridos.
# Incluye partes de la introducción, arquitectura, gestión de contexto, manejo de pautas, temas, entidades y ajustes del MVP.
contenido_para_cachear = """
Zenda es un servicio de asistencia conversacional impulsado por inteligencia artificial (IA), orientado a personas que enfrentan desafíos personales, laborales o de desarrollo. El servicio ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas) de acompañamiento, reflexión, observación emocional y evaluación del progreso. Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes. El sistema opera de manera autónoma, basado en un conjunto estructurado de pautas de intervención generales (con planes de incorporar pautas específicas post-MVP) y con mecanismos de calidad (Think Tool interno, QA post-sesión), seguridad y trazabilidad avanzados. Busca ofrecer una experiencia conversacional cálida, empática, útil y profesional.

La arquitectura general (MVP) de Zenda se compone de un Backend Principal desplegado en Google Cloud Run, utilizando contenedores Docker y Python con el Google Agent Development Kit (ADK). La Base de Datos es Supabase (PostgreSQL), alojando toda la información persistente como clientes, entidades, pautas, bitácora, sesiones, temas y especialidades. Los Agentes de IA son orquestados por ADK. Para el MVP, la secuencia principal involucra al Agente DT (Director Técnico - LlmAgent), el Agente Zenda (Agente Conversacional Principal - LlmAgent con Think Tool interno) y el Agente QA (Agente de Calidad - Lógica post-sesión, LlmAgent avanzado). La Interfaz de Usuario (MVP) es una aplicación en Streamlit para interacción vía chat de texto y voz. Se integran Servicios de Voz con Gemini Speech-to-Text (STT) y Text-to-Speech (TTS). Para la gestión de contexto y estado, se utiliza ADK State (Session Scope) para datos dinámicos y Vertex AI Context Caching para datos estables/grandes (Pautas, Especialidades, Resumen Histórico), aunque la implementación explícita de este último fue ajustada para el MVP según la Sección 15.

La Gestión de Contexto, Estado y Memoria (MVP) es crucial para el desempeño de Zenda. El ADK State (Session Scope) almacena contenido como Entidades Activas (personas, orgs, jargon, conceptos), Criterios Pautas (actualizados por DT cada turno), Tema Elegido, Especialidad Principal/Secundarias, Preferencias Usuario (leídas de clientes) e Información del turno actual (emoción detectada, flags de riesgo básicos). Se usa como memoria de trabajo rápida para la lógica de los agentes (DT, Zenda) durante la sesión, actualizándose dinámicamente. El Vertex AI Context Caching está diseñado para contener Contenido como Pautas Generales (completas, desde Supabase), Definiciones de Especialidades (~35, desde Supabase) y el Resumen Histórico Acumulativo (última versión pre-calculada, desde Supabase sesiones.historical_summary). Su uso es para contexto más estático y/o voluminoso cargado al inicio de sesión, consumido principalmente por el LLM de Zenda para proporcionar conocimiento de fondo y definiciones sin sobrecargar el prompt directo, gestionado con TTLs apropiados. La Estrategia de Memoria Larga se adopta mediante el enfoque de resumen incremental/acumulativo generado post-sesión. Al final de la sesión N, el proceso de QA Post-Sesión invoca un LLM económico para leer la bitácora de la sesión N y el resumen acumulativo de N-1, generando un nuevo resumen acumulativo N que integra ambos. Este nuevo resumen se guarda en un campo dedicado (ej., historical_summary de tipo TEXT o JSONB) en la tabla `sesiones` asociada a la sesión N. Al inicio de la sesión N+1, DT (vía retrieve_summary_tool) lee este campo de la sesión N y lo carga en Context Caching (en el plan original antes de los ajustes del MVP).

El Manejo de Pautas (MVP) es fundamental. El MVP operará con el conjunto existente de ~166 pautas generales transversales (archivo Pautas.csv). Estas pautas deben ser validadas por expertos antes de usarse en el MVP. Se implementará el Mecanismo de Adherencia Obligatoria: lógica explícita en Zenda para identificar la pauta general más relevante, extraer campos clave (Accion, Como, Para) y generar un borrador de respuesta intentando cumplir estrictamente con el Como para lograr el Para. También se preparará la declaración de la pauta usada para QA. Las Pautas Pendientes incluyen desarrollar e implementar nuevas pautas específicas para guiar la fase inicial de cada sesión (Acuerdo de Sesión). Las pautas generales validadas se almacenarán en la tabla `pautas` de Supabase.

El Manejo de Temas y Especialidades (MVP) implica Definiciones: Tema (problema/objetivo del cliente) y Especialidad (enfoque profesional Zenda, ~35 tipos). El flujo de inicio de sesión implica que Cliente expone, Zenda/DT ayudan a elegir Tema, DT consulta tabla temas (vía Tool) para obtener Especialidad(es) recomendadas, y DT actualiza State. Zenda usa Especialidad(es) del State para adaptar su prompt/estilo/persona base y ayudar a contextualizar la selección de pautas generales.

El Manejo de Entidades y Contexto Específico (MVP) usa la tabla `entidades`. Su propósito MVP es almacenar actores relacionales (personas, orgs) Y contexto específico del cliente (Jerga, Conceptos, Proyectos Mencionados, etc.), no para Progreso/Objetivos en MVP. La estructura final (MVP) se basa en la imagen image_d0421e.png. Se usa tipo_entidad Extendido añadiendo valores como "Jargon", "Concepto", "ProyectoCliente". La Coordinación entidades_tool <-> ADK State implica que DT carga entidades activas iniciales en State, Zenda lee primero del State, entidades_tool maneja lectura/escritura en Supabase, y tras una escritura exitosa, Zenda actualiza la entidad correspondiente en el State. La Búsqueda Contextual Interna LLM (Optimizada) implica que Zenda usa su conocimiento interno LLM "on demand" para definir/explicar términos/conceptos, guardando (vía tools) SOLO información muy específica del cliente o muy recurrente como entidad de tipo "Jargon" o "Concepto".

Finalmente, la sección Ajustes al Alcance del MVP (Sección 15) detalla simplificaciones. En lugar de muchos agentes complejos, el MVP usa dos principales (DT y Zenda) con flujo secuencial fijo. Se eliminó el uso explícito del servicio Vertex AI Context Caching del alcance del MVP, basando el contexto de sesión en el ADK State y en incluir contexto relevante directamente en el prompt de ZendaAgentMVP (Implicit Caching). La persistencia de datos de sesión se simplificó a escrituras periódicas a una tabla intermedia y una escritura síncrona completa al final, difiriendo la pipeline asíncrona completa (Pub/Sub + Worker). Funcionalidades avanzadas como análisis emocional multimodal y detección de riesgos sofisticada se difieren, manteniendo solo interacción por voz STT/TTS y análisis emocional basado en texto. El Think Tool como callback con segundo LLM se difiere, basando la adherencia a pautas en el prompt de Zenda y la validación post-sesión del Agente QA, con DT alertando internamente. La implementación de la base de datos se enfocó solo en las tablas y campos indispensables para el MVP. El manejo de la tabla de entidades se simplificó a tipos básicos (Persona, Organizacion), difiriendo tipos extendidos como "Jargon" y relaciones detalladas. El mapeo Tema-Especialidad usa datos estáticos simples en lugar de consulta dinámica a tablas de Supabase. El front-end se enfoca en el núcleo conversacional. El registro de eventos en la bitácora se limita a eventos clave de alto nivel. El soporte multi-lenguaje es básico a nivel de infraestructura. El monitoreo se enfoca en logging estructurado de eventos clave. El proceso de despliegue es manual. El manejo de errores se enfoca en registro y robustez básica. Se mantiene el uso estratégico de Pydantic. El front-end en Streamlit es la prioridad 1 para el MVP.
""" # Este texto combinado debería superar los 1024 tokens.

# --- Inicializar Vertex AI ---
# Esto le dice a la librería con qué proyecto y en qué región trabajar
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que el Project ID sea correcto.")
    # Si falla la inicialización, detenemos el proceso aquí
    # En Jupyter, puedes continuar en otra celda si corriges el problema
    raise # Relanzamos la excepción para que veas el error completo si ocurre


# --- Crear el Context Cache ---
try:
    print(f"Intentando crear el recurso Context Cache en Vertex AI con el modelo '{MODEL_NAME}' y contenido más largo...")
    # La creación retorna el objeto del recurso cacheado
    # ¡Este objeto es lo que necesitamos para la variable cached_content_resource!
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1), # El caché durará 1 hora (TTL = Time To Live)
        display_name="zenda-ejemplo-pauta-cache" # Un nombre amigable para identificarlo
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    # Aquí intentamos imprimir los atributos, que causaron el error anterior, pero la creación SÍ funcionó
    try:
        print(f"Tamaño del contenido cacheado (tokens): {cached_content_resource.token_count}")
    except AttributeError:
         print("Nota: No se pudo obtener el conteo de tokens directamente del objeto cached_content_resource.")
    try:
        print(f"Tamaño del contenido cacheado (bytes): {cached_content_resource.size_bytes}")
    except AttributeError:
         print("Nota: No se pudo obtener el tamaño en bytes directamente del objeto cached_content_resource.")


except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas:")
    print("- Permisos insuficientes para crear recursos de caching en tu proyecto.")
    print("- Error en el nombre del modelo especificado.")
    print("- Problemas de conexión o configuración de red.")
    print("- El contenido es menor a 1024 tokens.")
    print("Si estás en Workbench, verifica que tienes permisos para Vertex AI.")
    print(f"El contenido tenía {len(contenido_para_cachear.split())} palabras (estimado de tokens).") # Estimación simple

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI con el modelo 'gemini-2.5-pro-preview-05-06' y contenido más largo...

--- ¡Recurso Context Cache creado exitosamente! ---
Nombre del recurso: 6036082441490268160
Fecha de creación: 2025-05-16 20:01:21.061531+00:00
Fecha de expiración: 2025-05-16 21:01:21.046654+00:00
Modelo asociado: projects/zenda-adk/locations/us-central1/publishers/google/models/gemini-2.5-pro-preview-05-06
Nota: No se pudo obtener el conteo de tokens directamente del objeto cached_content_resource.
Nota: No se pudo obtener el tamaño en bytes directamente del objeto cached_content_resource.


In [4]:
import os
# Importamos google.genai y types
import google.genai
from google.genai import types
# Importamos vertexai también, ya que lo usaremos en la inicialización del cliente genai
import vertexai

# --- Configuración ---
# Estas variables deberían estar definidas (de la celda anterior o definidas aquí si corres solo esta celda)
PROJECT_ID = 'zenda-adk'
LOCATION = "us-central1"
MODEL_NAME = "gemini-2.5-pro-preview-05-06" # El modelo usado para crear el caché

# --- Asegurar que el recurso de caché esté disponible (Mandatorio) ---
# La variable 'cached_content_resource' debe estar definida en esta sesión de Jupyter.

# --- Instrucción: Ejecuta la celda del Paso 2 PRIMERO o usa la OPCIÓN 2 ---
# Si acabas de ejecutar la celda del "Paso 2" con éxito en esta misma sesión, la variable existe.
# Si reiniciaste el kernel, necesitas recuperarla.

# OPCIÓN 2 (Recuperar si reiniciaste el kernel): Descomenta y ejecuta este bloque
# ANTES de la llamada al modelo si la variable no está definida.
# try:
#     print("OPCIÓN 2: Intentando recuperar el recurso de caché por nombre...")
#     # Reemplaza 'EL_ID_NUMERICO_DE_TU_CACHE' con el número ID que obtuviste en la salida exitosa del Paso 2.
#     # ¡TU ÚLTIMO CACHE ID EXITOSO ES: 6036082441490268160 ! Confirma que este número es correcto para ti.
#     cache_resource_id = '6036082441490268160' # <<< ¡USA ESTE ÚLTIMO ID!
#
#     cache_resource_name_str = f"projects/{PROJECT_ID}/locations/{LOCATION}/cachedContents/{cache_resource_id}"
#     genai_client_for_retrieval = google.genai.Client() # Cliente simple para get_cached_content
#     cached_content_resource = genai_client_for_retrieval.get_cached_content(name=cache_resource_name_str)
#     print(f"Recurso de caché '{cache_resource_name_str}' recuperado exitosamente.")
#     print("La variable 'cached_content_resource' ahora debería estar disponible en tu sesión.")
# except Exception as e:
#     print(f"--- Error al recuperar el recurso de caché por nombre (OPCIÓN 2) ---")
#     print(f"Mensaje de error: {e}")
#     cached_content_resource = None # Aseguramos que quede None si hay error
#     # No detenemos la ejecución aquí, el check de abajo manejará si no se recuperó

# --- VERIFICACIÓN MANDATORIA ---
# Verificamos si la variable existe después de intentar la OPCIÓN 1 (correr Paso 2) o la OPCIÓN 2.
if 'cached_content_resource' not in locals() or cached_content_resource is None:
     print("\n--- ERROR FATAL: La variable 'cached_content_resource' NO está disponible. ---")
     print("Debes ejecutar PRIMERO la celda del 'Paso 2' (Mandatorio) CON ÉXITO")
     print("o usar la OPCIÓN 2 de recuperación de caché (descomentando y ejecutando ese bloque) si reiniciaste el kernel.")
     # No podemos continuar sin el recurso. Salimos.
     exit() # Detiene la ejecución si el recurso no está listo
else:
     # Si la variable existe, mostramos el nombre del recurso que vamos a usar para confirmación
     print(f"\nRecurso de caché '{cached_content_resource.name}' encontrado. Procediendo con el Paso 3...")


# --- Inicializar Cliente google.genai (¡CORREGIDO!) ---
# Usaremos google.genai.Client y le pasamos explícitamente la configuración de Vertex AI
try:
    print(f"\nInicializando cliente google.genai para proyecto '{PROJECT_ID}' en región '{LOCATION}'...")
    # ¡CORRECCIÓN FINAL! Pasamos el módulo vertexai, el proyecto y la ubicación al inicializador del cliente genai
    # Esto le dice al cliente genai que use el backend de Vertex AI.
    genai_client = google.genai.Client(
        vertexai=vertexai, # Referencia al módulo vertexai inicializado
        project=PROJECT_ID,
        location=LOCATION
        # También se puede intentar con client_options={'api_endpoint': f"{LOCATION}-aiplatform.googleapis.com"}
        # si la forma anterior no funciona, pero esta es más directa según la doc.
    )
    print("Cliente google.genai inicializado correctamente.")

except Exception as e:
    print(f"--- Error al inicializar cliente google.genai ---")
    print(f"Mensaje de error: {e}")
    print("Asegúrate de que tu entorno esté autenticado con GCP y que tengas permisos de Vertex AI.")
    print("Si estás fuera de GCP, verifica GOOGLE_APPLICATION_CREDENTIALS o GOOGLE_API_KEY.")
    # No detenemos la ejecución aquí si el cliente falla, el error en la llamada al modelo lo indicará
    genai_client = None # Aseguramos que el cliente es None si falló


# --- Usar el Context Cache en una llamada al modelo usando el cliente google.genai ---
# Solo intentamos esto si el cliente se inicializó correctamente
if genai_client:
    try:
        print(f"Intentando usar el caché '{cached_content_resource.name}' en una llamada al modelo '{MODEL_NAME}' usando cliente google.genai...")

        # Define tu prompt. Este prompt se combinará con el contenido cacheado por el modelo.
        prompt_usuario = """
        Basándote EXCLUSIVAMENTE en la información que te fue proporcionada como contexto (el contenido cacheado),
        describe brevemente:
        1. ¿Qué es Zenda?
        2. ¿Cuáles son los 3 agentes principales que lo componen?
        3. ¿Qué mecanismos de gestión de contexto y memoria se mencionan?
        Responde de forma concisa.
        """

        # Creamos un objeto GenerateContentConfig (usando types de google.genai)
        # Y le pasamos el nombre completo del recurso de caché.
        # Este objeto se pasará al parámetro 'config' de generate_content.
        generation_config = types.GenerateContentConfig(
            cached_content=cached_content_resource.name # Pasamos el nombre completo del recurso de caché aquí dentro
            # Puedes añadir otros parámetros de generación si quieres (ej. temperatura, max_output_tokens)
            # temperature=0.2, max_output_tokens=300 # Ejemplo
        )

        # Llama al modelo usando el cliente genai.models.generate_content.
        # Para este cliente, el nombre del modelo se pasa con el path completo del recurso en Vertex AI.
        full_model_name = f"projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/{MODEL_NAME}"

        print("Llamando al modelo generate_content con caché...")
        response = genai_client.models.generate_content(
            model=full_model_name, # Nombre completo del modelo como recurso de Vertex AI
            contents=[{"text": prompt_usuario}], # El prompt como una lista de dicts con clave 'text'
            config=generation_config # Pasamos el objeto de configuración AHORA sí al parámetro 'config'
        )

        print("\n--- Respuesta del modelo usando el Context Cache (cliente google.genai) ---")
        # La respuesta del texto suele estar en response.candidates[0].content.parts[0].text
        try:
            response_text = response.candidates[0].content.parts[0].text
            print(response_text)
        except Exception as e:
            print(f"No se pudo extraer el texto de la respuesta fácilmente: {e}")
            print("Estructura completa de la respuesta para depurar:")
            print(response)


        print("\n--- Intentando mostrar metadatos de uso (cliente google.genai) ---")
        if hasattr(response, 'usage_metadata') and response.usage_metadata:
             print("Metadatos de uso encontrados:")
             # Imprimimos todos los atributos disponibles en usage_metadata
             # El conteo de tokens del caché usado debería aparecer aquí si la llamada lo reporta
             for attr in dir(response.usage_metadata):
                 if not attr.startswith('_'): # Ignorar atributos internos de Python
                     try:
                         value = getattr(response.usage_metadata, attr)
                         print(f"- {attr}: {value}")
                     except Exception:
                         print(f"- {attr}: [No se pudo obtener el valor]")

        else:
            print("No se encontraron metadatos de uso detallados en la respuesta.")


    except Exception as e:
        print(f"\n--- Error al usar el Context Cache en la llamada al modelo (cliente google.genai) ---")
        print(f"Mensaje de error: {e}")
        print("Posibles causas:")
        print("- El recurso de caché ya expiró o fue eliminado (dura 1 hora desde que lo creaste).")
        print(f"- Problemas de conexión o configuración. Asegúrate de que estás en '{LOCATION}'.")
        print("- Error en el nombre del recurso de caché o del modelo.")
        print("- El prompt, el caché o la combinación causaron un error interno del modelo.")
        print("Asegúrate de que el cliente genai está inicializado y autenticado correctamente.")
        cache_name_to_print = "variable cached_content_resource no definida"
        if 'cached_content_resource' in locals() and cached_content_resource:
             try:
                 cache_name_to_print = cached_content_resource.name
             except Exception:
                  cache_name_to_print = "objeto cached_content_resource existe pero sin .name"
        print(f"Nombre del recurso de caché intentado usar: {cache_name_to_print}")

else:
    print("\nNo se pudo intentar la llamada al modelo porque el cliente 'genai_client' no se inicializó correctamente.")


Recurso de caché '6036082441490268160' encontrado. Procediendo con el Paso 3...

Inicializando cliente google.genai para proyecto 'zenda-adk' en región 'us-central1'...
Cliente google.genai inicializado correctamente.
Intentando usar el caché '6036082441490268160' en una llamada al modelo 'gemini-2.5-pro-preview-05-06' usando cliente google.genai...
Llamando al modelo generate_content con caché...

--- Respuesta del modelo usando el Context Cache (cliente google.genai) ---
Basándome exclusivamente en la información proporcionada:

1.  **¿Qué es Zenda?**
    Zenda es un servicio de asistencia conversacional impulsado por IA, orientado a personas con desafíos personales, laborales o de desarrollo. Ofrece sesiones estructuradas con un agente IA que simula múltiples especialidades profesionales, guiado por pautas, combinando coaching, desarrollo personal y asesoramiento.

2.  **¿Cuáles son los 3 agentes principales que lo componen?**
    Los 3 agentes principales en el MVP son:
    *   Ag

/var/tmp/ipykernel_5450/2380921416.py:132: PydanticDeprecatedSince211: Accessing this attribute on the instance is deprecated, and will be removed in Pydantic V3. Instead, you should access this attribute from the model class. Deprecated in Pydantic V2.11 to be removed in V3.0.
  value = getattr(response.usage_metadata, attr)


In [2]:
# Código para Crear el Recurso Context Cache en sa-east1

import vertexai
from vertexai.preview import caching
from vertexai.generative_models import Part
import datetime
import os

# --- Configuración ---
PROJECT_ID = 'zenda-adk'
LOCATION = "us-central1" # <--- ¡IMPORTANTE!: MODIFICADO A 'us-central1'
MODEL_NAME = "gemini-2.5-pro-preview-05-06"

# Contenido para cachear (Fragmento de Zenda 7 > 1024 tokens)
contenido_para_cachear = """
Zenda es un servicio de asistencia conversacional impulsado por inteligencia artificial (IA), orientado a personas que enfrentan desafíos personales, laborales o de desarrollo. El servicio ofrece sesiones estructuradas con un agente IA avanzado (Zenda) capaz de adaptar su enfoque simulando múltiples especialidades profesionales, guiado por protocolos claros (pautas) de acompañamiento, reflexión, observación emocional y evaluación del progreso. Es una mezcla de coaching, desarrollo personal y asesoramiento, operado 100% por agentes inteligentes. El sistema opera de manera autónoma, basado en un conjunto estructurado de pautas de intervención generales (con planes de incorporar pautas específicas post-MVP) y con mecanismos de calidad (Think Tool interno, QA post-sesión), seguridad y trazabilidad avanzados. Busca ofrecer una experiencia conversacional cálida, empática, útil y profesional.

La arquitectura general (MVP) de Zenda se compone de un Backend Principal desplegado en Google Cloud Run, utilizando contenedores Docker y Python con el Google Agent Development Kit (ADK). La Base de Datos es Supabase (PostgreSQL), alojando toda la información persistente como clientes, entidades, pautas, bitácora, sesiones, temas y especialidades. Los Agentes de IA son orquestados por ADK. Para el MVP, la secuencia principal involucra al Agente DT (Director Técnico - LlmAgent), el Agente Zenda (Agente Conversacional Principal - LlmAgent con Think Tool interno) y el Agente QA (Agente de Calidad - LlmAgent avanzado). La Interfaz de Usuario (MVP) es una aplicación en Streamlit para interacción vía chat de texto y voz. Se integran Servicios de Voz con Gemini Speech-to-Text (STT) y Text-to-Speech (TTS). Para la gestión de contexto y estado, se utiliza ADK State (Session Scope) para datos dinámicos y Vertex AI Context Caching para datos estables/grandes (Pautas, Especialidades, Resumen Histórico), aunque la implementación explícita de este último fue ajustada para el MVP según la Sección 15.

La Gestión de Contexto, Estado y Memoria (MVP) es crucial para el desempeño de Zenda. El ADK State (Session Scope) almacena contenido como Entidades Activas (personas, orgs, jargon, conceptos), Criterios Pautas (actualizados por DT cada turno), Tema Elegido, Especialidad Principal/Secundarias, Preferencias Usuario (leídas de clientes) e Información del turno actual (emoción detectada, flags de riesgo básicos). Se usa como memoria de trabajo rápida para la lógica de los agentes (DT, Zenda) durante la sesión, actualizándose dinámicamente. El Vertex AI Context Caching está diseñado para contener Contenido como Pautas Generales (completas, desde Supabase), Definiciones de Especialidades (~35, desde Supabase) y el Resumen Histórico Acumulativo (última versión pre-calculada, desde Supabase sesiones.historical_summary). Su uso es para contexto más estático y/o voluminoso cargado al inicio de sesión, consumido principalmente por el LLM de Zenda para proporcionar conocimiento de fondo y definiciones sin sobrecargar el prompt directo, gestionado con TTLs apropiados. La Estrategia de Memoria Larga se adopta mediante el enfoque de resumen incremental/acumulativo generado post-sesión. Al final de la sesión N, el proceso de QA Post-Sesión invoca un LLM económico para leer la bitácora de la sesión N y el resumen acumulativo de N-1, generando un nuevo resumen acumulativo N que integra ambos. Este nuevo resumen se guarda en un campo dedicado (ej., historical_summary de tipo TEXT o JSONB) en la tabla `sesiones` asociada a la sesión N. Al inicio de la sesión N+1, DT (vía retrieve_summary_tool) lee este campo de la sesión N y lo carga en Context Caching (en el plan original antes de los ajustes del MVP).

El Manejo de Pautas (MVP) es fundamental. El MVP operará con el conjunto existente de ~166 pautas generales transversales (archivo Pautas.csv). Estas pautas deben ser validadas por expertos antes de usarse en el MVP. Se implementará el Mecanismo de Adherencia Obligatoria: lógica explícita en Zenda para identificar la pauta general más relevante, extraer campos clave (Accion, Como, Para) y generar un borrador de respuesta intentando cumplir estrictamente con el Como para lograr el Para. También se preparará la declaración de la pauta usada para QA. Las Pautas Pendientes incluyen desarrollar e implementar nuevas pautas específicas para guiar la fase inicial de cada sesión (Acuerdo de Sesión). Las pautas generales validadas se almacenarán en la tabla `pautas` de Supabase.

El Manejo de Temas y Especialidades (MVP) implica Definiciones: Tema (problema/objetivo del cliente) y Especialidad (enfoque profesional Zenda, ~35 tipos). El flujo de inicio de sesión implica que Cliente expone, Zenda/DT ayudan a elegir Tema, DT consulta tabla temas (vía Tool) para obtener Especialidad(es) recomendadas, y DT actualiza State. Zenda usa Especialidad(es) del State para adaptar su prompt/estilo/persona base y ayudar a contextualizar la selección de pautas generales.

El Manejo de Entidades y Contexto Específico (MVP) usa la tabla `entidades`. Su propósito MVP es almacenar actores relacionales (personas, orgs) Y contexto específico del cliente (Jerga, Conceptos, Proyectos Mencionados, etc.), no para Progreso/Objetivos en MVP. La estructura final (MVP) se basa en la imagen image_d0421e.png. Se usa tipo_entidad Extendido añadiendo valores como "Jargon", "Concepto", "ProyectoCliente". La Coordinación entidades_tool <-> ADK State implica que DT carga entidades activas iniciales en State, Zenda lee primero del State, entidades_tool maneja lectura/escritura en Supabase, y tras una escritura exitosa, Zenda actualiza la entidad correspondiente en el State. La Búsqueda Contextual Interna LLM (Optimizada) implica que Zenda usa su conocimiento interno LLM "on demand" para definir/explicar términos/conceptos, guardando (vía tools) SOLO información muy específica del cliente o muy recurrente como entidad de tipo "Jargon" o "Concepto".

Finalmente, la sección Ajustes al Alcance del MVP (Sección 15) detalla simplificaciones. En lugar de muchos agentes complejos, el MVP usa dos principales (DT y Zenda) con flujo secuencial fijo. Se eliminó el uso explícito del servicio Vertex AI Context Caching del alcance del MVP, basando el contexto de sesión en el ADK State y en incluir contexto relevante directamente en el prompt de ZendaAgentMVP (Implicit Caching). La persistencia de datos de sesión se simplificó a escrituras periódicas a una tabla intermedia y una escritura síncrona completa al final, difiriendo la pipeline asíncrona completa (Pub/Sub + Worker). Funcionalidades avanzadas como análisis emocional multimodal y detección de riesgos sofisticada se difieren, manteniendo solo interacción por voz STT/TTS y análisis emocional basado en texto. El Think Tool como callback con segundo LLM se difiere, basando la adherencia a pautas en el prompt de Zenda y la validación post-sesión del Agente QA, con DT alertando internamente. La implementación de la base de datos se enfocó solo en las tablas y campos indispensables para el MVP. El manejo de la tabla de entidades se simplificó a tipos básicos (Persona, Organizacion), difiriendo tipos extendidos como "Jargon" y relaciones detalladas. El mapeo Tema-Especialidad usa datos estáticos simples en lugar de consulta dinámica a tablas de Supabase. El front-end se enfoca en el núcleo conversacional. El registro de eventos en la bitácora se limita a eventos clave de alto nivel. El soporte multi-lenguaje es básico a nivel de infraestructura. El monitoreo se enfoca en logging estructurado de eventos clave. El proceso de despliegue es manual. El manejo de errores se enfoca en registro y robustez básica. Se mantiene el uso estratégico de Pydantic. El front-end en Streamlit es la prioridad 1 para el MVP.
"""

# --- Inicializar Vertex AI ---
try:
    print(f"Inicializando Vertex AI para el proyecto '{PROJECT_ID}' en la región '{LOCATION}'...")
    vertexai.init(project=PROJECT_ID, location=LOCATION)
    print("Vertex AI inicializado correctamente.")
except Exception as e:
    print(f"Error al inicializar Vertex AI: {e}")
    raise

# --- Crear el Context Cache ---
try:
    print(f"Intentando crear el recurso Context Cache en Vertex AI con el modelo '{MODEL_NAME}' y contenido más largo...")
    cached_content_resource = caching.CachedContent.create(
        model_name=MODEL_NAME,
        contents=[Part.from_text(contenido_para_cachear)],
        ttl=datetime.timedelta(hours=1),
        display_name="zenda-ejemplo-pauta-cache"
    )
    print("\n--- ¡Recurso Context Cache creado exitosamente! ---")
    print(f"Nombre del recurso: {cached_content_resource.name}")
    print(f"Fecha de creación: {cached_content_resource.create_time}")
    print(f"Fecha de expiración: {cached_content_resource.expire_time}")
    print(f"Modelo asociado: {cached_content_resource.model_name}")
    try:
        print(f"Tamaño del contenido cacheado (tokens): {cached_content_resource.token_count}")
    except AttributeError:
        print("Nota: No se pudo obtener el conteo de tokens directamente del objeto cached_content_resource.")
    try:
        print(f"Tamaño del contenido cacheado (bytes): {cached_content_resource.size_bytes}")
    except AttributeError:
        print("Nota: No se pudo obtener el tamaño en bytes directamente del objeto cached_content_resource.")

except Exception as e:
    print(f"\n--- Error al crear el Context Cache ---")
    print(f"Mensaje de error: {e}")
    print("Posibles causas: Permisos, modelo incorrecto, contenido < 1024 tokens, conexión.")

Inicializando Vertex AI para el proyecto 'zenda-adk' en la región 'us-central1'...
Vertex AI inicializado correctamente.
Intentando crear el recurso Context Cache en Vertex AI con el modelo 'gemini-2.5-pro-preview-05-06' y contenido más largo...

--- ¡Recurso Context Cache creado exitosamente! ---
Nombre del recurso: 1301765692193767424
Fecha de creación: 2025-05-22 14:44:22.869979+00:00
Fecha de expiración: 2025-05-22 15:44:22.842176+00:00
Modelo asociado: projects/zenda-adk/locations/us-central1/publishers/google/models/gemini-2.5-pro-preview-05-06
Nota: No se pudo obtener el conteo de tokens directamente del objeto cached_content_resource.
Nota: No se pudo obtener el tamaño en bytes directamente del objeto cached_content_resource.


In [3]:
from schemas import ClienteModel

cliente = ClienteModel(
    id_cliente='11111111-1111-1111-1111-111111111111',
    alias='Ejemplo',
    pais='Argentina',
    genero='M',
    fecha_nacimiento='1990-01-01',
    email='ejemplo@mail.com',
    whatsapp='+541112345678',
    mail_trastorno=None,
    canal=None,
    cod_mktg=None,
    fecha_alta='2024-01-01T00:00:00',
    estado='Buenos Aires',
    preferencias={"idioma": "es"},
    codigo_personal=None,
    ash='22222222-2222-2222-2222-222222222222',
    modo_test=False
)

print(cliente)


id_cliente=UUID('11111111-1111-1111-1111-111111111111') alias='Ejemplo' pais='Argentina' genero='M' fecha_nacimiento=datetime.date(1990, 1, 1) email='ejemplo@mail.com' whatsapp='+541112345678' mail_trastorno=None canal=None cod_mktg=None fecha_alta=datetime.datetime(2024, 1, 1, 0, 0) estado='Buenos Aires' preferencias={'idioma': 'es'} codigo_personal=None ash=UUID('22222222-2222-2222-2222-222222222222') modo_test=False


In [2]:
!pip install pydantic[email]


Collecting email-validator>=2.0.0 (from pydantic[email])
  Downloading email_validator-2.2.0-py3-none-any.whl.metadata (25 kB)
Collecting dnspython>=2.0.0 (from email-validator>=2.0.0->pydantic[email])
  Downloading dnspython-2.7.0-py3-none-any.whl.metadata (5.8 kB)
Downloading email_validator-2.2.0-py3-none-any.whl (33 kB)
Downloading dnspython-2.7.0-py3-none-any.whl (313 kB)
Installing collected packages: dnspython, email-validator
Successfully installed dnspython-2.7.0 email-validator-2.2.0


In [4]:
from schemas import ClienteModel

cliente = ClienteModel(
    id_cliente='11111111-1111-1111-1111-111111111111',
    alias='Ejemplo',
    pais='Argentina',
    genero='M',
    fecha_nacimiento='1990-01-01',
    email='ejemplo@mail.com',
    whatsapp='+541112345678',
    mail_trastorno=None,
    canal=None,
    cod_mktg=None,
    fecha_alta='2024-01-01T00:00:00',
    estado='Buenos Aires',
    preferencias={"idioma": "es"},
    codigo_personal=None,
    ash='22222222-2222-2222-2222-222222222222',
    modo_test=False
)

print(cliente)


id_cliente=UUID('11111111-1111-1111-1111-111111111111') alias='Ejemplo' pais='Argentina' genero='M' fecha_nacimiento=datetime.date(1990, 1, 1) email='ejemplo@mail.com' whatsapp='+541112345678' mail_trastorno=None canal=None cod_mktg=None fecha_alta=datetime.datetime(2024, 1, 1, 0, 0) estado='Buenos Aires' preferencias={'idioma': 'es'} codigo_personal=None ash=UUID('22222222-2222-2222-2222-222222222222') modo_test=False


In [5]:
from schemas import TokenModel
from uuid import UUID
from datetime import datetime

token = TokenModel(
    id_token=UUID("aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa"),
    id_cliente=UUID("11111111-1111-1111-1111-111111111111"),
    id_origen="chat_gpt",
    tokens=243,
    fecha=datetime.now()
)

print(token)


id_token=UUID('aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa') id_cliente=UUID('11111111-1111-1111-1111-111111111111') id_origen='chat_gpt' tokens=243 fecha=datetime.datetime(2025, 5, 27, 18, 55, 54, 103399)


In [6]:
from schemas import ClienteModel
from uuid import UUID
from datetime import datetime, date

try:
    cliente = ClienteModel(
        id_cliente=UUID('11111111-1111-1111-1111-111111111111'),
        alias='Ejemplo',
        pais='Argentina',
        genero='M',
        fecha_nacimiento=date(1990, 1, 1),
        email='esto-no-es-un-email',  # ❌ inválido
        whatsapp='+541112345678',
        mail_trastorno=None,
        canal=None,
        cod_mktg=None,
        fecha_alta=datetime.now(),
        estado='Buenos Aires',
        preferencias={"idioma": "es"},
        codigo_personal=None,
        ash=UUID('22222222-2222-2222-2222-222222222222'),
        modo_test=False
    )
except Exception as e:
    print("❌ Error detectado:")
    print(e)


❌ Error detectado:
1 validation error for ClienteModel
email
  value is not a valid email address: An email address must have an @-sign. [type=value_error, input_value='esto-no-es-un-email', input_type=str]


In [7]:
from schemas import TokenModel
from uuid import UUID
from datetime import datetime

# Simula una función del backend que registra tokens
def registrar_consumo_token(datos: dict) -> TokenModel:
    modelo = TokenModel(**datos)
    print("✅ Registro exitoso de tokens:")
    return modelo

# Llamada de ejemplo
nuevo_token = registrar_consumo_token({
    "id_token": "bbbbbbbb-bbbb-bbbb-bbbb-bbbbbbbbbbbb",
    "id_cliente": "11111111-1111-1111-1111-111111111111",
    "id_origen": "google_llm",
    "tokens": 1000,
    "fecha": "2025-05-27T18:55:00"
})

print(nuevo_token)


✅ Registro exitoso de tokens:
id_token=UUID('bbbbbbbb-bbbb-bbbb-bbbb-bbbbbbbbbbbb') id_cliente=UUID('11111111-1111-1111-1111-111111111111') id_origen='google_llm' tokens=1000 fecha=datetime.datetime(2025, 5, 27, 18, 55)


In [8]:
from tokens.funciones import guardar_token_en_sistema

resultado = guardar_token_en_sistema({
    "id_token": "cccccccc-cccc-cccc-cccc-cccccccccccc",
    "id_cliente": "11111111-1111-1111-1111-111111111111",
    "id_origen": "gemini",
    "tokens": 777,
    "fecha": "2025-05-27T19:00:00"
})

print(resultado)


✔️ Guardado: gemini, tokens: 777
id_token=UUID('cccccccc-cccc-cccc-cccc-cccccccccccc') id_cliente=UUID('11111111-1111-1111-1111-111111111111') id_origen='gemini' tokens=777 fecha=datetime.datetime(2025, 5, 27, 19, 0)


In [1]:
# schemas/session_context.py
from pydantic import BaseModel
from typing import Optional, List, Dict, Any
from uuid import UUID

class SessionContext(BaseModel):
    # Identificadores básicos
    id_cliente: UUID
    id_sesion: UUID
    
    # Estado de sesión
    fase_actual: str = "Inicio_Sesion"  # "Inicio_Sesion", "Desarrollo_Sesion", "Cierre_Sesion"
    modo_asistencia: str = "Integral"   # "Integral", "Rotativo", "Especialidad", "Urgente"
    
    # Dirección estratégica (DT)
    guion_dt: Optional[str] = None
    acuerdo_sesion: Optional[str] = None
    criterios: Dict[str, Any] = {}
    pautas_priorizadas: List[str] = []
    
    # Memoria y contexto
    resumen_memoria_larga: Optional[str] = None
    interacciones_recientes: List[Dict[str, Any]] = []
    
    # Configuración de usuario
    preferencias_usuario: Dict[str, Any] = {}
    
    # Especialidades
    especialidad_principal: Optional[str] = None
    especialidades_secundarias: List[str] = []
    
    # Modo rotativo específico
    ciclo_rotativo_actual: Optional[str] = None
    
    # Think Tool
    think_tool_activado: bool = False
    motivo_tt: Optional[str] = None  # "S" (Sensible), "F" (Falla)
    
    class Config:
        # Permitir campos adicionales para extensibilidad
        extra = "allow"

In [2]:
content = '''from pydantic import BaseModel
from typing import Optional, List, Dict, Any
from uuid import UUID

class SessionContext(BaseModel):
    # Identificadores básicos
    id_cliente: UUID
    id_sesion: UUID
    
    # Estado de sesión
    fase_actual: str = "Inicio_Sesion"  
    modo_asistencia: str = "Integral"   
    
    # Dirección estratégica (DT)
    guion_dt: Optional[str] = None
    acuerdo_sesion: Optional[str] = None
    criterios: Dict[str, Any] = {}
    pautas_priorizadas: List[str] = []
    
    # Memoria y contexto
    resumen_memoria_larga: Optional[str] = None
    interacciones_recientes: List[Dict[str, Any]] = []
    
    # Configuración de usuario
    preferencias_usuario: Dict[str, Any] = {}
    
    # Especialidades
    especialidad_principal: Optional[str] = None
    especialidades_secundarias: List[str] = []
    
    # Modo rotativo específico
    ciclo_rotativo_actual: Optional[str] = None
    
    # Think Tool
    think_tool_activado: bool = False
    motivo_tt: Optional[str] = None  # "S" (Sensible), "F" (Falla)
    
    class Config:
        extra = "allow"
'''

with open('/home/jupyter/Zenda_ADK/schemas/session_context.py', 'w') as f:
    f.write(content)
    
print("Archivo session_context.py creado exitosamente!")

Archivo session_context.py creado exitosamente!


In [3]:
# Agregar SessionContext al __init__.py
with open('/home/jupyter/Zenda_ADK/schemas/__init__.py', 'r') as f:
    current_content = f.read()

# Agregar import de SessionContext
new_content = current_content.replace(
    'from .tema_especialidad import TemaEspecialidadModel',
    '''from .tema_especialidad import TemaEspecialidadModel
from .session_context import SessionContext'''
)

with open('/home/jupyter/Zenda_ADK/schemas/__init__.py', 'w') as f:
    f.write(new_content)
    
print("schemas/__init__.py actualizado!")
print("\nContenido actual:")
with open('/home/jupyter/Zenda_ADK/schemas/__init__.py', 'r') as f:
    print(f.read())

schemas/__init__.py actualizado!

Contenido actual:
# Zenda - schemas/__init__.py

from .clientes import ClienteModel
from .sesiones import SesionModel
from .bitacora import BitacoraModel
from .qa import QaModel
from .ctacte import CtacteModel
from .entidades import EntidadModel
from .especialidades import EspecialidadModel
from .marketing import MarketingModel
from .tokens import TokenModel
from .tarifas import TarifaModel
from .pautas import PautaModel
from .temas import TemaModel
from .tema_especialidad import TemaEspecialidadModel
from .session_context import SessionContext



In [4]:
# Test básico de SessionContext Pydantic
from schemas import SessionContext
import uuid

# Crear un SessionContext de prueba
test_context = SessionContext(
    id_cliente=uuid.uuid4(),
    id_sesion=uuid.uuid4(),
    fase_actual="Inicio_Sesion",
    modo_asistencia="Integral",
    criterios={"foco": "rapport"},
    pautas_priorizadas=["ICF-1.1_escucha_activa"],
    preferencias_usuario={"idioma": "es", "tono": "cercano"}
)

print("✅ SessionContext Pydantic creado exitosamente!")
print(f"ID Cliente: {test_context.id_cliente}")
print(f"Fase: {test_context.fase_actual}")
print(f"Modo: {test_context.modo_asistencia}")

# Test de serialización
context_dict = test_context.model_dump()
print(f"✅ Serialización funcionando: {len(context_dict)} campos")

# Test de copia
context_copy = test_context.model_copy()
print(f"✅ Copia funcionando: {context_copy.fase_actual}")

ImportError: cannot import name 'SessionContext' from 'schemas.session_context' (/home/jupyter/Zenda_ADK/schemas/session_context.py)

In [5]:
# Verificar contenido del archivo session_context.py
with open('/home/jupyter/Zenda_ADK/schemas/session_context.py', 'r') as f:
    content = f.read()

print("=== CONTENIDO ACTUAL session_context.py ===")
print(content)
print("=== FIN ===")

=== CONTENIDO ACTUAL session_context.py ===

=== FIN ===


In [6]:
# Test básico de SessionContext Pydantic
from schemas import SessionContext
import uuid

# Crear un SessionContext de prueba
test_context = SessionContext(
    id_cliente=uuid.uuid4(),
    id_sesion=uuid.uuid4(),
    fase_actual="Inicio_Sesion",
    modo_asistencia="Integral",
    criterios={"foco": "rapport"},
    pautas_priorizadas=["ICF-1.1_escucha_activa"],
    preferencias_usuario={"idioma": "es", "tono": "cercano"}
)

print("✅ SessionContext Pydantic creado exitosamente!")
print(f"ID Cliente: {test_context.id_cliente}")
print(f"Fase: {test_context.fase_actual}")
print(f"Modo: {test_context.modo_asistencia}")

# Test de serialización
context_dict = test_context.model_dump()
print(f"✅ Serialización funcionando: {len(context_dict)} campos")

# Test de copia
context_copy = test_context.model_copy()
print(f"✅ Copia funcionando: {context_copy.fase_actual}")

print("\n🎯 PRIMERA TAREA COMPLETADA: SessionContext Pydantic real funcionando!")

ImportError: cannot import name 'SessionContext' from 'schemas.session_context' (/home/jupyter/Zenda_ADK/schemas/session_context.py)

In [7]:
# Primero, verificar que el archivo tiene contenido
import os
print("Tamaño del archivo:", os.path.getsize('/home/jupyter/Zenda_ADK/schemas/session_context.py'))

# Ver contenido nuevamente
with open('/home/jupyter/Zenda_ADK/schemas/session_context.py', 'r') as f:
    content = f.read()
    
print("Primeras 200 caracteres:")
print(content[:200])

Tamaño del archivo: 1495
Primeras 200 caracteres:
# Recrear session_context.py con el contenido correcto
content = '''from pydantic import BaseModel
from typing import Optional, List, Dict, Any
from uuid import UUID

class SessionContext(BaseModel):



In [8]:
# Corregir el archivo - escribir solo el contenido, no el código Python
content_only = '''from pydantic import BaseModel
from typing import Optional, List, Dict, Any
from uuid import UUID

class SessionContext(BaseModel):
    # Identificadores básicos
    id_cliente: UUID
    id_sesion: UUID
    
    # Estado de sesión
    fase_actual: str = "Inicio_Sesion"  # "Inicio_Sesion", "Desarrollo_Sesion", "Cierre_Sesion"
    modo_asistencia: str = "Integral"   # "Integral", "Rotativo", "Especialidad", "Urgente"
    
    # Dirección estratégica (DT)
    guion_dt: Optional[str] = None
    acuerdo_sesion: Optional[str] = None
    criterios: Dict[str, Any] = {}
    pautas_priorizadas: List[str] = []
    
    # Memoria y contexto
    resumen_memoria_larga: Optional[str] = None
    interacciones_recientes: List[Dict[str, Any]] = []
    
    # Configuración de usuario
    preferencias_usuario: Dict[str, Any] = {}
    
    # Especialidades
    especialidad_principal: Optional[str] = None
    especialidades_secundarias: List[str] = []
    
    # Modo rotativo específico
    ciclo_rotativo_actual: Optional[str] = None
    
    # Think Tool
    think_tool_activado: bool = False
    motivo_tt: Optional[str] = None  # "S" (Sensible), "F" (Falla)
    
    class Config:
        # Permitir campos adicionales para extensibilidad
        extra = "allow"
'''

with open('/home/jupyter/Zenda_ADK/schemas/session_context.py', 'w') as f:
    f.write(content_only)
    
print("✅ Archivo session_context.py corregido!")

# Verificar contenido
with open('/home/jupyter/Zenda_ADK/schemas/session_context.py', 'r') as f:
    content = f.read()
    
print("Primeras 100 caracteres:")
print(content[:100])

✅ Archivo session_context.py corregido!
Primeras 100 caracteres:
from pydantic import BaseModel
from typing import Optional, List, Dict, Any
from uuid import UUID

c


In [1]:
# Test después de restart - EJECUTAR DESPUÉS DE REINICIAR KERNEL
from schemas import SessionContext
import uuid

# Crear un SessionContext de prueba
test_context = SessionContext(
    id_cliente=uuid.uuid4(),
    id_sesion=uuid.uuid4(),
    fase_actual="Inicio_Sesion",
    modo_asistencia="Integral",
    criterios={"foco": "rapport"},
    pautas_priorizadas=["ICF-1.1_escucha_activa"],
    preferencias_usuario={"idioma": "es", "tono": "cercano"}
)

print("✅ SessionContext Pydantic creado exitosamente!")
print(f"ID Cliente: {test_context.id_cliente}")
print(f"Fase: {test_context.fase_actual}")
print(f"Modo: {test_context.modo_asistencia}")

# Test de serialización
context_dict = test_context.model_dump()
print(f"✅ Serialización funcionando: {len(context_dict)} campos")

# Test de copia
context_copy = test_context.model_copy()
print(f"✅ Copia funcionando: {context_copy.fase_actual}")

print("\n🎯 PRIMERA TAREA COMPLETADA: SessionContext Pydantic real funcionando!")

✅ SessionContext Pydantic creado exitosamente!
ID Cliente: 0dedac37-a217-440d-afd0-549f11d18554
Fase: Inicio_Sesion
Modo: Integral
✅ Serialización funcionando: 16 campos
✅ Copia funcionando: Inicio_Sesion

🎯 PRIMERA TAREA COMPLETADA: SessionContext Pydantic real funcionando!


In [2]:
# Test de las FunctionTools convertidas
from tools.bitacora_tool import bitacora_tool
from tools.emotion_detection_tool import emotion_detection_tool

print("=== TEST FUNCTIONTOOLS ADK ===")
print(f"bitacora_tool type: {type(bitacora_tool)}")
print(f"emotion_tool type: {type(emotion_detection_tool)}")

# Test básico de ejecución
result = emotion_detection_tool.function("Me siento muy frustrado con mi trabajo")
print(f"Resultado emotion: {result}")

✅ bitacora_tool.py convertido a FunctionTool ADK!


ImportError: cannot import name 'bitacora_tool' from 'tools.bitacora_tool' (/home/jupyter/Zenda_ADK/tools/bitacora_tool.py)

In [3]:
for file in /home/jupyter/Zenda_ADK/tools/*.py; do echo "=== $file ==="; cat "$file"; echo -e "\n\n"; done

SyntaxError: invalid syntax (1170636373.py, line 1)

In [1]:
# Test completo de FunctionTools ADK
print("=== TESTING FUNCTIONTOOLS ADK ===")

# Test imports
try:
    from tools.bitacora_tool import bitacora_tool
    from tools.emotion_detection_tool import emotion_detection_tool
    from tools.entidades_tool import entidades_tool
    print("✅ Imports exitosos!")
    
    # Test types
    print(f"bitacora_tool type: {type(bitacora_tool)}")
    print(f"emotion_tool type: {type(emotion_detection_tool)}")
    print(f"entidades_tool type: {type(entidades_tool)}")
    
    # Test ejecución básica
    print("\n=== TEST EJECUCIÓN ===")
    
    # Test emotion detection
    emotion_result = emotion_detection_tool.function("Me siento muy frustrado con este trabajo")
    print(f"Emotion result: {emotion_result}")
    
    # Test bitacora
    bitacora_result = bitacora_tool.function(
        session_id="test_session_123",
        client_id="test_client_456", 
        actor="cliente",
        tipo="msg",
        texto="Hola, necesito ayuda"
    )
    print(f"Bitacora result: {bitacora_result}")
    
    print("\n🎉 TODAS LAS FUNCTIONTOOLS FUNCIONANDO CORRECTAMENTE!")
    
except Exception as e:
    print(f"❌ Error: {e}")
    import traceback
    traceback.print_exc()

=== TESTING FUNCTIONTOOLS ADK ===
❌ Error: No module named 'google.adk.function_tool'


Traceback (most recent call last):
  File "/var/tmp/ipykernel_8783/303311112.py", line 6, in <module>
    from tools.bitacora_tool import bitacora_tool
  File "/home/jupyter/Zenda_ADK/tools/bitacora_tool.py", line 1, in <module>
    from google.adk.function_tool import FunctionTool
ModuleNotFoundError: No module named 'google.adk.function_tool'


In [2]:
# Test después de restart del kernel
print("=== TESTING FUNCTIONTOOLS ADK (POST-RESTART) ===")

try:
    from tools.bitacora_tool import bitacora_tool
    from tools.emotion_detection_tool import emotion_detection_tool
    print("✅ Imports exitosos!")
    
    # Test types
    print(f"bitacora_tool type: {type(bitacora_tool)}")
    print(f"emotion_tool type: {type(emotion_detection_tool)}")
    
    # Test ejecución básica
    emotion_result = emotion_detection_tool.function("Me siento muy frustrado")
    print(f"Emotion result: {emotion_result}")
    
    print("\n🎯 FUNCTIONTOOLS FUNCIONANDO! ✅")
    
except Exception as e:
    print(f"❌ Error: {e}")

=== TESTING FUNCTIONTOOLS ADK (POST-RESTART) ===
❌ Error: No module named 'google.adk.function_tool'


In [3]:
# Test FunctionTools con ADK real instalado
print("=== TESTING FUNCTIONTOOLS CON ADK REAL ===")

try:
    from tools.bitacora_tool import bitacora_tool
    from tools.emotion_detection_tool import emotion_detection_tool
    from tools.entidades_tool import entidades_tool
    
    print("✅ Imports exitosos!")
    
    # Verificar que son FunctionTool reales
    print(f"bitacora_tool type: {type(bitacora_tool)}")
    print(f"emotion_tool type: {type(emotion_detection_tool)}")
    
    # Test ejecución básica
    print("\n=== TEST EJECUCIÓN ===")
    
    # Test emotion detection
    emotion_result = emotion_detection_tool.function("Me siento muy frustrado con este trabajo")
    print(f"✅ Emotion result: {emotion_result}")
    
    # Test bitacora
    bitacora_result = bitacora_tool.function(
        session_id="test_session_123",
        client_id="test_client_456", 
        actor="cliente",
        tipo="msg",
        texto="Hola, necesito ayuda con mi ansiedad"
    )
    print(f"✅ Bitacora result: {bitacora_result}")
    
    # Test entidades
    entidades_result = entidades_tool.function(
        session_id="test_session_123",
        client_id="test_client_456",
        action="guardar",
        entity_data={
            "tipo_entidad": "Persona",
            "nombre_entidad": "Mi jefe",
            "datos_entidad": {"relacion": "conflictiva"}
        }
    )
    print(f"✅ Entidades result: {entidades_result}")
    
    print("\n🎉 TODAS LAS FUNCTIONTOOLS ADK FUNCIONANDO CORRECTAMENTE!")
    print("\n🎯 TAREA 6 COMPLETADA: FunctionTools convertidas a ADK ✅")
    
except Exception as e:
    print(f"❌ Error: {e}")
    import traceback
    traceback.print_exc()

=== TESTING FUNCTIONTOOLS CON ADK REAL ===
❌ Error: No module named 'google.adk.function_tool'


Traceback (most recent call last):
  File "/var/tmp/ipykernel_8783/4139156093.py", line 5, in <module>
    from tools.bitacora_tool import bitacora_tool
  File "/home/jupyter/Zenda_ADK/tools/bitacora_tool.py", line 1, in <module>
    from google.adk.function_tool import FunctionTool
ModuleNotFoundError: No module named 'google.adk.function_tool'


In [4]:
# Corregir import en todos los archivos tools
import os

# Lista de archivos a corregir
tool_files = [
    '/home/jupyter/Zenda_ADK/tools/bitacora_tool.py',
    '/home/jupyter/Zenda_ADK/tools/emotion_detection_tool.py', 
    '/home/jupyter/Zenda_ADK/tools/entidades_tool.py',
    '/home/jupyter/Zenda_ADK/tools/retrieve_client_data_tool.py',
    '/home/jupyter/Zenda_ADK/tools/save_context_info_tool.py',
    '/home/jupyter/Zenda_ADK/tools/save_qa_report_tool.py',
    '/home/jupyter/Zenda_ADK/tools/update_session_summary_tool.py'
]

for file_path in tool_files:
    if os.path.exists(file_path):
        # Leer contenido
        with open(file_path, 'r') as f:
            content = f.read()
        
        # Reemplazar import incorrecto por correcto
        new_content = content.replace(
            'from google.adk.function_tool import FunctionTool',
            'from google.adk.tools import FunctionTool'
        )
        
        # Escribir archivo corregido
        with open(file_path, 'w') as f:
            f.write(new_content)
        
        print(f"✅ Corregido: {os.path.basename(file_path)}")
    else:
        print(f"❌ No encontrado: {file_path}")

print("\n🎯 TODOS LOS IMPORTS CORREGIDOS!")

✅ Corregido: bitacora_tool.py
✅ Corregido: emotion_detection_tool.py
✅ Corregido: entidades_tool.py
✅ Corregido: retrieve_client_data_tool.py
✅ Corregido: save_context_info_tool.py
✅ Corregido: save_qa_report_tool.py
✅ Corregido: update_session_summary_tool.py

🎯 TODOS LOS IMPORTS CORREGIDOS!


In [5]:
# Test completo de FunctionTools con ADK 1.1.1
print("=== TESTING FUNCTIONTOOLS CON ADK 1.1.1 ===")

try:
    # Test imports
    from tools.bitacora_tool import bitacora_tool
    from tools.emotion_detection_tool import emotion_detection_tool
    from tools.entidades_tool import entidades_tool
    
    print("✅ Imports exitosos!")
    
    # Verificar que son FunctionTool reales
    print(f"bitacora_tool type: {type(bitacora_tool)}")
    print(f"emotion_tool type: {type(emotion_detection_tool)}")
    print(f"entidades_tool type: {type(entidades_tool)}")
    
    # Test ejecución básica
    print("\n=== TEST EJECUCIÓN ===")
    
    # Test emotion detection
    emotion_result = emotion_detection_tool.function("Me siento muy frustrado con este trabajo")
    print(f"✅ Emotion result: {emotion_result}")
    
    # Test bitacora
    bitacora_result = bitacora_tool.function(
        session_id="test_session_123",
        client_id="test_client_456", 
        actor="cliente",
        tipo="msg",
        texto="Hola, necesito ayuda con mi ansiedad"
    )
    print(f"✅ Bitacora result: {bitacora_result}")
    
    # Test entidades
    entidades_result = entidades_tool.function(
        session_id="test_session_123",
        client_id="test_client_456",
        action="guardar",
        entity_data={
            "tipo_entidad": "Persona",
            "nombre_entidad": "Mi jefe",
            "datos_entidad": {"relacion": "conflictiva"}
        }
    )
    print(f"✅ Entidades result: {entidades_result}")
    
    print("\n🎉 TODAS LAS FUNCTIONTOOLS ADK 1.1.1 FUNCIONANDO CORRECTAMENTE!")
    print("\n🎯 TAREA COMPLETADA: FunctionTools + ADK 1.1.1 ✅")
    
except Exception as e:
    print(f"❌ Error: {e}")
    import traceback
    traceback.print_exc()

=== TESTING FUNCTIONTOOLS CON ADK 1.1.1 ===
✅ emotion_detection_tool.py corregido!
❌ Error: cannot import name 'emotion_detection_tool' from 'tools.emotion_detection_tool' (/home/jupyter/Zenda_ADK/tools/emotion_detection_tool.py)


Traceback (most recent call last):
  File "/var/tmp/ipykernel_8783/1756752972.py", line 7, in <module>
    from tools.emotion_detection_tool import emotion_detection_tool
ImportError: cannot import name 'emotion_detection_tool' from 'tools.emotion_detection_tool' (/home/jupyter/Zenda_ADK/tools/emotion_detection_tool.py)


In [1]:
# Test básico post-reinicio
print("=== VERIFICACIÓN POST-REINICIO ===")

# 1. Verificar ADK
try:
    import google.adk
    print(f"✅ ADK Version: {google.adk.__version__}")
except Exception as e:
    print(f"❌ ADK Error: {e}")

# 2. Verificar FunctionTool
try:
    from google.adk.tools import FunctionTool
    print("✅ FunctionTool import: SUCCESS")
except Exception as e:
    print(f"❌ FunctionTool Error: {e}")

# 3. Verificar archivos tools existen
import os
tool_files = [
    '/home/jupyter/Zenda_ADK/tools/bitacora_tool.py',
    '/home/jupyter/Zenda_ADK/tools/emotion_detection_tool.py'
]

for file_path in tool_files:
    if os.path.exists(file_path):
        size = os.path.getsize(file_path)
        print(f"✅ {os.path.basename(file_path)}: {size} bytes")
    else:
        print(f"❌ {os.path.basename(file_path)}: NO EXISTE")

=== VERIFICACIÓN POST-REINICIO ===
✅ ADK Version: 1.1.1
✅ FunctionTool import: SUCCESS
✅ bitacora_tool.py: 2107 bytes
✅ emotion_detection_tool.py: 1679 bytes


In [2]:
# Test completo de FunctionTools ADK 1.1.1
print("=== TEST FINAL FUNCTIONTOOLS ===")

try:
    # Test imports de nuestras tools
    from tools.bitacora_tool import bitacora_tool
    from tools.emotion_detection_tool import emotion_detection_tool
    
    print("✅ Imports exitosos!")
    
    # Verificar tipos ADK
    print(f"bitacora_tool type: {type(bitacora_tool)}")
    print(f"emotion_tool type: {type(emotion_detection_tool)}")
    
    # Test ejecución real
    print("\n=== TEST EJECUCIÓN ===")
    
    # Test emotion detection
    emotion_result = emotion_detection_tool.function("Me siento muy frustrado con mi trabajo")
    print(f"✅ Emotion detection result: {emotion_result}")
    
    # Test bitacora
    bitacora_result = bitacora_tool.function(
        session_id="test_session_123",
        client_id="test_client_456", 
        actor="cliente",
        tipo="msg",
        texto="Hola, necesito ayuda con mi ansiedad"
    )
    print(f"✅ Bitacora result: {bitacora_result}")
    
    print("\n🎉 ¡TODAS LAS FUNCTIONTOOLS ADK 1.1.1 FUNCIONANDO PERFECTAMENTE!")
    print("🎯 TAREA 6 COMPLETADA: FunctionTools convertidas a ADK ✅")
    
except Exception as e:
    print(f"❌ Error: {e}")
    import traceback
    traceback.print_exc()

=== TEST FINAL FUNCTIONTOOLS ===
✅ Imports exitosos!
bitacora_tool type: <class 'google.adk.tools.function_tool.FunctionTool'>
emotion_tool type: <class 'google.adk.tools.function_tool.FunctionTool'>

=== TEST EJECUCIÓN ===
❌ Error: 'FunctionTool' object has no attribute 'function'


Traceback (most recent call last):
  File "/var/tmp/ipykernel_3001/2444206848.py", line 19, in <module>
    emotion_result = emotion_detection_tool.function("Me siento muy frustrado con mi trabajo")
AttributeError: 'FunctionTool' object has no attribute 'function'


In [3]:
# Investigar API de FunctionTool
print("=== INVESTIGANDO API FUNCTIONTOOL ===")

from tools.bitacora_tool import bitacora_tool

# Ver qué métodos/atributos tiene FunctionTool
print("Atributos de FunctionTool:")
attributes = [attr for attr in dir(bitacora_tool) if not attr.startswith('_')]
for attr in attributes:
    print(f"  📋 {attr}")

print("\n" + "="*50)

# Probar métodos comunes
test_methods = ['call', 'invoke', 'run', 'execute', '__call__']
for method in test_methods:
    if hasattr(bitacora_tool, method):
        print(f"✅ {method}: DISPONIBLE")
        print(f"   Tipo: {type(getattr(bitacora_tool, method))}")
    else:
        print(f"❌ {method}: NO DISPONIBLE")

print("\n" + "="*50)

# Ver si es callable directamente
print(f"¿Es callable directamente? {callable(bitacora_tool)}")

# Intentar llamada directa
try:
    result = bitacora_tool(
        session_id="test", 
        client_id="test", 
        actor="test", 
        tipo="msg", 
        texto="test"
    )
    print(f"✅ Llamada directa funciona: {result}")
except Exception as e:
    print(f"❌ Llamada directa falla: {e}")

=== INVESTIGANDO API FUNCTIONTOOL ===
Atributos de FunctionTool:
  📋 description
  📋 func
  📋 is_long_running
  📋 name
  📋 process_llm_request
  📋 run_async

❌ call: NO DISPONIBLE
❌ invoke: NO DISPONIBLE
❌ run: NO DISPONIBLE
❌ execute: NO DISPONIBLE
❌ __call__: NO DISPONIBLE

¿Es callable directamente? False
❌ Llamada directa falla: 'FunctionTool' object is not callable


In [4]:
# Test con API correcta de FunctionTool
print("=== TEST CON API CORRECTA ===")

try:
    from tools.bitacora_tool import bitacora_tool
    from tools.emotion_detection_tool import emotion_detection_tool
    
    print("✅ Imports exitosos!")
    
    # Test usando .func (la función original)
    print("\n=== TEST EJECUCIÓN CON .func ===")
    
    # Test emotion detection usando .func
    emotion_result = emotion_detection_tool.func("Me siento muy frustrado con mi trabajo")
    print(f"✅ Emotion detection result: {emotion_result}")
    
    # Test bitacora usando .func
    bitacora_result = bitacora_tool.func(
        session_id="test_session_123",
        client_id="test_client_456", 
        actor="cliente",
        tipo="msg",
        texto="Hola, necesito ayuda con mi ansiedad"
    )
    print(f"✅ Bitacora result: {bitacora_result}")
    
    # Verificar otros atributos importantes
    print(f"\n📋 Información de las tools:")
    print(f"Emotion tool name: {emotion_detection_tool.name}")
    print(f"Emotion tool description: {emotion_detection_tool.description[:100]}...")
    print(f"Bitacora tool name: {bitacora_tool.name}")
    
    print("\n🎉 ¡FUNCTIONTOOLS ADK 1.1.1 FUNCIONANDO CORRECTAMENTE!")
    print("🎯 API CORRECTA: usar .func para ejecutar las funciones")
    
except Exception as e:
    print(f"❌ Error: {e}")
    import traceback
    traceback.print_exc()

=== TEST CON API CORRECTA ===
✅ Imports exitosos!

=== TEST EJECUCIÓN CON .func ===

[EMOTION_TOOL]: Analizando texto: 'Me siento muy frustrado con mi trabajo...'
       -> EMOCIÓN DETECTADA: {'emocion': 'frustracion', 'nivel': 'alto', 'tono_general': 'pesimista', 'confianza': 0.8}
✅ Emotion detection result: {'emocion': 'frustracion', 'nivel': 'alto', 'tono_general': 'pesimista', 'confianza': 0.8}

[BITACORA_TOOL]: Sesion=test_session_123, Cliente=test_client_456
                  Actor=cliente, Tipo=msg
                  Texto='Hola, necesito ayuda con mi ansiedad...'
       -> BITACORA REGISTRADO: {
  "session_id": "test_session_123",
  "user_id": "test_client_456",
  "created_at": "2025-06-03 19:51:42.951994",
  "actor": "cliente",
  "event_type": "msg",
  "content_text": "Hola, necesito ayuda con mi ansiedad",
  "pautas_codigos": null,
  "status": "ok",
  "tags": "",
  "metadata": {
    "canal": null,
    "tt": null,
    "guia": null
  }
}
✅ Bitacora result: True

📋 Información de

In [1]:
-- Listar todas las FunctionTools del sistema
SELECT 
    codigo,
    nombre,
    descripcion,
    categoria,
    activo,
    parametros,
    metadata,
    created_at,
    updated_at
FROM function_tools 
ORDER BY categoria, nombre;

-- Versión más detallada si necesitas ver parámetros completos
SELECT 
    codigo,
    nombre,
    descripcion,
    categoria,
    parametros::text as parametros_detallados,
    metadata::text as metadata_completa,
    activo
FROM function_tools 
WHERE activo = true
ORDER BY categoria, nombre;


SyntaxError: invalid syntax (4113156480.py, line 1)

In [2]:
-- Listar todas las FunctionTools del sistema
SELECT 
    codigo,
    nombre,
    descripcion,
    categoria,
    activo,
    parametros,
    metadata,
    created_at,
    updated_at
FROM function_tools 
ORDER BY categoria, nombre;

-- Versión más detallada si necesitas ver parámetros completos
SELECT 
    codigo,
    nombre,
    descripcion,
    categoria,
    parametros::text as parametros_detallados,
    metadata::text as metadata_completa,
    activo
FROM function_tools 
WHERE activo = true
ORDER BY categoria, nombre;

SyntaxError: invalid syntax (356722729.py, line 1)

In [3]:
# Ejecuta esto en JupyterLab
import os
from supabase import create_client

# Configurar credenciales (ajusta con tus valores reales)
SUPABASE_URL = "tu_url_aqui"  # reemplaza
SUPABASE_KEY = "tu_key_aqui"  # reemplaza

# Conectar
supabase = create_client(SUPABASE_URL, SUPABASE_KEY)

# Listar todas las FunctionTools
try:
    result = supabase.table('function_tools').select('*').execute()
    
    print(f"✅ Encontradas {len(result.data)} FunctionTools:")
    print("-" * 50)
    
    for tool in result.data:
        print(f"Código: {tool.get('codigo')}")
        print(f"Nombre: {tool.get('nombre')}")  
        print(f"Categoría: {tool.get('categoria')}")
        print(f"Activo: {tool.get('activo')}")
        print("-" * 30)
        
except Exception as e:
    print(f"❌ Error: {e}")

SupabaseException: Invalid URL

In [4]:
# Ejecuta esto para buscar archivos de configuración
import os
import glob

# Buscar archivos de configuración en tu proyecto
config_files = []

# Buscar .env files
env_files = glob.glob('/home/jupyter/Zenda_ADK/**/.env*', recursive=True)
config_files.extend(env_files)

# Buscar archivos con "config" en el nombre
config_pattern = glob.glob('/home/jupyter/Zenda_ADK/**/config*', recursive=True)
config_files.extend(config_pattern)

# Buscar archivos que podrían contener supabase
supabase_files = glob.glob('/home/jupyter/Zenda_ADK/**/*supabase*', recursive=True)
config_files.extend(supabase_files)

print("📁 Archivos de configuración encontrados:")
for file in set(config_files):  # usar set para eliminar duplicados
    print(f"  - {file}")

# También buscar en archivos .py por si tienes las credenciales ahí
print("\n🔍 Buscando 'SUPABASE' en archivos .py:")
for root, dirs, files in os.walk('/home/jupyter/Zenda_ADK'):
    for file in files:
        if file.endswith('.py'):
            filepath = os.path.join(root, file)
            try:
                with open(filepath, 'r') as f:
                    content = f.read()
                    if 'SUPABASE' in content:
                        print(f"  - Encontrado en: {filepath}")
            except:
                pass
                

📁 Archivos de configuración encontrados:

🔍 Buscando 'SUPABASE' en archivos .py:
