<a href="https://colab.research.google.com/github/evinracher/3010090-ontological-engineering/blob/main/week2/2_03_Taller_Memoria_Gemini25.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Taller: Memoria en LangChain 1.0 usando gemini-2.5-flash-lite
Este cuaderno explica c√≥mo funciona la memoria en LangChain 1.0 mediante `RunnableWithMessageHistory`, `ChatMessageHistory` y Gemini.

## Configura tu clave de Gemini

In [None]:
from google.colab import userdata
import os

# Obtener la API key desde userdata
api_key = userdata.get('GOOGLE_API_KEY')

# Opcional: Guardarla como variable de entorno
os.environ['GOOGLE_API_KEY'] = api_key

# Verificar que se haya cargado correctamente
print("API Key cargada:", "S√≠" if api_key else "No")
print("Primeros caracteres:", api_key[:10] if api_key else "No encontrada")



## Instalaci√≥n

In [None]:
!pip install -q -U langchain langchain_community langchain_core langchain-google-genai

print("‚úÖ Paquetes instalados correctamente")

In [None]:
pip show langchain

## Cargar modelo gemini-2.5-flash-lite

In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
import time

model = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash-lite",
    temperature=0.3,
    max_retries=2
)

print("‚úÖ Modelo configurado: gemini-2.5-flash-lite")


 ## Funci√≥n de Manejo de Errores

In [None]:
def invocar_con_retry(chain, input_data, config, max_intentos=3, delay=10):
    """Maneja autom√°ticamente los errores 429 con esperas progresivas."""
    for intento in range(max_intentos):
        try:
            return chain.invoke(input_data, config=config)
        except Exception as e:
            error_msg = str(e)
            if "429" in error_msg or "ResourceExhausted" in error_msg:
                if intento < max_intentos - 1:
                    print(f"‚ö†Ô∏è L√≠mite alcanzado. Esperando {delay} segundos...")
                    time.sleep(delay)
                    delay *= 2
                else:
                    print("‚ùå Se agotaron los intentos. Espera unos minutos.")
                    raise
            else:
                raise

print("‚úÖ Funci√≥n de retry configurada")

## ¬øQu√© es la memoria en LangChain 1.0?
LangChain 1.0 *ya no usa* `ConversationBufferMemory` o `ConversationSummaryMemory`.

En su lugar usa:

### ‚úî `RunnableWithMessageHistory`
Un envoltorio que permite agregar historial a *cualquier* cadena, prompt o modelo.

### ‚úî `ChatMessageHistory`
Objeto que guarda mensajes pasados entre usuario y asistente.

### ‚úî El historial es **externo**, no est√° dentro del modelo.
Se simula un estado de conversaci√≥n agregando mensajes previos en cada invocaci√≥n.

## Configurar Memoria con RunnableWithMessageHistory

In [None]:
# ‚≠ê PROMPT M√ÅS ESTRICTO - Evita alucinaciones
prompt = ChatPromptTemplate.from_messages([
    ("system", """Eres un asistente honesto y preciso.

REGLAS ESTRICTAS QUE DEBES SEGUIR:
1. SOLO puedes acceder a la informaci√≥n que est√° en los mensajes del historial de esta conversaci√≥n
2. Si el historial est√° vac√≠o o no contiene la informaci√≥n solicitada, debes decir "No tengo esa informaci√≥n en el historial de esta conversaci√≥n"
3. NUNCA inventes, asumas o adivines informaci√≥n
4. NUNCA digas que recuerdas algo si no est√° expl√≠citamente en el historial
5. Si te preguntan sobre informaci√≥n que no est√° en los mensajes previos, responde: "No encuentro esa informaci√≥n en nuestro historial de conversaci√≥n. ¬øPodr√≠as compartirla conmigo?"

Recuerda: Si el historial no contiene la respuesta, debes ser honesto y decir que no la tienes."""),
    MessagesPlaceholder(variable_name="messages"),
    ("user", "{input}")
])

stores = {}

def obtener_historial(session_id):
    if session_id not in stores:
        stores[session_id] = ChatMessageHistory()
    return stores[session_id]

chain_con_memoria = RunnableWithMessageHistory(
    prompt | model,
    obtener_historial,
    input_messages_key="input",
    history_messages_key="messages"
)

print("‚úÖ Memoria configurada con prompt ANTI-ALUCINACI√ìN")

In [None]:
# PROMPT DETALLADO - M√°s expl√≠cito sobre recordar informaci√≥n
prompt = ChatPromptTemplate.from_messages([
    ("system", """Eres un asistente amable y servicial con excelente memoria.

INSTRUCCIONES IMPORTANTES:
- Debes recordar TODA la informaci√≥n que el usuario te comparta
- Cuando el usuario te pregunte sobre informaci√≥n previa, busca en el historial de la conversaci√≥n
- Si el usuario pregunta "¬øEn qu√© trabajo?" o similar, responde bas√°ndote en lo que √âL te dijo anteriormente
- NUNCA inventes informaci√≥n que el usuario no te haya dicho
- SIEMPRE usa la informaci√≥n del historial de esta conversaci√≥n espec√≠fica

Recuerda: Cada conversaci√≥n es independiente y debes recordar lo que el usuario de ESTA sesi√≥n te ha dicho."""),
    MessagesPlaceholder(variable_name="messages"), # ‚¨ÖÔ∏è ESTO ES CLAVE
    ("user", "{input}")
])

stores = {}

def obtener_historial(session_id):
    """Obtiene o crea un historial para una sesi√≥n espec√≠fica."""
    if session_id not in stores:
        stores[session_id] = ChatMessageHistory()
    return stores[session_id]

# Crear cadena con memoria
chain_con_memoria = RunnableWithMessageHistory(
    prompt | model,
    obtener_historial,
    input_messages_key="input",
    history_messages_key="messages" # ‚¨ÖÔ∏è Debe coincidir con MessagesPlaceholder
)

print("‚úÖ Memoria configurada con prompt DETALLADO y con ANTI-ALUCINACI√ìN")

## Ejemplo 1 - Memoria B√°sica

In [None]:
print("="*50)
print("EJEMPLO 1: MEMORIA B√ÅSICA")
print("="*50)

session_id = "usuario1"

try:
    print("\nü§ñ Primera interacci√≥n:")
    respuesta1 = invocar_con_retry(
        chain_con_memoria,
        {"input": "Hola, mi nombre es Carlos y estudio Deep Learning."},
        {"configurable": {"session_id": session_id}}
    )
    print("Asistente:", respuesta1.content)

    print("\n‚è≥ Esperando 5 segundos...")
    time.sleep(5)

    print("\nü§ñ Segunda interacci√≥n (prueba de memoria):")
    respuesta2 = invocar_con_retry(
        chain_con_memoria,
        {"input": "¬øRecuerdas mi nombre y qu√© estudio?"},
        {"configurable": {"session_id": session_id}}
    )
    print("Asistente:", respuesta2.content)

except Exception as e:
    print(f"‚ùå Error: {e}")
    print("\nüí° Espera 1-2 minutos antes de volver a intentar")

## Ejemplo 2: Memoria por m√∫ltiples usuarios

In [None]:
print("\n" + "="*50)
print("EJEMPLO 2: M√öLTIPLES USUARIOS")
print("="*50)

try:
    # Usuario A
    print("\nüë§ Sesi√≥n A - Ana:")
    time.sleep(5)

    print("Ana dice: Soy Ana y mi color favorito es el azul.")
    respA1 = invocar_con_retry(
        chain_con_memoria,
        {"input": "Soy Ana y mi color favorito es el azul."},
        {"configurable": {"session_id": "A"}}
    )
    print("ü§ñ Asistente (A):", respA1.content)

    time.sleep(5)
    print("\nAna pregunta: ¬øCu√°l es mi color favorito?")
    respA2 = invocar_con_retry(
        chain_con_memoria,
        {"input": "¬øCu√°l es mi color favorito?"},
        {"configurable": {"session_id": "A"}}
    )
    print("ü§ñ Asistente (A):", respA2.content)

    # Usuario B
    print("\nüë§ Sesi√≥n B - Pedro:")
    time.sleep(5)

    print("Pedro dice: Me llamo Pedro y trabajo en Inteligencia Artificial.")
    respB1 = invocar_con_retry(
        chain_con_memoria,
        {"input": "Me llamo Pedro y trabajo en Inteligencia Artificial."},
        {"configurable": {"session_id": "B"}}
    )
    print("ü§ñ Asistente (B):", respB1.content)

    time.sleep(5)
    print("\nPedro pregunta: ¬øEn qu√© trabajo yo?")  # ‚¨ÖÔ∏è M√°s expl√≠cito
    respB2 = invocar_con_retry(
        chain_con_memoria,
        {"input": "¬øEn qu√© trabajo yo?"},  # ‚¨ÖÔ∏è Cambiado para ser m√°s claro
        {"configurable": {"session_id": "B"}}
    )
    print("ü§ñ Asistente (B):", respB2.content)

    # Verificaci√≥n adicional
    print("\n" + "-"*50)
    print("VERIFICACI√ìN DE MEMORIA:")
    print("-"*50)

    time.sleep(5)
    print("\nAna pregunta: ¬øRecuerdas mi nombre?")
    respA3 = invocar_con_retry(
        chain_con_memoria,
        {"input": "¬øRecuerdas mi nombre?"},
        {"configurable": {"session_id": "A"}}
    )
    print("ü§ñ Asistente (A):", respA3.content)

    time.sleep(5)
    print("\nPedro pregunta: ¬øCu√°l es mi nombre y profesi√≥n?")
    respB3 = invocar_con_retry(
        chain_con_memoria,
        {"input": "¬øCu√°l es mi nombre y profesi√≥n?"},
        {"configurable": {"session_id": "B"}}
    )
    print("ü§ñ Asistente (B):", respB3.content)

    print("\n‚úÖ Ejemplo completado - Verifica que cada sesi√≥n mantenga su memoria independiente")

except Exception as e:
    print(f"‚ùå Error: {e}")