# 4. LangChain Memory - Gesti√≥n de Contexto Conversacional

## Objetivos de Aprendizaje
- Comprender la importancia de la memoria en conversaciones con LLMs
- Implementar diferentes tipos de memoria con LangChain
- Gestionar el contexto de conversaciones largas
- Optimizar el uso de tokens con estrategias de memoria

## ¬øPor qu√© es Importante la Memoria?

Los LLMs son **stateless** por naturaleza: no recuerdan conversaciones anteriores. La memoria permite:
- **Contexto conversacional**: Referirse a mensajes anteriores
- **Personalizaci√≥n**: Recordar preferencias del usuario
- **Continuidad**: Mantener hilos de conversaci√≥n coherentes
- **Experiencia natural**: Conversaciones que se sienten humanas

## Tipos de Memoria en LangChain

1. **ConversationBufferMemory**: Mantiene todo el historial
2. **ConversationSummaryMemory**: Resume conversaciones largas
3. **ConversationBufferWindowMemory**: Mantiene solo los N mensajes m√°s recientes
4. **ConversationSummaryBufferMemory**: Combina resumen + buffer reciente

In [None]:
# Importar bibliotecas necesarias para memoria
from langchain_openai import ChatOpenAI
from langchain.memory import (
    ConversationBufferMemory,
    ConversationSummaryMemory,
    ConversationBufferWindowMemory
)
from langchain.chains import ConversationChain
import os

print("‚úì Bibliotecas de memoria importadas correctamente")

In [None]:
# Configuraci√≥n del modelo para memoria
try:
    llm = ChatOpenAI(
        base_url=os.getenv("OPENAI_BASE_URL"),
        api_key=os.getenv("GITHUB_TOKEN"),
        model="gpt-4o",
        temperature=0.7
    )
    
    print("‚úì Modelo configurado para experimentos de memoria")
    print(f"Modelo: {llm.model_name}")
    
except Exception as e:
    print(f"‚úó Error en configuraci√≥n: {e}")
    print("Verifica las variables de entorno")

## 1. ConversationBufferMemory - Memoria Completa

Esta memoria mantiene **todo** el historial de la conversaci√≥n. Es la m√°s simple pero puede consumir muchos tokens.

In [None]:
# Ejemplo b√°sico con ConversationBufferMemory
def ejemplo_buffer_memory():
    print("=== CONVERSATIONBUFFERMEMORY ===")
    print("Mantiene todo el historial de conversaci√≥n\\n")
    
    try:
        # Crear memoria buffer
        memory = ConversationBufferMemory()
        
        # Crear cadena de conversaci√≥n
        conversation = ConversationChain(
            llm=llm,
            memory=memory,
            verbose=True  # Muestra el prompt interno
        )
        
        # Primera interacci√≥n
        print("1. Primera pregunta:")
        response1 = conversation.predict(input="Mi nombre es Ana y soy programadora Python")
        print(f"Respuesta: {response1}\\n")
        
        # Segunda interacci√≥n (debe recordar el nombre)
        print("2. Segunda pregunta:")
        response2 = conversation.predict(input="¬øCu√°l es mi nombre y profesi√≥n?")
        print(f"Respuesta: {response2}\\n")
        
        # Tercera interacci√≥n (debe recordar todo el contexto)
        print("3. Tercera pregunta:")
        response3 = conversation.predict(input="¬øQu√© lenguaje de programaci√≥n mencion√©?")
        print(f"Respuesta: {response3}\\n")
        
        # Examinar el contenido de la memoria
        print("=== CONTENIDO DE LA MEMORIA ===")
        print(memory.buffer)
        
    except Exception as e:
        print(f"Error: {e}")

# Ejecutar ejemplo
ejemplo_buffer_memory()

## 2. ConversationBufferWindowMemory - Ventana Deslizante

Esta memoria mantiene solo los **N mensajes m√°s recientes**, √∫til para controlar el uso de tokens.

In [None]:
# Ejemplo con ConversationSummaryMemory
def ejemplo_summary_memory():
    print("=== CONVERSATIONSUMMARYMEMORY ===")
    print("Resume conversaciones largas para ahorrar tokens\\n")
    
    try:
        # Crear memoria con resumen
        memory = ConversationSummaryMemory(llm=llm)
        
        conversation = ConversationChain(
            llm=llm,
            memory=memory,
            verbose=True
        )
        
        # Simular una conversaci√≥n larga con muchos detalles
        long_inputs = [
            "Hola, me llamo Mar√≠a Gonz√°lez, tengo 35 a√±os y soy ingeniera de software especializada en desarrollo web con React y Node.js. Trabajo en una startup de fintech en Madrid desde hace 3 a√±os.",
            "Mi proyecto actual involucra crear una plataforma de pagos digitales que debe manejar transacciones en tiempo real con alta seguridad. Usamos microservicios con Docker y Kubernetes.",
            "El mayor desaf√≠o t√©cnico que enfrentamos es la latencia en las transacciones internacionales. Estamos considerando implementar edge computing y optimizar nuestras APIs.",
            "Tambi√©n estoy trabajando en mejorar la experiencia de usuario de nuestra aplicaci√≥n m√≥vil. Los usuarios se quejan de que el proceso de verificaci√≥n de identidad es muy lento.",
            "¬øPuedes resumir qui√©n soy y cu√°les son mis principales desaf√≠os profesionales?"
        ]
        
        for i, user_input in enumerate(long_inputs, 1):
            print(f"{i}. Input: {user_input[:100]}...")
            response = conversation.predict(input=user_input)
            print(f"   Respuesta: {response}\\n")
            
            # Mostrar el resumen actual
            print("   Resumen actual en memoria:")
            print(f"   {memory.buffer}\\n")
            print("-" * 80)
            
    except Exception as e:
        print(f"Error: {e}")

# Ejecutar ejemplo
ejemplo_summary_memory()

## 3. ConversationSummaryMemory - Resumen Inteligente

Esta memoria **resume** conversaciones largas en lugar de mantener todo el texto completo, ahorrando tokens significativamente.

In [None]:
# Ejemplo con ConversationBufferWindowMemory
def ejemplo_window_memory():
    print("=== CONVERSATIONBUFFERWINDOWMEMORY ===")
    print("Mantiene solo los 2 intercambios m√°s recientes\\n")
    
    try:
        # Crear memoria con ventana de 2 intercambios
        memory = ConversationBufferWindowMemory(k=2)
        
        conversation = ConversationChain(
            llm=llm,
            memory=memory,
            verbose=True
        )
        
        # M√∫ltiples interacciones para ver el efecto de la ventana
        inputs = [
            "Mi nombre es Carlos y tengo 30 a√±os",
            "Trabajo como dise√±ador gr√°fico",
            "Me gusta el caf√© y la m√∫sica jazz",
            "¬øPuedes recordar mi edad?",  # Deber√≠a olvidar esto
            "¬øCu√°l es mi profesi√≥n?"  # Deber√≠a recordar esto
        ]
        
        for i, user_input in enumerate(inputs, 1):
            print(f"{i}. Pregunta: {user_input}")
            response = conversation.predict(input=user_input)
            print(f"   Respuesta: {response}\\n")
            
            # Mostrar contenido actual de la memoria
            print(f"   Memoria actual (k=2):")
            print(f"   {memory.buffer}\\n")
            print("-" * 60)
            
    except Exception as e:
        print(f"Error: {e}")

# Ejecutar ejemplo
ejemplo_window_memory()

## Comparaci√≥n de Tipos de Memoria

Veamos las diferencias entre los tipos de memoria en una misma conversaci√≥n.

In [None]:
# Comparaci√≥n entre tipos de memoria
def comparar_memorias():
    print("=== COMPARACI√ìN DE TIPOS DE MEMORIA ===\\n")
    
    # Configurar diferentes tipos de memoria
    buffer_memory = ConversationBufferMemory()
    window_memory = ConversationBufferWindowMemory(k=2)
    summary_memory = ConversationSummaryMemory(llm=llm)
    
    # Crear conversaciones con cada tipo
    conversations = {
        "Buffer (Todo)": ConversationChain(llm=llm, memory=buffer_memory, verbose=False),
        "Window (k=2)": ConversationChain(llm=llm, memory=window_memory, verbose=False),
        "Summary": ConversationChain(llm=llm, memory=summary_memory, verbose=False)
    }
    
    # Secuencia de inputs para probar
    test_inputs = [
        "Mi nombre es Alex y estudio ingenier√≠a inform√°tica",
        "Tengo 22 a√±os y me especializo en IA",
        "Mi lenguaje favorito es Python",
        "Tambi√©n me gusta JavaScript para desarrollo web",
        "¬øCu√°l es mi edad y carrera?"  # Pregunta que requiere memoria
    ]
    
    # Ejecutar la misma conversaci√≥n con cada tipo de memoria
    for memory_type, conversation in conversations.items():
        print(f"\\n{'='*20} {memory_type.upper()} {'='*20}")
        
        for i, user_input in enumerate(test_inputs, 1):
            try:
                if i < len(test_inputs):  # No mostrar la pregunta final a√∫n
                    response = conversation.predict(input=user_input)
                    print(f"{i}. Input: {user_input}")
                    print(f"   Respuesta: {response[:100]}...")
                else:  # Pregunta final para probar memoria
                    response = conversation.predict(input=user_input)
                    print(f"\\n{i}. PREGUNTA DE MEMORIA: {user_input}")
                    print(f"   RESPUESTA: {response}")
                    
                    # Mostrar estado de memoria
                    if memory_type == "Buffer (Todo)":
                        print(f"   Memoria: {len(buffer_memory.buffer)} caracteres")
                    elif memory_type == "Window (k=2)":
                        print(f"   Memoria: {len(window_memory.buffer)} caracteres")
                    else:
                        print(f"   Resumen: {len(summary_memory.buffer)} caracteres")
                        
            except Exception as e:
                print(f"   Error: {e}")
        
        print("\\n" + "-"*60)
    
    print("\\n=== AN√ÅLISIS ===")
    print("‚Ä¢ Buffer Memory: Recuerda todo pero consume m√°s tokens")
    print("‚Ä¢ Window Memory: Eficiente pero puede olvidar informaci√≥n importante")  
    print("‚Ä¢ Summary Memory: Balance entre memoria y eficiencia")

# Ejecutar comparaci√≥n
comparar_memorias()

## Chatbot Avanzado con Memoria Personalizable

Implementemos un chatbot que permite al usuario elegir el tipo de memoria.

In [None]:
# Chatbot avanzado con memoria configurable
def chatbot_con_memoria():
    print("=== CHATBOT CON MEMORIA CONFIGURABLE ===")
    print("Tipos disponibles:")
    print("1. buffer - Mantiene todo el historial")
    print("2. window - Mantiene solo N mensajes recientes") 
    print("3. summary - Resume conversaciones largas")
    print("\\nEscribe 'cambiar' para cambiar tipo de memoria")
    print("Escribe 'memoria' para ver el contenido actual")
    print("Escribe 'salir' para terminar\\n")
    
    # Configuraci√≥n inicial
    memory_type = "buffer"
    memory = ConversationBufferMemory()
    conversation = ConversationChain(llm=llm, memory=memory, verbose=False)
    
    def crear_memoria(tipo):
        if tipo == "buffer":
            return ConversationBufferMemory()
        elif tipo == "window":
            return ConversationBufferWindowMemory(k=3)
        elif tipo == "summary":
            return ConversationSummaryMemory(llm=llm)
        else:
            return ConversationBufferMemory()
    
    print(f"Memoria actual: {memory_type}")
    
    while True:
        user_input = input("\\nüßë T√∫: ")
        
        if user_input.lower() == 'salir':
            print("\\nüëã ¬°Hasta luego!")
            break
            
        elif user_input.lower() == 'cambiar':
            print("\\nTipos disponibles: buffer, window, summary")
            nuevo_tipo = input("Nuevo tipo de memoria: ").lower()
            
            if nuevo_tipo in ['buffer', 'window', 'summary']:
                memory_type = nuevo_tipo
                memory = crear_memoria(memory_type)
                conversation = ConversationChain(llm=llm, memory=memory, verbose=False)
                print(f"‚úì Memoria cambiada a: {memory_type}")
                print("‚ö†Ô∏è Historial de conversaci√≥n reiniciado")
            else:
                print("‚ùå Tipo no v√°lido")
            continue
            
        elif user_input.lower() == 'memoria':
            print(f"\\n=== MEMORIA ACTUAL ({memory_type}) ===")
            print(f"Contenido: {memory.buffer}")
            print(f"Longitud: {len(memory.buffer)} caracteres")
            continue
            
        elif not user_input.strip():
            continue
        
        try:
            print(f"\\nü§ñ Asistente ({memory_type}): ", end="", flush=True)
            response = conversation.predict(input=user_input)
            print(response)
            
        except Exception as e:
            print(f"‚ùå Error: {e}")

# Funci√≥n para ejecutar el chatbot
# chatbot_con_memoria()  # Descomenta para ejecutar

print("üí° Descomenta la l√≠nea anterior para probar el chatbot con memoria configurable")

## Consideraciones T√©cnicas y Mejores Pr√°cticas

### Selecci√≥n del Tipo de Memoria

| Tipo | Cu√°ndo Usarlo | Ventajas | Desventajas |
|------|---------------|----------|-------------|
| **Buffer** | Conversaciones cortas | Contexto completo | Alto consumo de tokens |
| **Window** | Contexto reciente importante | Eficiente en tokens | Puede perder informaci√≥n clave |
| **Summary** | Conversaciones muy largas | Balance eficiencia/contexto | P√©rdida de detalles espec√≠ficos |

### Mejores Pr√°cticas:

1. **Gesti√≥n de Tokens**:
   - Monitorea el uso de tokens regularmente
   - Establece l√≠mites m√°ximos para evitar costos excesivos
   - Considera el costo vs. calidad del contexto

2. **Selecci√≥n Estrat√©gica**:
   - Usa Buffer para sesiones cortas e importantes
   - Usa Window para conversaciones con contexto limitado
   - Usa Summary para sesiones largas de asistencia

3. **Optimizaci√≥n**:
   - Limpia memoria peri√≥dicamente si es necesario
   - Implementa estrategias h√≠bridas seg√∫n el caso de uso
   - Considera almacenamiento persistente para memoria a largo plazo

## Ejercicios Pr√°cticos

### Ejercicio 1: An√°lisis de Consumo
Implementa un sistema que monitoree y reporte el uso de tokens con diferentes tipos de memoria.

### Ejercicio 2: Memoria H√≠brida
Dise√±a una estrategia que combine multiple tipos de memoria seg√∫n el contexto.

### Ejercicio 3: Persistencia
Extiende el chatbot para guardar y cargar memoria entre sesiones.

## Conceptos Clave Aprendidos

1. **Importancia de la memoria** en conversaciones naturales
2. **Tipos de memoria** y sus casos de uso espec√≠ficos
3. **Balance** entre contexto y eficiencia de tokens
4. **Implementaci√≥n pr√°ctica** con LangChain
5. **Estrategias de optimizaci√≥n** para diferentes escenarios

## Conclusi√≥n del M√≥dulo IL1.1

Has completado la introducci√≥n a LLMs y conexiones API. Los conceptos aprendidos:

1. **APIs directas** vs **frameworks** como LangChain
2. **Streaming** para mejor experiencia de usuario
3. **Memoria** para conversaciones contextuales
4. **Mejores pr√°cticas** de seguridad y optimizaci√≥n

### Pr√≥ximos Pasos
En **IL1.2** exploraremos t√©cnicas avanzadas de **prompt engineering** incluyendo zero-shot, few-shot, y chain-of-thought prompting.