# 3. LangChain Streaming - Respuestas en Tiempo Real

## Objetivos de Aprendizaje
- Comprender qu√© es el streaming y cu√°ndo usarlo
- Implementar streaming con LangChain
- Manejar chunks de datos en tiempo real
- Construir interfaces de usuario reactivas

## ¬øQu√© es el Streaming?

El streaming permite recibir la respuesta del modelo **token por token** conforme se genera, en lugar de esperar a que termine completamente. Esto mejora significativamente la experiencia de usuario en aplicaciones interactivas.

### Ventajas del Streaming:
- **Percepci√≥n de velocidad**: El usuario ve progreso inmediato
- **Mejor UX**: Interfaces m√°s reactivas e interactivas  
- **Engagement**: Mantiene la atenci√≥n del usuario
- **Debugging**: Permite ver el proceso de generaci√≥n

### Casos de Uso Ideales:
- Chatbots y asistentes conversacionales
- Generaci√≥n de contenido largo
- Aplicaciones web interactivas
- Demostraciones en vivo

In [1]:
# Importar bibliotecas necesarias
from langchain_openai import ChatOpenAI
from langchain.schema import HumanMessage
import os
import time

print("Bibliotecas importadas correctamente para streaming")

Bibliotecas importadas correctamente para streaming


In [3]:
# Configuraci√≥n del modelo con streaming habilitado
try:
    llm = ChatOpenAI(
        base_url=os.getenv("OPENAI_BASE_URL"),
        api_key=os.getenv("GITHUB_TOKEN"),
        model="gpt-4o",
        streaming=True,  # ¬°Importante: habilitar streaming!
        temperature=0.7
    )
    
    print("‚úì Modelo configurado con streaming habilitado")
    print(f"Modelo: {llm.model_name}")
    print(f"Streaming: {llm.streaming}")
    
except Exception as e:
    print(f"‚úó Error en configuraci√≥n: {e}")
    print("Verifica las variables de entorno")

‚úì Modelo configurado con streaming habilitado
Modelo: gpt-4o
Streaming: True


## Streaming B√°sico

El m√©todo `.stream()` devuelve un generador que produce chunks de texto conforme se generan.

In [6]:
# Ejemplo b√°sico de streaming
def streaming_basico():
    prompt = "Cu√©ntame una historia corta sobre un programador que descubre la magia en el c√≥digo"
    
    print("=== STREAMING EN TIEMPO REAL ===")
    print("Generando respuesta...")
    print("-" * 50)
    
    try:
        # stream() devuelve un generador de chunks
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            # Imprimir cada chunk sin nueva l√≠nea
            print(chunk.content, end="", flush=True)
            time.sleep(0.01)  # Peque√±a pausa para simular streaming visual
            
        print("\n" + "-" * 50)
        print("‚úì Streaming completado")
        
    except Exception as e:
        print(f"‚úó Error en streaming: {e}")

# Ejecutar streaming b√°sico
streaming_basico()

=== STREAMING EN TIEMPO REAL ===
Generando respuesta...
--------------------------------------------------
Hab√≠a una vez un programador llamado Mart√≠n, un hombre reservado y met√≥dico que dedicaba la mayor parte de su tiempo a escribir l√≠neas de c√≥digo en la soledad de su peque√±o apartamento. Su vida transcurr√≠a en una rutina predecible: trabajar, beber caf√©, solucionar errores, dormir, y repetir. Mart√≠n era un experto en su oficio, pero siempre hab√≠a sentido que algo faltaba en su vida, aunque no sab√≠a exactamente qu√©.

Una noche, mientras trabajaba en un proyecto personal, Mart√≠n se encontr√≥ con un archivo misterioso en su computadora. El archivo no ten√≠a nombre y parec√≠a haber aparecido de la nada. A pesar de que era meticuloso con la seguridad de su sistema, no pudo resistirse a abrirlo.

Dentro del archivo encontr√≥ un fragmento de c√≥digo que no se parec√≠a a nada que hubiese visto antes. Las l√≠neas parec√≠an brillar tenuemente, como si estuvieran vivas, y las pal

## Comparaci√≥n: Streaming vs No-Streaming

Veamos la diferencia en experiencia de usuario entre ambos enfoques.

In [10]:
# Comparaci√≥n entre streaming y no-streaming
def comparar_streaming():
    # Modelo sin streaming
    llm_no_stream = ChatOpenAI(
        base_url=os.getenv("OPENAI_BASE_URL"),
        api_key=os.getenv("GITHUB_TOKEN"),
        model="gpt-4o",
        streaming=False,  # Sin streaming
        temperature=0.7
    )
    
    prompt = "Escribe un p√°rrafo sobre las ventajas de la programaci√≥n en Python"
    
    print("=== COMPARACI√ìN: STREAMING vs NO-STREAMING ===\\n")
    
    # 1. Sin streaming
    print("1. SIN STREAMING:")
    print("-" * 20)
    print("Esperando respuesta completa...")
    
    start_time = time.time()
    try:
        response = llm_no_stream.invoke([HumanMessage(content=prompt)])
        end_time = time.time()
        
        print(f"\\n[Respuesta recibida despu√©s de {end_time - start_time:.2f} segundos]")
        print(response.content)
        
    except Exception as e:
        print(f"Error: {e}")
    
    print("\\n" + "="*60 + "\\n")
    
    # 2. Con streaming
    print("2. CON STREAMING:")
    print("-" * 18)
    print("Respuesta en tiempo real:")
    
    start_time = time.time()
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            print(chunk.content, end="", flush=True)
            time.sleep(0.03)  # Simular pausa para efecto visual
        
        end_time = time.time()
        print(f"\\n\\n[Streaming completado en {end_time - start_time:.2f} segundos]")
        
    except Exception as e:
        print(f"Error: {e}")
    
    print("\\n" + "="*60)
    print("OBSERVACIONES:")
    print("- Sin streaming: El usuario espera sin feedback")
    print("- Con streaming: El usuario ve progreso inmediato")
    print("- Mejor percepci√≥n de velocidad con streaming")
    print("- Streaming es especial para respuestas largas")

# Ejecutar comparaci√≥n
comparar_streaming()

=== COMPARACI√ìN: STREAMING vs NO-STREAMING ===\n
1. SIN STREAMING:
--------------------
Esperando respuesta completa...
\n[Respuesta recibida despu√©s de 3.20 segundos]
Python es un lenguaje de programaci√≥n altamente vers√°til y popular debido a sus numerosas ventajas. Su sintaxis simple y legible facilita el aprendizaje para principiantes y acelera el desarrollo para programadores experimentados, permitiendo centrarse en la l√≥gica del problema en lugar de detalles t√©cnicos complejos. Adem√°s, Python cuenta con una amplia biblioteca est√°ndar y un ecosistema de paquetes de terceros que simplifican tareas como an√°lisis de datos, desarrollo web, inteligencia artificial, automatizaci√≥n y m√°s. Su naturaleza multiplataforma lo hace compatible con diversos sistemas operativos, y su comunidad activa proporciona soporte constante, recursos educativos y actualizaciones regulares. Estas caracter√≠sticas convierten a Python en una herramienta poderosa tanto para proyectos peque√±os como pa

## Implementaci√≥n de un Chatbot Simple con Streaming

Creemos un chatbot b√°sico que demuestre el streaming en un contexto pr√°ctico.

In [None]:
# Chatbot simple con streaming
def chatbot_streaming():
    print("=== CHATBOT CON STREAMING ===")
    print("Escribe 'salir' para terminar la conversaci√≥n\\n")
    
    # Configurar asistente con personalidad
    system_message = """Eres un asistente √∫til y amigable especializado en tecnolog√≠a. 
    Respondes de manera clara y concisa, y siempre intentas ser educativo."""
    
    while True:
        # Obtener input del usuario
        user_input = input("\\nüßë T√∫: ")
        
        if user_input.lower() in ['salir', 'exit', 'quit']:
            print("\\nüëã ¬°Hasta luego!")
            break
            
        if not user_input.strip():
            continue
            
        print("\\nü§ñ Asistente: ", end="", flush=True)
        
        try:
            # Streaming de la respuesta
            messages = [
                {"role": "system", "content": system_message},
                {"role": "user", "content": user_input}
            ]
            
            # Convertir a formato LangChain
            from langchain.schema import SystemMessage
            lc_messages = [
                SystemMessage(content=system_message),
                HumanMessage(content=user_input)
            ]
            
            full_response = ""
            for chunk in llm.stream(lc_messages):
                content = chunk.content
                print(content, end="", flush=True)
                full_response += content
                time.sleep(0.02)
                
            print()  # Nueva l√≠nea al final
            
        except KeyboardInterrupt:
            print("\\n\\n‚è∏Ô∏è Interrumpido por el usuario")
            break
        except Exception as e:
            print(f"\\n‚ùå Error: {e}")
            
    print("\\n¬°Gracias por usar el chatbot!")

# Ejecutar chatbot (¬°Pru√©balo!)
# chatbot_streaming()  # Descomenta esta l√≠nea para ejecutar

print("üí° Descomenta la l√≠nea anterior para probar el chatbot interactivo")

=== CHATBOT CON STREAMING ===
Escribe 'salir' para terminar la conversaci√≥n\n
\nü§ñ Asistente: ¬°Hola! üòä ¬øEn qu√© puedo ayudarte hoy?
\nü§ñ Asistente: ¬°Claro! Aqu√≠ tienes un poema breve:  

En el susurro del viento callado,  
las estrellas dibujan sue√±os dorados,  
y la noche abraza el alma cansada.  

¬øQu√© te parece? üòä
\nü§ñ Asistente: ¬°De nada! üòä Si necesitas ayuda con algo, no dudes en preguntar. Estoy aqu√≠ para ayudarte. üöÄ
\nüëã ¬°Hasta luego!
\n¬°Gracias por usar el chatbot!
üí° Descomenta la l√≠nea anterior para probar el chatbot interactivo


## Streaming Avanzado con Manejo de Chunks

Podemos procesar cada chunk individualmente para crear experiencias m√°s sofisticadas.

In [11]:
# Streaming con an√°lisis de chunks
def streaming_avanzado():
    prompt = "Explica qu√© es la inteligencia artificial y c√≥mo funciona el machine learning"
    
    print("=== STREAMING AVANZADO CON AN√ÅLISIS ===")
    print("Analizando chunks conforme llegan...\n")
    
    # Variables para estad√≠sticas
    chunk_count = 0
    total_content = ""
    words_processed = 0
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            chunk_count += 1
            content = chunk.content
            total_content += content
            
            # Contar palabras aproximadas
            if content.strip():
                words_in_chunk = len(content.split())
                words_processed += words_in_chunk
            
            # Mostrar progreso cada 10 chunks
            if chunk_count % 10 == 0:
                print(f"\\n[Progreso: {chunk_count} chunks, ~{words_processed} palabras]\\n")
            
            # Imprimir el contenido
            print(content, end="", flush=True)
            time.sleep(0.02)  # Pausa ligeramente m√°s larga para ver el an√°lisis
        
        # Estad√≠sticas finales
        print(f"\\n\\n=== ESTAD√çSTICAS FINALES ===")
        print(f"Total de chunks: {chunk_count}")
        print(f"Palabras aproximadas: {words_processed}")
        print(f"Caracteres totales: {len(total_content)}")
        print(f"Promedio chars/chunk: {len(total_content)/chunk_count if chunk_count > 0 else 0:.1f}")
        
    except Exception as e:
        print(f"\\n‚úó Error: {e}")

# Ejecutar streaming avanzado
streaming_avanzado()

=== STREAMING AVANZADO CON AN√ÅLISIS ===
Analizando chunks conforme llegan...

¬°Por supuesto! Vamos a des\n[Progreso: 10 chunks, ~8 palabras]\n
glosar estos conceptos de manera sencilla:

###\n[Progreso: 20 chunks, ~18 palabras]\n
 **¬øQu√© es la Inteligencia Artificial (IA\n[Progreso: 30 chunks, ~28 palabras]\n
)?**
La **Inteligencia Artificial (IA\n[Progreso: 40 chunks, ~38 palabras]\n
)** es un campo de la inform√°tica que se centra\n[Progreso: 50 chunks, ~48 palabras]\n
 en la creaci√≥n de sistemas capaces de realizar tareas que\n[Progreso: 60 chunks, ~58 palabras]\n
 normalmente requieren inteligencia humana. Estas tareas pueden incluir el\n[Progreso: 70 chunks, ~68 palabras]\n
 reconocimiento de voz, la toma de decisiones, la\n[Progreso: 80 chunks, ~78 palabras]\n
 resoluci√≥n de problemas, el aprendizaje, la planificaci√≥n y\n[Progreso: 90 chunks, ~88 palabras]\n
 la comprensi√≥n del lenguaje natural.

En otras palabras,\n[Progreso: 100 chunks, ~98 palabras]\n
 la IA busca que 

## Consideraciones T√©cnicas del Streaming

### Cu√°ndo Usar Streaming:
‚úÖ **S√ç usar streaming:**
- Respuestas largas (>100 tokens)
- Aplicaciones interactivas
- Chatbots y asistentes
- Demostraciones en vivo
- Cuando la UX es prioritaria

‚ùå **NO usar streaming:**
- Respuestas muy cortas
- Procesamiento batch
- APIs de backend sin interfaz
- Cuando necesitas la respuesta completa antes de procesar

### Mejores Pr√°cticas:
1. **Manejo de errores**: Siempre incluye try/catch
2. **Indicadores visuales**: Muestra progreso al usuario
3. **Cancelaci√≥n**: Permite al usuario interrumpir
4. **Buffer management**: Para interfaces web, considera buffering
5. **Performance**: Monitorea el uso de recursos

## Ejercicios Pr√°cticos

### Ejercicio 1: Indicador de Progreso
Modifica el c√≥digo para mostrar un indicador de progreso (spinner, barra, porcentaje).

### Ejercicio 2: Streaming con Filtros
Implementa streaming que filtre o procese chunks espec√≠ficos (ej: resaltar palabras clave).

### Ejercicio 3: Chatbot Mejorado
Extiende el chatbot con:
- Historial de conversaci√≥n
- Comandos especiales (/help, /clear)
- Diferentes personalidades

## Conceptos Clave Aprendidos

1. **Streaming** mejora la percepci√≥n de velocidad
2. **Chunks** se procesan individualmente en tiempo real
3. **UX** es significativamente mejor con streaming
4. **Implementaci√≥n** requiere manejo cuidadoso de generadores
5. **Casos de uso** espec√≠ficos donde streaming aporta valor

## Pr√≥ximos Pasos

En el siguiente notebook exploraremos la **memoria en LangChain**, que nos permite mantener contexto entre m√∫ltiples interacciones del usuario.