# 3. LangChain Streaming - Respuestas en Tiempo Real

## Objetivos de Aprendizaje
- Comprender qu√© es el streaming y cu√°ndo usarlo
- Implementar streaming con LangChain
- Manejar chunks de datos en tiempo real
- Construir interfaces de usuario reactivas

## ¬øQu√© es el Streaming?

El streaming permite recibir la respuesta del modelo **token por token** conforme se genera, en lugar de esperar a que termine completamente. Esto mejora significativamente la experiencia de usuario en aplicaciones interactivas.

### Ventajas del Streaming:
- **Percepci√≥n de velocidad**: El usuario ve progreso inmediato
- **Mejor UX**: Interfaces m√°s reactivas e interactivas  
- **Engagement**: Mantiene la atenci√≥n del usuario
- **Debugging**: Permite ver el proceso de generaci√≥n

### Casos de Uso Ideales:
- Chatbots y asistentes conversacionales
- Generaci√≥n de contenido largo
- Aplicaciones web interactivas
- Demostraciones en vivo

In [1]:
# Importar bibliotecas necesarias
from langchain_openai import ChatOpenAI
from langchain.schema import HumanMessage

import os
import time

print("Bibliotecas importadas correctamente para streaming")

Bibliotecas importadas correctamente para streaming


In [27]:
# Configuraci√≥n del modelo con streaming habilitado
try:
    
    llm = ChatOpenAI(
         base_url=os.getenv("OPENAI_BASE_URL"),
         api_key=os.getenv("GITHUB_TOKEN"),
         model="gpt-4o",
         streaming=True,  # ¬°Importante: habilitar streaming!
         temperature=0.7
     )
    # llm = ChatOpenAI(
    #     base_url="https://models.github.ai/inference",  #descubri que aqui  cambia de url base  
    #     api_key=os.getenv("GITHUB_TOKEN"),               
    #     model = "openai/gpt-4.1",               # modelo DeepSeek
    #     temperature=0.7,
    #     streaming=True, 
    #     max_tokens=150
    # )
    
    print("‚úì Modelo configurado con streaming habilitado")
    print(f"Modelo: {llm.model_name}")
    print(f"Streaming: {llm.streaming}")
    
except Exception as e:
    print(f"‚úó Error en configuraci√≥n: {e}")
    print("Verifica las variables de entorno")

‚úì Modelo configurado con streaming habilitado
Modelo: gpt-4o
Streaming: True


## Streaming B√°sico

El m√©todo `.stream()` devuelve un generador que produce chunks de texto conforme se generan.

In [31]:
# Ejemplo b√°sico de streaming
def streaming_basico():
    prompt = "Cu√©ntame una historia breve sobre los beneficios de el oregano "
    
    print("=== STREAMING EN TIEMPO REAL ===")
    print("Generando respuesta...")
    print("-" * 50)
    
    try:
        # stream() devuelve un generador de chunks
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            # Imprimir cada chunk sin nueva l√≠nea
            print(chunk.content, end="", flush=True)
            time.sleep(0.01)  # Peque√±a pausa para simular streaming visual
            
        print("\n" + "-" * 50)
        print("‚úì Streaming completado")
        
    except Exception as e:
        print(f"‚úó Error en streaming: {e}")

# Ejecutar streaming b√°sico
streaming_basico()

=== STREAMING EN TIEMPO REAL ===
Generando respuesta...
--------------------------------------------------
‚úó Error en streaming: Error code: 429 - {'error': {'code': 'RateLimitReached', 'message': 'Rate limit of 50 per 86400s exceeded for UserByModelByDay. Please wait 53609 seconds before retrying.', 'details': 'Rate limit of 50 per 86400s exceeded for UserByModelByDay. Please wait 53609 seconds before retrying.'}}


In [17]:

import sys

import re
from itertools import cycle
from datetime import datetime




# =============================================================================
# EJERCICIO 1: INDICADORES DE PROGRESO
# =============================================================================

def ejercicio1_spinner_simple():
    """Spinner b√°sico que rota mientras llegan chunks"""
  
    spinner = cycle(['|', '/', '-', '\\'])
    prompt = "rwsumido en 30 palabras :Explica los beneficios del oregano para la salud"
    
    print("=== EJERCICIO 1A: SPINNER SIMPLE ===")
    print("Generando respuesta...\n")
    
    response_text = ""
    try:
        
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            # Mostrar spinner
            sys.stdout.write(f'\r{next(spinner)} Procesando...')
            sys.stdout.flush()
            
            response_text += chunk.content
            time.sleep(0.05)
            print(chunk.content, end="", flush=True)
            
        # Limpiar spinner y mostrar resultado
        sys.stdout.write('\r‚úì Completado!   \n')
        print(f"\nRespuesta completa:\n{response_text}\n")
        
    except Exception as e:
        print(f"\nError: {e}")
ejercicio1_spinner_simple()        


=== EJERCICIO 1A: SPINNER SIMPLE ===
Generando respuesta...

‚úì Completado!   l or√©gano aporta beneficios antioxidantes, antimicrobianos y antiinflamatorios. Mejora la digesti√≥n, refuerza el sistema inmunol√≥gico, combate infecciones y contribuye a la salud respiratoria. Sus compuestos ayudan a prevenir enfermedades y promueven el bienestar general.

Respuesta completa:
El or√©gano aporta beneficios antioxidantes, antimicrobianos y antiinflamatorios. Mejora la digesti√≥n, refuerza el sistema inmunol√≥gico, combate infecciones y contribuye a la salud respiratoria. Sus compuestos ayudan a prevenir enfermedades y promueven el bienestar general.



In [19]:
#modificado 
import sys
import time
import threading
from itertools import cycle

def spinner_task(stop_event):
    spinner = cycle(['|', '/', '-', '\\'])
    while not stop_event.is_set():
        sys.stdout.write(f'\r{next(spinner)} Procesando...')
        sys.stdout.flush()
        time.sleep(0.1)
    sys.stdout.write('\r' + ' ' * 20 + '\r')  # limpia la l√≠nea del spinner

def ejercicio1_spinner_simple():
    prompt = "resumen en 30 palabras :Explica los beneficios del oregano para la salud"
    print("=== EJERCICIO 1A: SPINNER SIMPLE ===")
    print("Generando respuesta...\n")
    response_text = ""
    stop_event = threading.Event()
    spinner_thread = threading.Thread(target=spinner_task, args=(stop_event,))
    spinner_thread.start()

    try:
        # Recibe e imprime chunks normalmente (sin spinner aqu√≠)
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            print(chunk.content, end="", flush=True)
            response_text += chunk.content
            time.sleep(0.05)
        stop_event.set()
        spinner_thread.join()
        print("\n‚úì Completado!")
        print(f"\nRespuesta completa:\n{response_text}\n")
    except Exception as e:
        stop_event.set()
        spinner_thread.join()
        print(f"\nError: {e}")

ejercicio1_spinner_simple()


=== EJERCICIO 1A: SPINNER SIMPLE ===
Generando respuesta...

                    √©gano ofrece propiedades antioxidantes, antiinflamatorias y antimicrobianas. Favorece la digesti√≥n, fortalece el sistema inmunol√≥gico, protege contra infecciones y contribuye a la salud cardiovascular, gracias a sus compuestos como carvacrol y timol.
‚úì Completado!

Respuesta completa:
El or√©gano ofrece propiedades antioxidantes, antiinflamatorias y antimicrobianas. Favorece la digesti√≥n, fortalece el sistema inmunol√≥gico, protege contra infecciones y contribuye a la salud cardiovascular, gracias a sus compuestos como carvacrol y timol.



In [22]:


def ejercicio1_barra_progreso():
    """Barra de progreso visual basada en longitud de texto generado"""
    
    prompt = "resume en 20 palabras:Describe el proceso de fotos√≠ntesis en las plantas"
    print("=== EJERCICIO 1B: BARRA DE PROGRESO ===")
    
    response_text = ""
    last_percent = 0
    bar_length = 30
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            response_text += chunk.content
            
            # Progreso estimado basado en cantidad de caracteres
            total_estimate = 30  # puedes ajustar seg√∫n lo largo que esperas que sea la respuesta
            progress = min(len(response_text) / total_estimate, 1.0)
            
            filled_length = int(bar_length * progress)
            bar = '‚ñà' * filled_length + '‚ñë' * (bar_length - filled_length)
            percent = int(progress * 100)
            
            # Solo actualizar si hay un cambio real en porcentaje
            if percent != last_percent:
                sys.stdout.write(f'\r[{bar}] {percent}% ({len(response_text)} chars)')
                sys.stdout.flush()
                last_percent = percent
            
            time.sleep(0.03)
        
        # Completa la barra al final
        sys.stdout.write('\r[' + '‚ñà'*bar_length + '] 100% (' + str(len(response_text)) + ' chars)\n')
        sys.stdout.flush()
        
        print(f"\n\nRespuesta final:\n{response_text}\n")
        print("‚úÖ Barra de progreso completada!\n")
        
    except Exception as e:
        print(f"\nError: {e}")

ejercicio1_barra_progreso()


=== EJERCICIO 1B: BARRA DE PROGRESO ===
[‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà] 100% (117 chars)


Respuesta final:
La fotos√≠ntesis es el proceso donde las plantas convierten luz solar, agua y di√≥xido de carbono en glucosa y ox√≠geno.

‚úÖ Barra de progreso completada!



## Comparaci√≥n: Streaming vs No-Streaming

Veamos la diferencia en experiencia de usuario entre ambos enfoques.

In [30]:
# Comparaci√≥n entre streaming y no-streaming
def comparar_streaming():

    # Modelo sin streaming
    llm_no_stream = ChatOpenAI(
        base_url="https://models.github.ai/inference",  #descubri que aqui  cambia de url base  
        api_key=os.getenv("GITHUB_TOKEN"),               
        #model = "openai/gpt-4.1",               
        model = "openai/gpt-4o-mini",
        temperature=0.7,
        streaming=False  # Sin streaming
       
    )
    
    prompt = "resumido en 150 palabras :Escribe un p√°rrafo sobre beneficions del oregano"
    
    print("=== COMPARACI√ìN: STREAMING vs NO-STREAMING ===\\n")
    
    # 1. Sin streaming
    print("1. SIN STREAMING:")
    print("-" * 20)
    print("Esperando respuesta completa...")
    
    start_time = time.time()
    try:
        response = llm_no_stream.invoke([HumanMessage(content=prompt)])
        end_time = time.time()
        
        print(f"\\n[Respuesta recibida despu√©s de {end_time - start_time:.2f} segundos]")
        print(response.content)
        
    except Exception as e:
        print(f"Error: {e}")
    
    print("\\n" + "="*60 + "\\n")
    
    # 2. Con streaming
    print("2. CON STREAMING:")
    print("-" * 18)
    print("Respuesta en tiempo real:")
    
    start_time = time.time()
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            print(chunk.content, end="", flush=True)
            time.sleep(0.03)  # Simular pausa para efecto visual
        
        end_time = time.time()
        print(f"\\n\\n[Streaming completado en {end_time - start_time:.2f} segundos]")
        
    except Exception as e:
        print(f"Error: {e}")
    
    print("\\n" + "="*60)
    print("OBSERVACIONES:")
    print("- Sin streaming: El usuario espera sin feedback")
    print("- Con streaming: El usuario ve progreso inmediato")
    print("- Mejor percepci√≥n de velocidad con streaming")
    print("- Streaming es especial para respuestas largas")

# Ejecutar comparaci√≥n
comparar_streaming()

=== COMPARACI√ìN: STREAMING vs NO-STREAMING ===\n
1. SIN STREAMING:
--------------------
Esperando respuesta completa...
\n[Respuesta recibida despu√©s de 3.09 segundos]
El or√©gano es una hierba arom√°tica que ofrece numerosos beneficios para la salud. Su potente contenido de antioxidantes ayuda a combatir el da√±o celular y a fortalecer el sistema inmunol√≥gico. Adem√°s, posee propiedades antimicrobianas que pueden ayudar a combatir infecciones bacterianas y f√∫ngicas. El or√©gano tambi√©n es conocido por sus efectos antiinflamatorios, lo que puede ser beneficioso para condiciones como la artritis. Su consumo puede favorecer la digesti√≥n, aliviando problemas gastrointestinales y promoviendo la salud intestinal. Asimismo, su aceite esencial contiene compuestos como el carvacrol y el timol, que han demostrado propiedades terap√©uticas. Incorporar or√©gano en la dieta no solo realza el sabor de los platillos, sino que tambi√©n contribuye al bienestar general, convirti√©ndolo en un alia

## Implementaci√≥n de un Chatbot Simple con Streaming

Creemos un chatbot b√°sico que demuestre el streaming en un contexto pr√°ctico.

In [None]:
# Chatbot simple con streaming
def chatbot_streaming():
    print("=== CHATBOT CON STREAMING ===")
    print("Escribe 'salir' para terminar la conversaci√≥n\\n")
    
    # Configurar asistente con personalidad
    system_message = """Eres un asistente √∫til y amigable especializado en tecnolog√≠a. 
    Respondes de manera clara y concisa, y siempre intentas ser educativo."""
    
    while True:
        # Obtener input del usuario
        user_input = input("\\nüßë T√∫: ")
        
        if user_input.lower() in ['salir', 'exit', 'quit']:
            print("\\nüëã ¬°Hasta luego!")
            break
            
        if not user_input.strip():
            continue
            
        print("\\nü§ñ Asistente: ", end="", flush=True)
        
        try:
            # Streaming de la respuesta
            messages = [
                {"role": "system", "content": system_message},
                {"role": "user", "content": user_input}
            ]
            
            # Convertir a formato LangChain
            from langchain.schema import SystemMessage
            lc_messages = [
                SystemMessage(content=system_message),
                HumanMessage(content=user_input)
            ]
            
            full_response = ""
            for chunk in llm.stream(lc_messages):
                content = chunk.content
                print(content, end="", flush=True)
                full_response += content
                time.sleep(0.02)
                
            print()  # Nueva l√≠nea al final
            
        except KeyboardInterrupt:
            print("\\n\\n‚è∏Ô∏è Interrumpido por el usuario")
            break
        except Exception as e:
            print(f"\\n‚ùå Error: {e}")
            
    print("\\n¬°Gracias por usar el chatbot!")

# Ejecutar chatbot (¬°Pru√©balo!)
chatbot_streaming() 
 # Descomenta esta l√≠nea para ejecutar

print("üí° Descomenta la l√≠nea anterior para probar el chatbot interactivo")

## Streaming Avanzado con Manejo de Chunks

Podemos procesar cada chunk individualmente para crear experiencias m√°s sofisticadas.

In [None]:
# Streaming con an√°lisis de chunks
def streaming_avanzado():
    prompt = "Explica qu√© es la inteligencia artificial y c√≥mo funciona el machine learning"
    
    print("=== STREAMING AVANZADO CON AN√ÅLISIS ===")
    print("Analizando chunks conforme llegan...\n")
    
    # Variables para estad√≠sticas
    chunk_count = 0
    total_content = ""
    words_processed = 0
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            chunk_count += 1
            content = chunk.content
            total_content += content
            
            # Contar palabras aproximadas
            if content.strip():
                words_in_chunk = len(content.split())
                words_processed += words_in_chunk
            
            # Mostrar progreso cada 10 chunks
            if chunk_count % 10 == 0:
                print(f"\\n[Progreso: {chunk_count} chunks, ~{words_processed} palabras]\\n")
            
            # Imprimir el contenido
            print(content, end="", flush=True)
            time.sleep(0.02)  # Pausa ligeramente m√°s larga para ver el an√°lisis
        
        # Estad√≠sticas finales
        print(f"\\n\\n=== ESTAD√çSTICAS FINALES ===")
        print(f"Total de chunks: {chunk_count}")
        print(f"Palabras aproximadas: {words_processed}")
        print(f"Caracteres totales: {len(total_content)}")
        print(f"Promedio chars/chunk: {len(total_content)/chunk_count if chunk_count > 0 else 0:.1f}")
        
    except Exception as e:
        print(f"\\n‚úó Error: {e}")

# Ejecutar streaming avanzado
streaming_avanzado()

## Consideraciones T√©cnicas del Streaming

### Cu√°ndo Usar Streaming:
‚úÖ **S√ç usar streaming:**
- Respuestas largas (>100 tokens)
- Aplicaciones interactivas
- Chatbots y asistentes
- Demostraciones en vivo
- Cuando la UX es prioritaria

‚ùå **NO usar streaming:**
- Respuestas muy cortas
- Procesamiento batch
- APIs de backend sin interfaz
- Cuando necesitas la respuesta completa antes de procesar

### Mejores Pr√°cticas:
1. **Manejo de errores**: Siempre incluye try/catch
2. **Indicadores visuales**: Muestra progreso al usuario
3. **Cancelaci√≥n**: Permite al usuario interrumpir
4. **Buffer management**: Para interfaces web, considera buffering
5. **Performance**: Monitorea el uso de recursos

## Ejercicios Pr√°cticos

### Ejercicio 1: Indicador de Progreso
Modifica el c√≥digo para mostrar un indicador de progreso (spinner, barra, porcentaje).

### Ejercicio 2: Streaming con Filtros
Implementa streaming que filtre o procese chunks espec√≠ficos (ej: resaltar palabras clave).

### Ejercicio 3: Chatbot Mejorado
Extiende el chatbot con:
- Historial de conversaci√≥n
- Comandos especiales (/help, /clear)
- Diferentes personalidades

## Conceptos Clave Aprendidos

1. **Streaming** mejora la percepci√≥n de velocidad
2. **Chunks** se procesan individualmente en tiempo real
3. **UX** es significativamente mejor con streaming
4. **Implementaci√≥n** requiere manejo cuidadoso de generadores
5. **Casos de uso** espec√≠ficos donde streaming aporta valor

## Pr√≥ximos Pasos

En el siguiente notebook exploraremos la **memoria en LangChain**, que nos permite mantener contexto entre m√∫ltiples interacciones del usuario.

In [4]:
import sys
#import time
from itertools import cycle
#from langchain_openai import ChatOpenAI
#from langchain.schema import HumanMessage

def spinner_progreso():
    """Spinner que rota mientras llegan los chunks"""
    
   
    
    # Caracteres del spinner
    spinner = cycle(['‚†ã', '‚†ô', '‚†π', '‚†∏', '‚†º', '‚†¥', '‚†¶', '‚†ß', '‚†á', '‚†è'])
    
    prompt = "Explica qu√© es Python y sus ventajas"
    response_text = ""
    
    print("Generando respuesta...")
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            # Mostrar spinner
            sys.stdout.write(f'\r{next(spinner)} Procesando...')
            sys.stdout.flush()
            
            response_text += chunk.content
            time.sleep(0.05)
        
        # Limpiar spinner y mostrar resultado
        sys.stdout.write('\r‚úÖ Completado!        \n\n')
        print(response_text)
        
    except Exception as e:
        print(f"\n‚ùå Error: {e}")

# Ejecutar
spinner_progreso()


Generando respuesta...
‚úÖ Completado!        

**Python** es un **lenguaje de programaci√≥n** de alto nivel, interpretado, multiparadigma (soporta programaci√≥n orientada a objetos, imperativa y funcional), y de prop√≥sito general. Fue creado por **Guido van Rossum** y publicado en 1991. Su dise√±o enfatiza la legibilidad del c√≥digo y una sintaxis sencilla que permite a los programadores expresar conceptos en menos l√≠neas de c√≥digo que otros lenguajes.

### Ventajas de Python

1. **Sintaxis sencilla y legible**  
   Python est√° dise√±ado para ser f√°cil de leer y escribir, lo que facilita el aprendizaje y el desarrollo r√°pido.

2. **Gran comunidad y soporte**  
   Cuenta con una comunidad activa que aporta miles de librer√≠as


In [5]:
import sys
import time

def barra_progreso():
    """Barra de progreso basada en caracteres generados"""
    
    prompt = "Describe el proceso de machine learning paso a paso"
    response_text = ""
    bar_length = 25
    estimated_total = 400  # Estimaci√≥n de caracteres esperados
    
    print("=== Barra de Progreso ===")
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            response_text += chunk.content
            
            # Calcular progreso
            progress = min(len(response_text) / estimated_total, 1.0)
            filled = int(bar_length * progress)
            
            # Crear barra visual
            bar = '‚ñà' * filled + '‚ñë' * (bar_length - filled)
            percent = int(progress * 100)
            
            # Actualizar barra
            sys.stdout.write(f'\r[{bar}] {percent}% ({len(response_text)} chars)')
            sys.stdout.flush()
            
            time.sleep(0.03)
        
        # Completar al 100%
        sys.stdout.write(f'\r[{"‚ñà" * bar_length}] 100% ({len(response_text)} chars)\n\n')
        print("Respuesta completa:")
        print(response_text)
        
    except Exception as e:
        print(f"\n‚ùå Error: {e}")

# Ejecutar
barra_progreso()


=== Barra de Progreso ===
[‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà] 100% (617 chars)

Respuesta completa:
Claro, aqu√≠ tienes una descripci√≥n paso a paso del proceso de **machine learning** (aprendizaje autom√°tico):

---

### 1. **Definici√≥n del problema**
   - Identifica y comprende el problema que deseas resolver.
   - Ejemplo: ¬øQuieres clasificar correos como spam/no spam?

### 2. **Recolecci√≥n de datos**
   - Obt√©n datos relevantes para el problema.
   - Pueden provenir de bases de datos, sensores, web, etc.

### 3. **Preprocesamiento de datos**
   - Limpieza: Elimina duplicados, corrige errores y trata valores faltantes.
   - Transformaci√≥n: Normaliza o estandariza datos, convierte variables categ√≥ricas en num


In [6]:
import re

def contador_palabras():
    """Muestra el conteo de palabras conforme se genera el texto"""
    
    prompt = "Cu√©ntame sobre los beneficios de la inteligencia artificial"
    response_text = ""
    
    print("=== Contador de Palabras ===")
    print("Generando respuesta...\n")
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            response_text += chunk.content
            
            # Contar palabras
            words = len(re.findall(r'\b\w+\b', response_text))
            chars = len(response_text)
            
            # Mostrar progreso
            sys.stdout.write(f'\rüìù Palabras: {words} | Caracteres: {chars}')
            sys.stdout.flush()
            
            time.sleep(0.05)
        
        print(f"\n\n‚úÖ Generaci√≥n completada!")
        print(f"üìä Estad√≠sticas finales: {words} palabras, {chars} caracteres\n")
        print("Respuesta:")
        print(response_text)
        
    except Exception as e:
        print(f"\n‚ùå Error: {e}")

# Ejecutar
contador_palabras()


=== Contador de Palabras ===
Generando respuesta...

üìù Palabras: 103 | Caracteres: 727

‚úÖ Generaci√≥n completada!
üìä Estad√≠sticas finales: 103 palabras, 727 caracteres

Respuesta:
La inteligencia artificial (IA) ofrece numerosos beneficios en diferentes √°mbitos de la vida y sectores productivos. Algunos de los principales son:

1. **Automatizaci√≥n de tareas**: Permite que procesos repetitivos o complejos se realicen de forma autom√°tica, ahorrando tiempo y reduciendo errores humanos.

2. **Mejora en la toma de decisiones**: La IA puede analizar grandes cantidades de datos y ofrecer recomendaciones o predicciones m√°s precisas que las realizadas manualmente.

3. **Personalizaci√≥n**: En √°reas como el comercio electr√≥nico, la educaci√≥n y la salud, la IA puede adaptar productos, servicios o contenidos a las necesidades y preferencias individuales de los usuarios.

4. **Eficiencia operativa**: Ayuda a


In [7]:
def streaming_con_resaltado():
    """Resalta palabras clave espec√≠ficas durante el streaming"""
    
    # Palabras clave a resaltar
    keywords = ["python", "machine learning", "inteligencia artificial", "algoritmo", "datos", "modelo"]
    
    prompt = "Explica qu√© es Python y c√≥mo se usa en machine learning e inteligencia artificial"
    
    print("=== STREAMING CON RESALTADO DE PALABRAS CLAVE ===")
    print(f"üîç Palabras clave: {', '.join(keywords)}\n")
    print("Respuesta (palabras clave resaltadas con *):")
    print("-" * 50)
    
    response_text = ""
    highlighted_count = 0
    
    try:
        for chunk in llm.stream([HumanMessage(content=prompt)]):
            content = chunk.content
            response_text += content
            
            # Procesar cada chunk para resaltar palabras clave
            processed_content = content
            for keyword in keywords:
                # Buscar la palabra clave (insensible a may√∫sculas/min√∫sculas)
                pattern = re.compile(re.escape(keyword), re.IGNORECASE)
                if pattern.search(processed_content):
                    processed_content = pattern.sub(f"*{keyword.upper()}*", processed_content)
                    highlighted_count += 1
            
            # Mostrar el chunk procesado
            print(processed_content, end="", flush=True)
            time.sleep(0.05)
        
        print(f"\n{'-' * 50}")
        print(f"‚úÖ Streaming completado!")
        print(f"üéØ Palabras clave resaltadas: {highlighted_count}")
        
    except Exception as e:
        print(f"\n‚ùå Error: {e}")

# Ejecutar
streaming_con_resaltado()

=== STREAMING CON RESALTADO DE PALABRAS CLAVE ===
üîç Palabras clave: python, machine learning, inteligencia artificial, algoritmo, datos, modelo

Respuesta (palabras clave resaltadas con *):
--------------------------------------------------
***PYTHON*** es un lenguaje de programaci√≥n de alto nivel, de prop√≥sito general, que se caracteriza por ser sencillo, legible y f√°cil de aprender. Fue creado a finales de los a√±os 80 y desde entonces ha ganado enorme popularidad, especialmente en √°reas como ciencia de *DATOS*, desarrollo web, automatizaci√≥n y, de manera destacada, en **machine learning (aprendizaje autom√°tico)** e **inteligencia artificial (IA)**.

### ¬øQu√© es *PYTHON*?

- **Sintaxis clara y sencilla**, lo que facilita el desarrollo y mantenimiento de c√≥digo.
- Es **multiparadigma**, permitiendo programaci√≥n orientada a objetos, imperativa y funcional.
- Posee una **gran comunidad** y una **amplia colecci√≥n de bibliotecas
----------------------------------------------

In [None]:
# ‚úÖ IMPORTACIONES CORREGIDAS
import os
import sys
import time
import re
from itertools import cycle
from datetime import datetime
from langchain_openai import ChatOpenAI
from langchain.schema import HumanMessage, SystemMessage, AIMessage  # ‚Üê Aqu√≠ estaba el problema





print("‚úÖ Bibliotecas importadas correctamente con SystemMessage")




class ChatbotMejorado:
    def __init__(self):
        self.historial = []
        self.personalidad_actual = "asistente"
        self.personalidades = {
            "asistente": "Eres un asistente √∫til y profesional. Respondes de manera clara y concisa.",
            "amigable": "Eres muy amigable y casual. Usas emojis y un tono relajado. üòä",
            "tecnico": "Eres un experto t√©cnico. Das respuestas detalladas y precisas con terminolog√≠a espec√≠fica.",
            "creativo": "Eres muy creativo e imaginativo. Usas met√°foras y ejemplos √∫nicos.",
            "profesor": "Eres un profesor paciente. Explicas paso a paso y das ejemplos educativos."
        }
    
    def mostrar_ayuda(self):
        """Muestra los comandos disponibles"""
        print("\n=== üìã COMANDOS DISPONIBLES ===")
        print("üîß /help - Muestra esta ayuda")
        print("üóëÔ∏è  /clear - Limpia el historial")
        print("üë§ /personalidad [nombre] - Cambia personalidad")
        print("üìù /personalidades - Lista personalidades disponibles") 
        print("üìä /stats - Muestra estad√≠sticas de la conversaci√≥n")
        print("üíæ /historial - Muestra historial completo")
        print("üö™ /salir - Termina la conversaci√≥n")
        print("=" * 35)
    
    def mostrar_personalidades(self):
        """Lista las personalidades disponibles"""
        print("\n=== üé≠ PERSONALIDADES DISPONIBLES ===")
        for nombre, descripcion in self.personalidades.items():
            marca = "‚û§" if nombre == self.personalidad_actual else "  "
            print(f"{marca} {nombre}: {descripcion}")
        print("=" * 40)
    
    def cambiar_personalidad(self, nueva_personalidad):
        """Cambia la personalidad del chatbot"""
        if nueva_personalidad in self.personalidades:
            self.personalidad_actual = nueva_personalidad
            print(f"\n‚úÖ Personalidad cambiada a: {nueva_personalidad}")
            print(f"üìù {self.personalidades[nueva_personalidad]}")
        else:
            print(f"\n‚ùå Personalidad '{nueva_personalidad}' no encontrada")
            self.mostrar_personalidades()
    
    def limpiar_historial(self):
        """Limpia el historial de conversaci√≥n"""
        self.historial = []
        print("\nüóëÔ∏è Historial limpiado correctamente")
    
    def mostrar_estadisticas(self):
        """Muestra estad√≠sticas de la conversaci√≥n"""
        if not self.historial:
            print("\nüìä No hay estad√≠sticas disponibles (historial vac√≠o)")
            return
        
        mensajes_usuario = sum(1 for msg in self.historial if isinstance(msg, HumanMessage))
        mensajes_bot = sum(1 for msg in self.historial if isinstance(msg, AIMessage))
        
        print(f"\n=== üìä ESTAD√çSTICAS ===")
        print(f"üí¨ Mensajes del usuario: {mensajes_usuario}")
        print(f"ü§ñ Respuestas del bot: {mensajes_bot}")
        print(f"üé≠ Personalidad actual: {self.personalidad_actual}")
        print(f"üìù Total de mensajes: {len(self.historial)}")
        print("=" * 25)
    
    def mostrar_historial(self):
        """Muestra el historial completo"""
        if not self.historial:
            print("\nüìù No hay historial disponible")
            return
        
        print(f"\n=== üìù HISTORIAL COMPLETO ===")
        for i, mensaje in enumerate(self.historial, 1):
            if isinstance(mensaje, HumanMessage):
                print(f"{i}. üßë Usuario: {mensaje.content}")
            elif isinstance(mensaje, AIMessage):
                print(f"{i}. ü§ñ Bot: {mensaje.content[:100]}{'...' if len(mensaje.content) > 100 else ''}")
        print("=" * 30)
    
    def procesar_comando(self, comando):
        """Procesa comandos especiales"""
        partes = comando.split()
        cmd = partes[0].lower()
        
        if cmd == "/help":
            self.mostrar_ayuda()
        elif cmd == "/clear":
            self.limpiar_historial()
        elif cmd == "/personalidades":
            self.mostrar_personalidades()
        elif cmd == "/personalidad":
            if len(partes) > 1:
                self.cambiar_personalidad(partes[1])
            else:
                print("\n‚ùå Uso: /personalidad [nombre]")
                self.mostrar_personalidades()
        elif cmd == "/stats":
            self.mostrar_estadisticas()
        elif cmd == "/historial":
            self.mostrar_historial()
        elif cmd == "/salir":
            return False
        else:
            print(f"\n‚ùå Comando desconocido: {comando}")
            print("üí° Usa /help para ver comandos disponibles")
        
        return True
    
    def iniciar_chat(self):
        """Inicia el bucle principal del chatbot"""
        print("ü§ñ === CHATBOT MEJORADO CON STREAMING ===")
        print("üí° Escribe /help para ver comandos disponibles")
        print("üé≠ Personalidad inicial: asistente")
        print("-" * 45)
        
        while True:
            try:
                # Obtener input del usuario
                user_input = input("\nüßë T√∫: ").strip()
                
                if not user_input:
                    continue
                
                # Verificar si es un comando
                if user_input.startswith('/'):
                    if not self.procesar_comando(user_input):
                        break
                    continue
                
                # Agregar mensaje del usuario al historial
                self.historial.append(HumanMessage(content=user_input))
                
                # Preparar mensajes para el modelo
                system_msg = SystemMessage(content=self.personalidades[self.personalidad_actual])
                messages = [system_msg] + self.historial
                
                print(f"\nü§ñ Bot ({self.personalidad_actual}): ", end="", flush=True)
                
                # Streaming de la respuesta
                full_response = ""
                for chunk in llm.stream(messages):
                    content = chunk.content
                    print(content, end="", flush=True)
                    full_response += content
                    time.sleep(0.03)
                
                # Agregar respuesta del bot al historial
                self.historial.append(AIMessage(content=full_response))
                
                print()  # Nueva l√≠nea
                
            except KeyboardInterrupt:
                print("\n\n‚è∏Ô∏è Conversaci√≥n interrumpida")
                break
            except Exception as e:
                print(f"\n‚ùå Error: {e}")
        
        print("\nüëã ¬°Hasta luego! Gracias por usar el chatbot.")

# Crear y ejecutar el chatbot
chatbot = ChatbotMejorado()
chatbot.iniciar_chat()


‚úÖ Bibliotecas importadas correctamente con SystemMessage
ü§ñ === CHATBOT MEJORADO CON STREAMING ===
üí° Escribe /help para ver comandos disponibles
üé≠ Personalidad inicial: asistente
---------------------------------------------

ü§ñ Bot (asistente): ¬°Hola! ¬øEn qu√© puedo ayudarte hoy?

‚ùå Uso: /personalidad [nombre]

=== üé≠ PERSONALIDADES DISPONIBLES ===
‚û§ asistente: Eres un asistente √∫til y profesional. Respondes de manera clara y concisa.
   amigable: Eres muy amigable y casual. Usas emojis y un tono relajado. üòä
   tecnico: Eres un experto t√©cnico. Das respuestas detalladas y precisas con terminolog√≠a espec√≠fica.
   creativo: Eres muy creativo e imaginativo. Usas met√°foras y ejemplos √∫nicos.
   profesor: Eres un profesor paciente. Explicas paso a paso y das ejemplos educativos.

ü§ñ Bot (asistente): ¬°Hola de nuevo! ¬øC√≥mo puedo ayudarte?

ü§ñ Bot (asistente): Soy un asistente virtual creado para ayudarte. No tengo un nombre propio, pero puedes llamarme sim