## 1\. ¿Qué es LangChain y por qué es relevante en el mundo de las LLMs?
---

### 1.1. LangChain en pocas palabras

**LangChain** es un framework diseñado para facilitar la construcción de aplicaciones basadas en _Large Language Models (LLMs)_. Proporciona herramientas y abstracciones que permiten **conectar** distintos modelos e integrarlos en _pipelines_ o _flujos de trabajo_ (chains) más complejos. Con LangChain podemos, por ejemplo:

- **Construir** aplicaciones que combinen múltiples llamadas a modelos de lenguaje.
- **Enriquecer** las respuestas con contexto proveniente de bases de datos o documentos.
- **Implementar memorias** que recuerden datos de interacciones previas.

Su objetivo principal es **simplificar** el desarrollo de aplicaciones que aprovechan modelos de lenguaje, a la vez que proporciona **flexibilidad** para integrar servicios de diferentes proveedores y orquestar diferentes estrategias de prompting.

### 1.2. Importancia y casos de uso de las LLMs

Las _Large Language Models (LLMs)_ son redes neuronales especializadas en procesar y generar lenguaje natural. Modelos como GPT-3, GPT-4 o Llama 2 han demostrado ser muy eficaces para:

- **Generación de texto**: redacción de artículos, guiones de vídeo, textos creativos, etc.
- **Traducciones y resumidos**: convertir textos entre diferentes idiomas o generar resúmenes de documentos extensos.
- **Asistentes conversacionales**: chatbots que mantienen el contexto de la conversación y pueden llevar a cabo tareas o responder preguntas.
- **Análisis y clasificación** de textos: etiquetar o extraer información relevante de grandes volúmenes de texto.
- **Soporte en programación**: autocompletar código o explicar algoritmos.

Dada esta variedad de posibilidades, integrar LLMs en productos o proyectos se ha convertido en una **prioridad** para muchas empresas y desarrolladores. Y es justo ahí donde **LangChain** ofrece un entorno de desarrollo potente, ágil y modular.

## 2. Obtener claves API
---
Para que la mayor parte de ejemplos de este cuaderno funcionen es necesario obtener claves API de lose servicios que vayamos a usar.  
Para obtener las claves API que deberá luego introducir en el cuaderno debe ir a:

GROQ: https://console.groq.com/keys  
GOOGLE AI STUDIO: https://aistudio.google.com/apikey  
HUFFING FACE: https://huggingface.co/settings/tokens  
OPENAI: https://platform.openai.com/api-keys

## 3. Carga Segura de Claves API
---

Este código se utiliza en Google Colab para obtener claves de API (tokens de acceso) almacenadas de forma segura en la sección "Secretos" de Colab y se asignan a variables para su posterior uso.

Estas claves son necesarias para acceder a servicios externos, como OpenAI, Groq, Google o Hugging Face, desde tu notebook.  

Este proceso evita la necesidad de codificar las claves directamente en el código, lo que representa una mejor práctica de seguridad.  

![Configuración de Secretos en Colab](https://github.com/juanfranbrv/curso-langchain/blob/main/images/secretos.png?raw=true)



In [None]:
from google.colab import userdata

OPENAI_API_KEY=userdata.get('OPENAI_API_KEY')
GROQ_API_KEY=userdata.get('GROQ_API_KEY')
GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
HUGGINGFACEHUB_API_TOKEN=userdata.get('HUGGINGFACEHUB_API_TOKEN')


## 4. Instalación de las bibliotecas necesarias
---

**Cambios desde Colab**  

 Instala las bibliotecas principales (langchain) y sus integraciones con diversos modelos de lenguaje (OpenAI, Groq, Google Gemini).  

 La opción -qU asegura una instalación silenciosa y que tengamos las últimas versiones disponibles.

In [None]:
!pip install langchain -qU

!pip install langchain-openai -qU
!pip install langchain-groq -qU
!pip install langchain-google-genai -qU
!pip install langchain-huggingface -qU

## 5. Importación de las clases necesarias
---

Este bloque de código importa las clases necesarias de langchain para crear y utilizar los modelos de lenguaje de OpenAI, Groq y Google.  

Estas clases son un envoltorio (*wrapper*) para las APIs de sus respectivos propietarios (OpenAI, Groq y Google)

Tambien las clases que proporciona Langchain para la creación de mensajes de usuario y sistema, que usamos para contruir un mensaje (*prompt*)

In [None]:
from langchain_openai import ChatOpenAI
from langchain_groq import ChatGroq
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_huggingface import HuggingFaceEndpoint

from langchain_core.messages import HumanMessage, SystemMessage

In [None]:
modelo1 = ChatOpenAI(model="gpt-4o-mini",api_key=OPENAI_API_KEY)
modelo2 = ChatGroq(model="llama-3.3-70b-versatile", api_key=GROQ_API_KEY)
modelo3 = ChatGoogleGenerativeAI(model="gemini-1.5-pro", api_key=GOOGLE_API_KEY)
modelo4 = HuggingFaceEndpoint(repo_id="Qwen/Qwen2.5-72B-Instruct", huggingfacehub_api_token=HUGGINGFACEHUB_API_TOKEN)

prompt = [
            SystemMessage("Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
            HumanMessage("Estar en la edad del pavo")
           ]

##6. Invocamos los modelos
---
Usamos el metodo .invoke() de los modelos instanciados para llamar a los LLM pasandoles el mensaje.

In [None]:
modelo1.invoke(prompt)

In [None]:
modelo2.invoke(prompt)

In [None]:
modelo3.invoke(prompt)

In [None]:
modelo4.invoke(prompt)

### 7. Otras formas de contruir el prompt
---
LangChain también admite entradas de modelos de chat mediante cadenas o formato OpenAI  
Son equivalentes los siguientes:

In [None]:
modelo2.invoke("Traduce a un frase equivalente (idiom) en inglés: Más vale pájaro en mano que ciento volando")

In [None]:
modelo2.invoke([
    {"role":"system", "content": "Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."},
    {"role":"user", "content": "Más vale pájaro en mano que ciento volando"}
    ])

##8. Respuesta del LLM
Observa que la respuesta del metodo `.invoke()` devuelve mucha informacion util o que podria ser util en aplicaciones mas complejas.  

AIMessage es una clase que contiene información sobre la respuesta de un modelo de lenguaje.

Representa el resultado del modelo y consta tanto del resultado sin procesar como devuelto por el modelo junto con campos estandarizados (por ejemplo, llamadas a herramientas, metadatos de uso) agregados por el marco LangChain.

- content (str): El contenido textual de la respuesta del modelo.

- additional_kwargs (dict): Un diccionario para información adicional específica del proveedor del modelo (puede estar vacío en algunos casos).

- response_metadata (dict): Información sobre la respuesta, como el uso de tokens, el nombre del modelo, etc.

- id (str): Un identificador único para el mensaje.

- usage_metadata (dict): Información de uso de tokens (entrada, salida y total).

In [None]:
ai_message = modelo2.invoke([
    SystemMessage("Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
    HumanMessage("Tener la mosca detrás de la oreja")
            ])

print("Contenido de la respuesta (content):\n", ai_message.content)
print("========")
print("Metadatos de la respuesta (response_metadata): \n", ai_message.response_metadata)
print("========")
print("Tokens utilizados (usage_metadata): \n", ai_message.usage_metadata)
print("========")
print("Identificador de la respuesta (id):", ai_message.id)
print("========")
print("Uso de tokens detallado(response_metadata['token_usage']:\n", ai_message.response_metadata['token_usage'])

## 9. Streaming
---

**Conceptos Clave:**

- **Modelos de Chat "Ejecutables":**
    
    - Imagina que los modelos de chat (como GPT, Gemini, etc.) son como funciones que puedes "ejecutar" o "llamar".
        
    - En Langchain, estos modelos tienen una interfaz estándar, lo que significa que todos se comportan de manera similar cuando los usas.
        
    
- **Modos de Invocación:**
    
    - **Invocación Normal (Síncrona):** Es como preguntar algo y esperar a que el modelo te dé la respuesta completa de una sola vez.
        
    - **Invocación Asíncrona:** Es como preguntar algo y dejar que el modelo trabaje en segundo plano. Puedes hacer otras cosas mientras esperas la respuesta.
        
    - **Transmisión (Streaming):** Es como preguntar algo y recibir la respuesta poco a poco, palabra por palabra o token por token, en lugar de esperar a que esté completa.
        
    
- **Transmisión de Tokens:**
    
    - Los modelos de lenguaje generan texto dividiéndolo en "tokens". Un token puede ser una palabra, una parte de una palabra o un signo de puntuación.
        
    - La transmisión de tokens significa que el modelo te envía cada token a medida que lo genera, en lugar de esperar a tener toda la respuesta.
        
    

**¿Por qué es Útil la Transmisión de Tokens?**

- **Experiencia de Usuario Mejorada:**
    
    - En lugar de esperar un largo tiempo sin saber si el modelo está funcionando, el usuario ve la respuesta aparecer gradualmente. Esto hace que la interacción sea más fluida y natural.
        
    - Es como ver a alguien escribir en tiempo real en lugar de esperar a que termine de escribir todo el texto.
        
    
- **Respuestas Más Rápidas (Aparentemente):**
    
    - Aunque el tiempo total para generar la respuesta puede ser el mismo, la transmisión hace que parezca que la respuesta llega más rápido, ya que el usuario ve el texto aparecer poco a poco.
        
    
- **Procesamiento en Tiempo Real:**
    
    - Puedes empezar a procesar la respuesta del modelo a medida que se genera, sin tener que esperar a que esté completa. Esto es útil en aplicaciones que necesitan reaccionar a la respuesta del modelo en tiempo real.

En este codigo usamos el metodo `.stream()` en lugar de `.invoke()` que devuelve un genera un flujo de tokens con la respuestas y que podemos iterar con un bucle.

In [None]:
for token in modelo2.stream("Explica los verbos modales en inglés."):
    print(token.content, end="|")

##10. Runnables
---
En LangChain, un Runnable es una abstracción que representa cualquier componente capaz de ejecutar una tarea, como modelos de lenguaje, cadenas de operaciones o herramientas personalizadas. Los modelos de lenguaje, como ChatGroq o OpenAI, son ejemplos clave de Runnable, ya que pueden generar texto o realizar tareas específicas al recibir una entrada. Estos componentes son fundamentales para construir flujos de trabajo, ya que permiten encadenar y combinar operaciones de manera modular y flexible.

Los Runnable ofrecen métodos como `.invoke(),` .`stream()` y `.batch()` para manejar diferentes formas de ejecución. Por ejemplo, `.invoke()` devuelve el resultado completo de una tarea, mientras que `.stream()` genera un flujo incremental de resultados, ideal para respuestas largas o en tiempo real. Esta flexibilidad hace que los Runnable sean esenciales para integrar modelos de lenguaje en aplicaciones complejas, permitiendo desde simples llamadas a modelos hasta flujos de trabajo personalizados y escalables.