<a href="https://colab.research.google.com/github/juanfranbrv/curso-langchain/blob/main/1.%20Introducci%C3%B3n%20a%20LangChain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **1. ¿Qué es LangChain y por qué es relevante en el mundo de los LLMs?**
---

## **1.1. LangChain en pocas palabras**
---

**LangChain** es un framework diseñado para facilitar la construcción de aplicaciones basadas en _Large Language Models (LLMs)_. Proporciona herramientas y abstracciones que permiten **conectar** distintos modelos e integrarlos en _pipelines_ o _flujos de trabajo_ (chains) más complejos. Con LangChain podemos, por ejemplo:

- **Construir** aplicaciones que combinen múltiples llamadas a modelos de lenguaje.
- **Enriquecer** las respuestas con contexto proveniente de bases de datos o documentos.
- **Implementar memorias** que recuerden datos de interacciones previas.

Su objetivo principal es **simplificar** el desarrollo de aplicaciones que aprovechan modelos de lenguaje, a la vez que proporciona **flexibilidad** para integrar servicios de diferentes proveedores y orquestar diferentes estrategias de prompting.

Se habla de Langchain como un **software de orquestación** ya que su fortaleza reside en la capacidad de conectar y coordinar diversos componentes, como modelos de lenguaje, prompts, bases de datos y herramientas externas, permitiendo definir flujos de trabajo complejos (cadenas) donde la salida de un componente alimenta la entrada del siguiente. Esta orquestación facilita la construcción de aplicaciones sofisticadas.  

![https://raw.githubusercontent.com/juanfranbrv/curso-langchain/refs/heads/main/images/langchain.png](https://raw.githubusercontent.com/juanfranbrv/curso-langchain/refs/heads/main/images/langchain.png)

## **1.2. Importancia y casos de uso de los LLMs**
---

Los _Large Language Models (LLMs)_ son redes neuronales especializadas en procesar y generar lenguaje natural. Modelos como GPT-3, GPT-4 o Llama 2 han demostrado ser muy eficaces para:

- **Generación de texto**: redacción de artículos, guiones de vídeo, textos creativos, etc.
- **Traducciones y resumidos**: convertir textos entre diferentes idiomas o generar resúmenes de documentos extensos.
- **Asistentes conversacionales**: chatbots que mantienen el contexto de la conversación y pueden llevar a cabo tareas o responder preguntas.
- **Análisis y clasificación** de textos: etiquetar o extraer información relevante de grandes volúmenes de texto.
- **Soporte en programación**: autocompletar código o explicar algoritmos.

Dada esta variedad de posibilidades, integrar LLMs en productos o proyectos se ha convertido en una **prioridad** para muchas empresas y desarrolladores. Y es justo ahí donde **LangChain** ofrece un entorno de desarrollo potente, ágil y modular.

# **2. Configuracion del entorno del cuaderno**
---

## **2.1 Obtener claves API y incorporarlas al cuaderno**
---
Para que la mayoría de los ejemplos de este cuaderno funcionen, es necesario contar con las claves API de los servicios que vamos a usar. Estas claves funcionan como “contraseñas” o “tokens” que nos permiten autenticar nuestro código en cada servicio. Si no tienes una cuenta en cada plataforma, deberás crearla primero y luego generar tu clave API en el panel correspondiente.  
Apuntalas en un fichero a medida que las obtengas. Las necesitaras en el proximo paso.

GROQ: https://console.groq.com/keys  
GOOGLE AI STUDIO: https://aistudio.google.com/apikey  
HUFFING FACE: https://huggingface.co/settings/tokens  
OPENAI: https://platform.openai.com/api-keys  (**de pago!**)
MISTRAL: https://console.mistral.ai/api-keys/  
TOGETHER: https://api.together.ai/
ANTHROPIC: https://console.anthropic.com/ (**de pago!**)


No es necesario disponer de todas. Si decides por ejemplo no usar la API de OPENAI (que es de pago) simplemente ignorala en este momento. Y  mas adelante comenta en el codigo todas las referencias a OPENAI

Ve a la barra lateral y haz clic en icono de una llave ("Secretos".)
Haz clic en "Añadir secreto nuevo".
En "Nombre", escribe el nombre de tu secreto.  

👉🏻 Los nombres importan para que funcione el codigo que sigue. Debes usar los siguientes:

OPENAI_API_KEY  
GROQ_API_KEY  
GOOGLE_API_KEY  
HUGGINGFACEHUB_API_TOKEN  
MISTRAL_API_KEY  
TOGETHER_API_KEY  
ANTHROPIC_API_KEY  


En "Value", pega el valor de la clave API.

![Configuración de Secretos en Colab](https://raw.githubusercontent.com/juanfranbrv/curso-langchain/refs/heads/main/images/secretos.png)

##**2.2. Carga Segura de Claves API**
---

Este código se utiliza en Google Colab para obtener claves de API (tokens de acceso) almacenadas de forma segura en la sección "Secretos" de Colab y se asignan a variables para su posterior uso.

Estas claves son necesarias para acceder a servicios externos, como OpenAI, Groq, Google o Hugging Face, desde tu notebook.  

Este proceso evita la necesidad de codificar las claves directamente en el código, lo que representa una mejor práctica de seguridad.  


In [None]:
from google.colab import userdata

# Obtener las claves API de diferentes servicios desde el almacenamiento seguro de Colab.
OPENAI_API_KEY=userdata.get('OPENAI_API_KEY')
GROQ_API_KEY=userdata.get('GROQ_API_KEY')
GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
HUGGINGFACEHUB_API_TOKEN=userdata.get('HUGGINGFACEHUB_API_TOKEN')
MISTRAL_API_KEY=userdata.get('MISTRAL_API_KEY')
TOGETHER_API_KEY=userdata.get('TOGETHER_API_KEY')
ANTHROPIC_API_KEY=userdata.get('ANTHROPIC_API_KEY')


## **2.3. Instalación de las bibliotecas necesarias**
---

 Instala las bibliotecas principales (langchain) y sus integraciones con diversos modelos de lenguaje (OpenAI, Groq, Google Gemini).  

 La opción -qU asegura una instalación silenciosa y que tengamos las últimas versiones disponibles.

 %%capture... captura los mensajes de instalación para evitar que salgan a pantalla (salvo si hay errores)

In [None]:
%%capture --no-stderr

# Instalamos el paquete principal de Langchain
%pip install langchain -qU

# Instalar las integraciones de LangChain con diferentes proveedores de LLMs.
%pip install langchain-openai -qU
%pip install langchain-groq -qU
%pip install langchain-google-genai -qU
%pip install langchain-huggingface -qU
%pip install langchain_mistralai -qU
%pip install langchain-together -qU
%pip install langchain-anthropic -qU

## **2.4. Importación de las clases necesarias**
---

Este bloque de código importa las clases necesarias de langchain para crear y utilizar los modelos de lenguaje de OpenAI, Groq y Google.  

Estas clases son un envoltorio (*wrapper*) para las APIs de sus respectivos propietarios (OpenAI, Groq y Google)

Tambien las clases que proporciona Langchain para la creación de mensajes de usuario y sistema, que usamos para contruir un mensaje (*prompt*)

In [None]:
from langchain_openai import ChatOpenAI
from langchain_groq import ChatGroq
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_huggingface import HuggingFaceEndpoint

from langchain_core.messages import HumanMessage, SystemMessage

# **3. El momento de la verdad: Invocando nuestros LLMs**
---
Una vez que hemos instalado los componentes requeridos, importado las librerías necesarias y configurado las claves API, estamos listos para la acción. Realicemos ahora nuestra primera llamada, aunque sea una sencilla, a un modelo de lenguaje (LLM)


In [None]:
modelo1 = ChatOpenAI(model="gpt-4o-mini",api_key=OPENAI_API_KEY)
modelo2 = ChatGroq(model="llama-3.3-70b-versatile", api_key=GROQ_API_KEY)
modelo3 = ChatGoogleGenerativeAI(model="gemini-1.5-pro", api_key=GOOGLE_API_KEY)
modelo4 = HuggingFaceEndpoint(repo_id="Qwen/Qwen2.5-72B-Instruct", huggingfacehub_api_token=HUGGINGFACEHUB_API_TOKEN)

prompt = [
            SystemMessage("Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
            HumanMessage("Estar en la edad del pavo")
           ]

Usamos el metodo .invoke() de los modelos instanciados para llamar a los LLM pasandoles el mensaje.

In [None]:
modelo1.invoke(prompt)

In [None]:
modelo2.invoke(prompt)

In [None]:
modelo3.invoke(prompt)

In [None]:
modelo4.invoke(prompt)

###**Otras formas de contruir el prompt**

LangChain también admite entradas de modelos de chat mediante cadenas o formato OpenAI  
Son equivalentes los siguientes:

In [None]:
modelo2.invoke("Traduce a un frase equivalente (idiom) en inglés: Más vale pájaro en mano que ciento volando")

In [None]:
modelo2.invoke([
    {"role":"system", "content": "Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."},
    {"role":"user", "content": "Más vale pájaro en mano que ciento volando"}
    ])

In [None]:
modelo2.invoke([
    ("system", "Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
    ("user", "Más vale pájaro en mano que ciento volando")
    ])

###**Respuesta del LLM**

Observa que la respuesta del metodo `.invoke()` devuelve mucha informacion util o que podria ser util en aplicaciones mas complejas.  

La respuesta es un **objeto de la clase `AIMessage`** (definida dentro de LangChain). Dicho objeto actúa de forma similar a una “estructura de datos” que contiene varios atributos o _campos_, entre ellos:

- `content`: el texto generado por el modelo.
- `additional_kwargs`: un diccionario con posibles argumentos adicionales.
- `response_metadata`: un diccionario donde viene, entre otras cosas, el nombre del modelo (`model_name`).
- `usage_metadata`: estadísticas del uso de tokens.
- `id`: un identificador único de la ejecución.una clase que contiene información sobre la respuesta de un modelo de lenguaje.



In [None]:
ai_message = modelo2.invoke([
    SystemMessage("Proporciona una frase hecha (idiom) en inglés, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
    HumanMessage("Tener la mosca detrás de la oreja")
            ])

print("Contenido de la respuesta (content):\n", ai_message.content)
print("========")
print("Metadatos de la respuesta (response_metadata): \n", ai_message.response_metadata)
print("========")
print("Tokens utilizados (usage_metadata): \n", ai_message.usage_metadata)
print("========")
print("Identificador de la respuesta (id):", ai_message.id)
print("========")
print("Uso de tokens detallado(response_metadata['token_usage']:\n", ai_message.response_metadata['token_usage'])

# **4. Streaming**
---
En la interacción con modelos de lenguaje como GPT, el streaming ofrece una alternativa a la espera de la respuesta completa. En lugar de una entrega única, el modelo emite la respuesta progresivamente, token por token (fragmentos de palabras o caracteres). Esta transmisión gradual mejora la experiencia del usuario, quien percibe una respuesta más rápida y natural al ver el texto aparecer en tiempo real. Además, el streaming permite iniciar el procesamiento de la respuesta en tiempo real, sin esperar a que el modelo termine de generar toda la salida. En esencia, el streaming transforma la interacción con el LLM de una espera prolongada a una recepción continua y dinámica.


En este codigo usamos el metodo `.stream()` en lugar de `.invoke()` que devuelve un genera un flujo de tokens con la respuestas y que podemos iterar con un bucle.

In [None]:
for token in modelo2.stream("Explica los verbos modales en inglés."):
    print(token.content, end="|")

#**5. Runnables**
---
En Langchain, piensa en un Runnable como un bloque de construcción fundamental: cualquier componente que puede realizar una tarea. Modelos de lenguaje como ChatGroq o OpenAI son excelentes ejemplos, ya que pueden generar texto o hacer cosas específicas cuando les das una entrada. Estos bloques son cruciales porque te permiten unir y combinar diferentes tareas para crear flujos de trabajo. Los Runnables tienen funciones clave como .invoke() (para obtener el resultado completo de una vez) y .stream() (para recibir la respuesta poco a poco, ideal para textos largos o ver la respuesta en tiempo real).  

Profundizaremos en los Runnables más adelante. Por ahora, es fundamental saber que una amplia gama de componentes en Langchain se implementan como Runnables o pueden ser adaptados para serlo. Esto incluye elementos centrales como los modelos de lenguaje (LLMs) y los parsers de salida (OutputParsers). Si bien los DataLoaders en sí mismos no son directamente Runnables, a menudo se utilizan para cargar datos que luego se procesan dentro de Runnables. Incluso las funciones Python pueden integrarse en cadenas LCEL al ser envueltas como Runnables

#**6. Referencias**
---

1. https://www.langchain.com/  
2. https://python.langchain.com/docs/introduction/