<a href="https://colab.research.google.com/github/juanfranbrv/curso-langchain/blob/main/1.%20Introducci%C3%B3n%20a%20LangChain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **1. ¬øQu√© es LangChain y por qu√© es relevante en el mundo de los LLMs?**
---

## **1.1. LangChain en pocas palabras**
---

**LangChain** es un framework dise√±ado para facilitar la construcci√≥n de aplicaciones basadas en _Large Language Models (LLMs)_. Proporciona herramientas y abstracciones que permiten **conectar** distintos modelos e integrarlos en _pipelines_ o _flujos de trabajo_ (chains) m√°s complejos. Con LangChain podemos, por ejemplo:

- **Construir** aplicaciones que combinen m√∫ltiples llamadas a modelos de lenguaje.
- **Enriquecer** las respuestas con contexto proveniente de bases de datos o documentos.
- **Implementar memorias** que recuerden datos de interacciones previas.

Su objetivo principal es **simplificar** el desarrollo de aplicaciones que aprovechan modelos de lenguaje, a la vez que proporciona **flexibilidad** para integrar servicios de diferentes proveedores y orquestar diferentes estrategias de prompting.

Se habla de Langchain como un **software de orquestaci√≥n** ya que su fortaleza reside en la capacidad de conectar y coordinar diversos componentes, como modelos de lenguaje, prompts, bases de datos y herramientas externas, permitiendo definir flujos de trabajo complejos (cadenas o chains) donde la salida de un componente alimenta la entrada del siguiente. Esta orquestaci√≥n facilita la construcci√≥n de aplicaciones sofisticadas.  

![https://raw.githubusercontent.com/juanfranbrv/curso-langchain/refs/heads/main/images/langchain.png?token=GHSAT0AAAAAAC5HTYEE4WSTQKG224SMQHZMZ4FOHNA](https://raw.githubusercontent.com/juanfranbrv/curso-langchain/refs/heads/main/images/langchain.png?token=GHSAT0AAAAAAC5HTYEE4WSTQKG224SMQHZMZ4FOHNA)

## **1.2. Importancia y casos de uso de los LLMs**
---

Los _Large Language Models (LLMs)_ son redes neuronales especializadas en procesar y generar lenguaje natural. Modelos como GPT-3, GPT-4 o Llama 2 han demostrado ser muy eficaces para:

- **Generaci√≥n de texto**: redacci√≥n de art√≠culos, guiones de v√≠deo, textos creativos, etc.
- **Traducciones y resumidos**: convertir textos entre diferentes idiomas o generar res√∫menes de documentos extensos.
- **Asistentes conversacionales**: chatbots que mantienen el contexto de la conversaci√≥n y pueden llevar a cabo tareas o responder preguntas.
- **An√°lisis y clasificaci√≥n** de textos: etiquetar o extraer informaci√≥n relevante de grandes vol√∫menes de texto.
- **Soporte en programaci√≥n**: autocompletar c√≥digo o explicar algoritmos.

Dada esta variedad de posibilidades, integrar LLMs en productos o proyectos se ha convertido en una **prioridad** para muchas empresas y desarrolladores. Y es justo ah√≠ donde **LangChain** ofrece un entorno de desarrollo potente, √°gil y modular.

# **2. Configuracion del entorno del cuaderno**
---

## **2.1 Obtener claves API y incorporarlas al cuaderno**
---
Para que la mayor√≠a de los ejemplos de este cuaderno funcionen, es necesario contar con las claves API de los servicios que vamos a usar. Estas claves funcionan como ‚Äúcontrase√±as‚Äù o ‚Äútokens‚Äù que nos permiten autenticar nuestro c√≥digo en cada servicio. Si no tienes una cuenta en cada plataforma, deber√°s crearla primero y luego generar tu clave API en el panel correspondiente.  
Apuntalas en un fichero a medida que las obtengas. Las necesitaras en el proximo paso.

GROQ: https://console.groq.com/keys  
GOOGLE AI STUDIO: https://aistudio.google.com/apikey  
HUFFING FACE: https://huggingface.co/settings/tokens  
OPENAI: https://platform.openai.com/api-keys  (**de pago!**)

No es necesario disponer de todas. Si decides por ejemplo no usar la API de OPENAI (que es de pago) simplemente ignorala en este momento. Y  mas adelante comenta en el codigo todas las referencias a OPENAI

Ve a la barra lateral y haz clic en icono de una llave ("Secretos".)
Haz clic en "A√±adir secreto nuevo".
En "Nombre", escribe el nombre de tu secreto.  

üëâüèª Los nombres importan para que funcione el codigo que sigue. Debes usar los siguientes:

OPENAI_API_KEY  
GROQ_API_KEY  
GOOGLE_API_KEY  
HUGGINGFACEHUB_API_TOKEN  

En "Value", pega el valor de la clave API.

![Configuraci√≥n de Secretos en Colab](https://raw.githubusercontent.com/juanfranbrv/curso-langchain/refs/heads/main/images/secretos.png?token=GHSAT0AAAAAAC5HTYEEDLGANEQ7BARWGCGEZ4FPBXA)

##**2.2. Carga Segura de Claves API**
---

Este c√≥digo se utiliza en Google Colab para obtener claves de API (tokens de acceso) almacenadas de forma segura en la secci√≥n "Secretos" de Colab y se asignan a variables para su posterior uso.

Estas claves son necesarias para acceder a servicios externos, como OpenAI, Groq, Google o Hugging Face, desde tu notebook.  

Este proceso evita la necesidad de codificar las claves directamente en el c√≥digo, lo que representa una mejor pr√°ctica de seguridad.  


In [1]:
from google.colab import userdata

OPENAI_API_KEY=userdata.get('OPENAI_API_KEY')
GROQ_API_KEY=userdata.get('GROQ_API_KEY')
GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')
HUGGINGFACEHUB_API_TOKEN=userdata.get('HUGGINGFACEHUB_API_TOKEN')


## **2.3. Instalaci√≥n de las bibliotecas necesarias**
---

 Instala las bibliotecas principales (langchain) y sus integraciones con diversos modelos de lenguaje (OpenAI, Groq, Google Gemini).  

 La opci√≥n -qU asegura una instalaci√≥n silenciosa y que tengamos las √∫ltimas versiones disponibles.

 %%capture... captura los mensajes de instalaci√≥n para evitar que salgan a pantalla (salvo si hay errores)

In [2]:
%%capture --no-stderr

# Instalamos el paquete principal de Langchain
%pip install langchain -qU

# Instalamos sus integraiones con otros servicios
%pip install langchain-openai -qU
%pip install langchain-groq -qU
%pip install langchain-google-genai -qU
%pip install langchain-huggingface -qU

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/54.2 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m54.2/54.2 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.2/1.2 MB[0m [31m20.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m109.6/109.6 kB[0m [31m4.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m41.5/41.5 kB[0m [31m2.1 MB/s[0m eta [36m0:00:00[0m
[?25h

## **2.4. Importaci√≥n de las clases necesarias**
---

Este bloque de c√≥digo importa las clases necesarias de langchain para crear y utilizar los modelos de lenguaje de OpenAI, Groq y Google.  

Estas clases son un envoltorio (*wrapper*) para las APIs de sus respectivos propietarios (OpenAI, Groq y Google)

Tambien las clases que proporciona Langchain para la creaci√≥n de mensajes de usuario y sistema, que usamos para contruir un mensaje (*prompt*)

In [3]:
from langchain_openai import ChatOpenAI
from langchain_groq import ChatGroq
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_huggingface import HuggingFaceEndpoint

from langchain_core.messages import HumanMessage, SystemMessage

# **3. El momento de la verdad: Invocando nuestros LLMs**
---
Una vez que hemos instalado los componentes requeridos, importado las librer√≠as necesarias y configurado las claves API, estamos listos para la acci√≥n. Realicemos ahora nuestra primera llamada, aunque sea una sencilla, a un modelo de lenguaje (LLM)


In [4]:
modelo1 = ChatOpenAI(model="gpt-4o-mini",api_key=OPENAI_API_KEY)
modelo2 = ChatGroq(model="llama-3.3-70b-versatile", api_key=GROQ_API_KEY)
modelo3 = ChatGoogleGenerativeAI(model="gemini-1.5-pro", api_key=GOOGLE_API_KEY)
modelo4 = HuggingFaceEndpoint(repo_id="Qwen/Qwen2.5-72B-Instruct", huggingfacehub_api_token=HUGGINGFACEHUB_API_TOKEN)

prompt = [
            SystemMessage("Proporciona una frase hecha (idiom) en ingl√©s, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
            HumanMessage("Estar en la edad del pavo")
           ]

Usamos el metodo .invoke() de los modelos instanciados para llamar a los LLM pasandoles el mensaje.

In [5]:
modelo1.invoke(prompt)

AIMessage(content='To be at a awkward age.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 52, 'total_tokens': 59, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_bd83329f63', 'finish_reason': 'stop', 'logprobs': None}, id='run-78e972e1-ab4d-490d-8d29-a748a26d67bb-0', usage_metadata={'input_tokens': 52, 'output_tokens': 7, 'total_tokens': 59, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [None]:
modelo2.invoke(prompt)

In [None]:
modelo3.invoke(prompt)

In [None]:
modelo4.invoke(prompt)

###**Otras formas de contruir el prompt**

LangChain tambi√©n admite entradas de modelos de chat mediante cadenas o formato OpenAI  
Son equivalentes los siguientes:

In [None]:
modelo2.invoke("Traduce a un frase equivalente (idiom) en ingl√©s: M√°s vale p√°jaro en mano que ciento volando")

In [7]:
modelo2.invoke([
    {"role":"system", "content": "Proporciona una frase hecha (idiom) en ingl√©s, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."},
    {"role":"user", "content": "M√°s vale p√°jaro en mano que ciento volando"}
    ])

AIMessage(content='A bird in the hand is worth two in the bush.', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 13, 'prompt_tokens': 85, 'total_tokens': 98, 'completion_time': 0.047272727, 'prompt_time': 0.01323484, 'queue_time': 0.107212177, 'total_time': 0.060507567}, 'model_name': 'llama-3.3-70b-versatile', 'system_fingerprint': 'fp_4196e754db', 'finish_reason': 'stop', 'logprobs': None}, id='run-cb4dc4a5-494b-413b-979e-3b4e433c9f5d-0', usage_metadata={'input_tokens': 85, 'output_tokens': 13, 'total_tokens': 98})

In [8]:
modelo2.invoke([
    ("system", "Proporciona una frase hecha (idiom) en ingl√©s, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
    ("user", "M√°s vale p√°jaro en mano que ciento volando")
    ])

AIMessage(content='A bird in the hand is worth two in the bush.', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 13, 'prompt_tokens': 85, 'total_tokens': 98, 'completion_time': 0.048048413, 'prompt_time': 0.016265944, 'queue_time': 0.0393188, 'total_time': 0.064314357}, 'model_name': 'llama-3.3-70b-versatile', 'system_fingerprint': 'fp_4e32347616', 'finish_reason': 'stop', 'logprobs': None}, id='run-de4a5ffc-7802-439c-8f9c-48f365d40cc8-0', usage_metadata={'input_tokens': 85, 'output_tokens': 13, 'total_tokens': 98})

###**Respuesta del LLM**

Observa que la respuesta del metodo `.invoke()` devuelve mucha informacion util o que podria ser util en aplicaciones mas complejas.  

La respuesta es un **objeto de la clase `AIMessage`** (definida dentro de LangChain). Dicho objeto act√∫a de forma similar a una ‚Äúestructura de datos‚Äù que contiene varios atributos o _campos_, entre ellos:

- `content`: el texto generado por el modelo.
- `additional_kwargs`: un diccionario con posibles argumentos adicionales.
- `response_metadata`: un diccionario donde viene, entre otras cosas, el nombre del modelo (`model_name`).
- `usage_metadata`: estad√≠sticas del uso de tokens.
- `id`: un identificador √∫nico de la ejecuci√≥n.una clase que contiene informaci√≥n sobre la respuesta de un modelo de lenguaje.



In [6]:
ai_message = modelo2.invoke([
    SystemMessage("Proporciona una frase hecha (idiom) en ingl√©s, equivalentes a la que te proporcione. Responde con un frase y solo con la frase."),
    HumanMessage("Tener la mosca detr√°s de la oreja")
            ])

print("Contenido de la respuesta (content):\n", ai_message.content)
print("========")
print("Metadatos de la respuesta (response_metadata): \n", ai_message.response_metadata)
print("========")
print("Tokens utilizados (usage_metadata): \n", ai_message.usage_metadata)
print("========")
print("Identificador de la respuesta (id):", ai_message.id)
print("========")
print("Uso de tokens detallado(response_metadata['token_usage']:\n", ai_message.response_metadata['token_usage'])

Contenido de la respuesta (content):
 To have a bee in one's bonnet.
Metadatos de la respuesta (response_metadata): 
 {'token_usage': {'completion_tokens': 11, 'prompt_tokens': 83, 'total_tokens': 94, 'completion_time': 0.04, 'prompt_time': 0.014568136, 'queue_time': 0.358517083, 'total_time': 0.054568136}, 'model_name': 'llama-3.3-70b-versatile', 'system_fingerprint': 'fp_4e32347616', 'finish_reason': 'stop', 'logprobs': None}
Tokens utilizados (usage_metadata): 
 {'input_tokens': 83, 'output_tokens': 11, 'total_tokens': 94}
Identificador de la respuesta (id): run-96a2f28a-5b43-45eb-8e75-80959e314674-0
Uso de tokens detallado(response_metadata['token_usage']:
 {'completion_tokens': 11, 'prompt_tokens': 83, 'total_tokens': 94, 'completion_time': 0.04, 'prompt_time': 0.014568136, 'queue_time': 0.358517083, 'total_time': 0.054568136}


# **4. Streaming**
---
En la interacci√≥n con modelos de lenguaje como GPT, el streaming ofrece una alternativa a la espera de la respuesta completa. En lugar de una entrega √∫nica, el modelo emite la respuesta progresivamente, token por token (fragmentos de palabras o caracteres). Esta transmisi√≥n gradual mejora la experiencia del usuario, quien percibe una respuesta m√°s r√°pida y natural al ver el texto aparecer en tiempo real. Adem√°s, el streaming permite iniciar el procesamiento de la respuesta en tiempo real, sin esperar a que el modelo termine de generar toda la salida. En esencia, el streaming transforma la interacci√≥n con el LLM de una espera prolongada a una recepci√≥n continua y din√°mica.


En este codigo usamos el metodo `.stream()` en lugar de `.invoke()` que devuelve un genera un flujo de tokens con la respuestas y que podemos iterar con un bucle.

In [None]:
for token in modelo2.stream("Explica los verbos modales en ingl√©s."):
    print(token.content, end="|")

#**5. Runnables**
---
En Langchain, piensa en un Runnable como un bloque de construcci√≥n fundamental: cualquier componente que puede realizar una tarea. Modelos de lenguaje como ChatGroq o OpenAI son excelentes ejemplos, ya que pueden generar texto o hacer cosas espec√≠ficas cuando les das una entrada. Estos bloques son cruciales porque te permiten unir y combinar diferentes tareas para crear flujos de trabajo. Los Runnables tienen funciones clave como .invoke() (para obtener el resultado completo de una vez) y .stream() (para recibir la respuesta poco a poco, ideal para textos largos o ver la respuesta en tiempo real).  

Profundizaremos en los Runnables m√°s adelante. Por ahora, es fundamental saber que una amplia gama de componentes en Langchain se implementan como Runnables o pueden ser adaptados para serlo. Esto incluye elementos centrales como los modelos de lenguaje (LLMs) y los parsers de salida (OutputParsers). Si bien los DataLoaders en s√≠ mismos no son directamente Runnables, a menudo se utilizan para cargar datos que luego se procesan dentro de Runnables. Incluso las funciones Python pueden integrarse en cadenas LCEL al ser envueltas como Runnables

#**6. Referencias**
---

1. https://www.langchain.com/  
2. https://python.langchain.com/docs/introduction/