# LangChain Cookbook üë®‚Äçüç≥üë©‚Äçüç≥

*Este cookbook est√° basado en la [Documentaci√≥n Conceptual de LangChain](https://docs.langchain.com/docs/)*

**Objetivo:** Proporcionar una comprensi√≥n introductoria de los componentes y casos de uso de LangChain a trav√©s de ejemplos [ELI5](https://www.dictionary.com/e/slang/eli5/#:~:text=ELI5%20is%20short%20for%20%E2%80%9CExplain,a%20complicated%20question%20or%20problem.) y fragmentos de c√≥digo. Para casos de uso, consulta la [parte 2](https://github.com/gkamradt/langchain-tutorials/blob/main/LangChain%20Cookbook%20Part%202%20-%20Use%20Cases.ipynb). Ver [tutorial en video](https://www.youtube.com/watch?v=2xxziIWmaSA) de este notebook.


**Enlaces:**
* [Documentaci√≥n Conceptual de LC](https://docs.langchain.com/docs/)
* [Documentaci√≥n de LC Python](https://python.langchain.com/en/latest/)
* [Documentaci√≥n de LC Javascript/Typescript](https://js.langchain.com/docs/)
* [Discord de LC](https://discord.gg/6adMQxSpJS)
* [www.langchain.com](https://langchain.com/)
* [Twitter de LC](https://twitter.com/LangChainAI)


### **¬øQu√© es LangChain?**
> LangChain es un framework para desarrollar aplicaciones potenciadas por modelos de lenguaje.

**~~TL~~DR**: LangChain hace que las partes complicadas de trabajar y construir con modelos de IA sean m√°s f√°ciles. Ayuda a hacer esto de dos maneras:

1. **Integraci√≥n** - Trae datos externos, como tus archivos, otras aplicaciones y datos de API, a tus LLMs
2. **Agencia** - Permite que tus LLMs interact√∫en con su entorno mediante la toma de decisiones. Usa LLMs para ayudar a decidir qu√© acci√≥n tomar a continuaci√≥n

### **¬øPor qu√© LangChain?**
1. **Componentes** - LangChain facilita intercambiar abstracciones y componentes necesarios para trabajar con modelos de lenguaje.

2. **Cadenas personalizadas** - LangChain proporciona soporte listo para usar para usar y personalizar 'cadenas' - una serie de acciones encadenadas.

3. **Velocidad üö¢** - Este equipo lanza incre√≠blemente r√°pido. Estar√°s al d√≠a con las √∫ltimas caracter√≠sticas de LLM.

4. **Comunidad üë•** - Maravilloso soporte comunitario en Discord, encuentros, hackathons, etc.

Aunque los LLMs pueden ser sencillos (texto de entrada, texto de salida), r√°pidamente encontrar√°s puntos de fricci√≥n con los que LangChain ayuda una vez que desarrolles aplicaciones m√°s complicadas.

*Nota: Este cookbook no cubrir√° todos los aspectos de LangChain. Sus contenidos han sido seleccionados para llevarte a construir y tener impacto lo m√°s r√°pido posible. Para m√°s, consulta la [Documentaci√≥n Conceptual de LangChain](https://docs.langchain.com/docs/)*

*Actualizaci√≥n Oct '23: Este notebook se ha ampliado desde su forma original*

Necesitar√°s una clave API de OpenAI para seguir este tutorial. Puedes tenerla como variable de entorno, en un archivo .env donde vive este jupyter notebook, o insertarla donde dice 'YourAPIKey'. Si tienes preguntas sobre esto, pon estas instrucciones en [ChatGPT](https://chat.openai.com/).

In [73]:
# Instalaci√≥n de todas las dependencias necesarias
# Ejecuta esta celda primero antes de ejecutar el resto del notebook

# %pip install langchain
# %pip install langchain-core
# %pip install langchain-openai
# %pip install langchain-community
# %pip install langchain-text-splitters
# %pip install python-dotenv
# %pip install openai
# %pip install faiss-cpu
# %pip install chromadb
# %pip install tiktoken
# %pip install google-search-results
# %pip install unstructured
# %pip install lxml

In [74]:
# Importar las bibliotecas necesarias para manejar variables de entorno
from dotenv import load_dotenv
import os

# Cargar variables de entorno desde el archivo .env
load_dotenv()

# Obtener la clave API de OpenAI desde las variables de entorno
openai_api_key=os.getenv('OPENAI_API_KEY', 'YourAPIKey')

# Componentes de LangChain

## Schema - Tuercas y tornillos para trabajar con Modelos de Lenguaje Grandes (LLMs)

### **Texto**
La forma natural de interactuar con LLMs

In [75]:
# Trabajar√°s con cadenas de texto simples (¬°que pronto crecer√°n en complejidad!)
my_text = "What day comes after Friday?"
my_text

'What day comes after Friday?'

### **Mensajes de Chat**
Como texto, pero especificado con un tipo de mensaje (Sistema, Humano, IA)

* **Sistema** - Contexto de fondo √∫til que le dice a la IA qu√© hacer
* **Humano** - Mensajes que est√°n destinados a representar al usuario
* **IA** - Mensajes que muestran con qu√© respondi√≥ la IA

Para m√°s informaci√≥n, consulta la [documentaci√≥n](https://platform.openai.com/docs/guides/chat/introduction) de OpenAI

In [76]:
# Importar el modelo de chat de OpenAI y las clases de mensajes
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage

# Este es el modelo de lenguaje que usaremos. Hablaremos de lo que estamos haciendo a continuaci√≥n
# temperature controla la aleatoriedad de las respuestas (0 = determinista, 1 = m√°s creativo)
chat = ChatOpenAI(temperature=.7, openai_api_key=openai_api_key)

Ahora creemos algunos mensajes que simulan una experiencia de chat con un bot

In [77]:
# Ahora creamos algunos mensajes que simulan una experiencia de chat con un bot
# SystemMessage: establece el comportamiento del asistente
# HumanMessage: representa la entrada del usuario
response = chat.invoke(
    [
        SystemMessage(content="You are a nice AI bot that helps a user figure out what to eat in one short sentence"),
        HumanMessage(content="I like tomatoes, what should I eat?")
    ]
)
response

AIMessage(content='You could try a caprese salad with fresh tomatoes, mozzarella, basil, and balsamic glaze.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 23, 'prompt_tokens': 39, 'total_tokens': 62, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CfXU4DJEBZHXh0CfhqVO9UifJOfmn', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--34d0f3fd-666a-40ab-ab3b-4cde72f9a3ea-0', usage_metadata={'input_tokens': 39, 'output_tokens': 23, 'total_tokens': 62, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

Tambi√©n puedes pasar m√°s historial de chat con respuestas de la IA

In [78]:
# Tambi√©n puedes pasar m√°s historial de chat con respuestas previas de la IA
# Esto le da contexto al modelo sobre la conversaci√≥n anterior
response = chat.invoke(
    [
        SystemMessage(content="You are a nice AI bot that helps a user figure out where to travel in one short sentence"),
        HumanMessage(content="I like the beaches where should I go?"),
        AIMessage(content="You should go to Nice, France"),
        HumanMessage(content="What else should I do when I'm there?")
    ]
)
response

AIMessage(content='In Nice, France, you can also explore the charming old town, visit the colorful markets, and enjoy delicious French cuisine.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 25, 'prompt_tokens': 64, 'total_tokens': 89, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CfXU5v3BYZTgEAbJqf6PNhNux60IW', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--38cf7303-0dad-4264-9c8f-66a61a1d7c0d-0', usage_metadata={'input_tokens': 64, 'output_tokens': 25, 'total_tokens': 89, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

Tambi√©n puedes excluir el mensaje del sistema si lo deseas

In [79]:
# Tambi√©n puedes excluir el mensaje del sistema si lo deseas
# El modelo responder√° bas√°ndose solo en el mensaje del usuario
response = chat.invoke(
    [
        HumanMessage(content="What day comes after Thursday?")
    ]
)
response

AIMessage(content='Friday', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 1, 'prompt_tokens': 13, 'total_tokens': 14, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CfXU67A0anxF6iFgX76g1dXCTLECK', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--d309016d-bfc4-4638-96dc-ee106a6c7a1f-0', usage_metadata={'input_tokens': 13, 'output_tokens': 1, 'total_tokens': 14, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### **Documentos**
Un objeto que contiene un fragmento de texto y metadatos (m√°s informaci√≥n sobre ese texto)

In [80]:
# Importar la clase Document para trabajar con documentos
from langchain_core.documents import Document

In [81]:
# Crear un documento con contenido y metadatos
# page_content: el texto del documento
# metadata: informaci√≥n adicional sobre el documento (ID, fuente, fecha, etc.)
Document(page_content="This is my document. It is full of text that I've gathered from other places",
         metadata={
             'my_document_id' : 234234,
             'my_document_source' : "The LangChain Papers",
             'my_document_create_time' : 1680013019
         })

Document(metadata={'my_document_id': 234234, 'my_document_source': 'The LangChain Papers', 'my_document_create_time': 1680013019}, page_content="This is my document. It is full of text that I've gathered from other places")

Pero no tienes que incluir metadatos si no quieres

In [82]:
# Pero no tienes que incluir metadatos si no quieres
# Puedes crear un documento solo con el contenido
Document(page_content="This is my document. It is full of text that I've gathered from other places")

Document(metadata={}, page_content="This is my document. It is full of text that I've gathered from other places")

## Modelos - La interfaz con los cerebros de IA

###  **Modelo de Lenguaje**
¬°Un modelo que hace texto de entrada ‚û°Ô∏è texto de salida!

*Observa c√≥mo cambi√© el modelo que estaba usando del predeterminado a gpt-3.5-turbo-instruct (un modelo econ√≥mico de bajo rendimiento). Ver m√°s modelos [aqu√≠](https://platform.openai.com/docs/models)*

In [83]:
# Importar el modelo de lenguaje de OpenAI
from langchain_openai import OpenAI

# Crear una instancia del modelo usando text-ada-001 (un modelo econ√≥mico de bajo rendimiento)
# Ver m√°s modelos en https://platform.openai.com/docs/models
llm = OpenAI(model_name="gpt-3.5-turbo-instruct", openai_api_key=openai_api_key)

In [84]:
# Invocar el modelo con una pregunta simple
llm.invoke("What day comes after Friday?")

'\n\nSaturday.'

### **Modelo de Chat**
Un modelo que toma una serie de mensajes y devuelve un mensaje de salida

In [85]:
# Importar el modelo de chat de OpenAI y las clases de mensajes
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage

# Crear un modelo de chat con temperature=1 (m√°s creativo/aleatorio)
chat = ChatOpenAI(temperature=1, openai_api_key=openai_api_key)

In [86]:
# Ejemplo de un bot que responde con bromas
# SystemMessage configura el comportamiento: en este caso, hacer bromas
response = chat.invoke(
    [
        SystemMessage(content="You are an unhelpful AI bot that makes a joke at whatever the user says"),
        HumanMessage(content="I would like to go to New York, how should I do this?")
    ]
)
response

AIMessage(content='Why did the computer go to New York City? To get a byte of the Big Apple!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 19, 'prompt_tokens': 43, 'total_tokens': 62, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CfXU8UdEaN8mCVVYlpTJUBWMQZhVK', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--6b59c56c-0efe-43a9-b782-5d78c28bb0bc-0', usage_metadata={'input_tokens': 43, 'output_tokens': 19, 'total_tokens': 62, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### Modelos de Function Calling

[Los modelos de function calling](https://openai.com/blog/function-calling-and-other-api-updates) son similares a los Modelos de Chat pero con un poco de sabor extra. Est√°n afinados para dar salidas de datos estructurados.

Esto es √∫til cuando est√°s haciendo una llamada API a un servicio externo o haciendo extracci√≥n.

In [87]:
# Ejemplo de Function Calling: el modelo puede devolver datos estructurados
# En este caso, definimos una funci√≥n "get_current_weather" que el modelo puede llamar
chat = ChatOpenAI(model='gpt-4o-mini', temperature=1, openai_api_key=openai_api_key)

# Enviar un mensaje y definir qu√© funciones est√°n disponibles
output = chat.invoke(
     [
         SystemMessage(content="You are an helpful AI bot"),
         HumanMessage(content="What's the weather like in Boston right now?")
     ],
     functions=[{
         "name": "get_current_weather",
         "description": "Get the current weather in a given location",
         "parameters": {
             "type": "object",
             "properties": {
                 "location": {
                     "type": "string",
                     "description": "The city and state, e.g. San Francisco, CA"
                 },
                 "unit": {
                     "type": "string",
                     "enum": ["celsius", "fahrenheit"]
                 }
             },
             "required": ["location"]
         }
     }
     ]
)
output

AIMessage(content='', additional_kwargs={'function_call': {'arguments': '{"location":"Boston, MA"}', 'name': 'get_current_weather'}, 'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 17, 'prompt_tokens': 88, 'total_tokens': 105, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_560af6e559', 'id': 'chatcmpl-CfXU9cwdUa9tYKyf9UTbZVW3VxKMs', 'service_tier': 'default', 'finish_reason': 'function_call', 'logprobs': None}, id='lc_run--10f12cad-8ef0-444f-b061-25ee86bb73c4-0', usage_metadata={'input_tokens': 88, 'output_tokens': 17, 'total_tokens': 105, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

¬øVes el `additional_kwargs` extra que se nos devuelve? Podemos tomar eso y pasarlo a una API externa para obtener datos. Ahorra la molestia de hacer an√°lisis de salida.

### **Modelo de Embedding de Texto**
Cambia tu texto en un vector (una serie de n√∫meros que contienen el 'significado' sem√°ntico de tu texto). Se usa principalmente cuando se comparan dos fragmentos de texto juntos.

*PD: Sem√°ntico significa 'relacionado con el significado en el lenguaje o la l√≥gica.'*

In [88]:
# Importar el modelo de embeddings de OpenAI
# Los embeddings convierten texto en vectores num√©ricos que capturan el significado sem√°ntico
from langchain_openai import OpenAIEmbeddings

# Crear una instancia del modelo de embeddings
embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)

In [89]:
# Texto de ejemplo para convertir en embedding
text = "Hi! It's time for the beach"

In [90]:
# Generar el embedding (vector) del texto
text_embedding = embeddings.embed_query(text)
# Mostrar una muestra de los primeros 5 n√∫meros del vector
print (f"Here's a sample: {text_embedding[:5]}...")
# Mostrar la longitud total del vector (t√≠picamente 1536 para OpenAI)
print (f"Your embedding is length {len(text_embedding)}")

Here's a sample: [-0.00022214034106582403, -0.0031126115936785936, -0.0010768607025966048, -0.019214099273085594, -0.015184946358203888]...
Your embedding is length 1536


## Prompts - Texto generalmente usado como instrucciones para tu modelo

### **Prompt**
Lo que pasar√°s al modelo subyacente

In [91]:
# Importar el modelo de lenguaje de OpenAI
from langchain_openai import OpenAI

# Crear instancia del modelo usando text-davinci-003
llm = OpenAI(model_name="gpt-3.5-turbo-instruct", openai_api_key=openai_api_key)

# Me gusta usar tres comillas dobles para mis prompts porque es m√°s f√°cil de leer
prompt = """
Today is Monday, tomorrow is Wednesday.

What is wrong with that statement?
"""

# Invocar el modelo con el prompt
print(llm.invoke(prompt))


The statement skips over Tuesday and jumps directly from Monday to Wednesday. It should say "Today is Monday, tomorrow is Tuesday."


### **Prompt Template**
Un objeto que ayuda a crear prompts basados en una combinaci√≥n de entrada del usuario, otra informaci√≥n no est√°tica y una cadena de plantilla fija.

Piensa en ello como un [f-string](https://realpython.com/python-f-strings/) en python pero para prompts

*Avanzado: Consulta LangSmithHub(https://smith.langchain.com/hub) para muchos m√°s templates de prompts de la comunidad*

In [92]:
# Importar las clases necesarias para trabajar con templates de prompts
from langchain_openai import OpenAI
from langchain_core.prompts import PromptTemplate

# Crear instancia del modelo
llm = OpenAI(model_name="gpt-3.5-turbo-instruct", openai_api_key=openai_api_key)

# Nota: "location" es un marcador de posici√≥n que ser√° reemplazado m√°s tarde
template = """
I really want to travel to {location}. What should I do there?

Respond in one short sentence
"""

# Crear el template de prompt con la variable "location"
prompt = PromptTemplate(
    input_variables=["location"],
    template=template,
)

# Formatear el prompt reemplazando {location} con 'Rome'
final_prompt = prompt.format(location='Rome')

print (f"Final Prompt: {final_prompt}")
print ("-----------")
# Invocar el modelo con el prompt formateado
print (f"LLM Output: {llm.invoke(final_prompt)}")

Final Prompt: 
I really want to travel to Rome. What should I do there?

Respond in one short sentence

-----------
LLM Output: 
Visit historical landmarks such as the Colosseum and Vatican City.


### **Selectores de Ejemplos**
Una forma f√°cil de seleccionar de una serie de ejemplos que te permiten colocar din√°micamente informaci√≥n en contexto en tu prompt. A menudo se usa cuando tu tarea es matizada o tienes una gran lista de ejemplos.

Consulta diferentes tipos de selectores de ejemplos [aqu√≠](https://python.langchain.com/docs/modules/model_io/prompts/example_selectors/)

Si quieres una visi√≥n general de por qu√© los ejemplos son importantes (ingenier√≠a de prompts), consulta [este video](https://www.youtube.com/watch?v=dOxUroR57xs)

In [93]:
# Importar las clases necesarias para selectores de ejemplos sem√°nticos
from langchain_core.example_selectors import SemanticSimilarityExampleSelector
from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings
from langchain_core.prompts import FewShotPromptTemplate, PromptTemplate
from langchain_openai import OpenAI

# Crear instancia del modelo
llm = OpenAI(model_name="gpt-3.5-turbo-instruct", openai_api_key=openai_api_key)

# Template para formatear cada ejemplo
example_prompt = PromptTemplate(
    input_variables=["input", "output"],
    template="Example Input: {input}\nExample Output: {output}",
)

# Ejemplos de ubicaciones donde se encuentran sustantivos
examples = [
    {"input": "pirate", "output": "ship"},
    {"input": "pilot", "output": "plane"},
    {"input": "driver", "output": "car"},
    {"input": "tree", "output": "ground"},
    {"input": "bird", "output": "nest"},
]

In [94]:
# SemanticSimilarityExampleSelector seleccionar√° ejemplos similares a tu entrada por significado sem√°ntico

# Crear el selector de ejemplos
example_selector = SemanticSimilarityExampleSelector.from_examples(
    # Esta es la lista de ejemplos disponibles para seleccionar
    examples, 
    
    # Esta es la clase de embedding utilizada para medir la similitud sem√°ntica
    OpenAIEmbeddings(openai_api_key=openai_api_key), 
    
    # Esta es la clase VectorStore que almacena los embeddings y hace b√∫squedas de similitud
    Chroma, 
    
    # Este es el n√∫mero de ejemplos a producir
    k=2
)

In [95]:
# Crear un prompt con pocos ejemplos (Few-Shot) usando el selector sem√°ntico
similar_prompt = FewShotPromptTemplate(
    # El objeto que ayudar√° a seleccionar ejemplos
    example_selector=example_selector,
    
    # Tu template de ejemplo
    example_prompt=example_prompt,
    
    # Personalizaciones que se agregar√°n al inicio y final de tu prompt
    prefix="Give the location an item is usually found in",
    suffix="Input: {noun}\nOutput:",
    
    # Qu√© variables recibir√° tu prompt
    input_variables=["noun"],
)

In [96]:
# ¬°Selecciona un sustantivo!
my_noun = "plant"
# my_noun = "student"

# Formatear el prompt con el sustantivo y ver qu√© ejemplos se seleccionan
print(similar_prompt.format(noun=my_noun))

Give the location an item is usually found in

Example Input: tree
Example Output: ground

Example Input: tree
Example Output: ground

Input: plant
Output:


In [97]:
# Invocar el modelo con el prompt formateado
llm.invoke(similar_prompt.format(noun=my_noun))

' garden'

### **Analizadores de Salida M√©todo 1: Instrucciones de Prompt y An√°lisis de Cadenas**
Una forma √∫til de formatear la salida de un modelo. Generalmente se usa para salida estructurada. LangChain tiene muchos m√°s analizadores de salida listados en su [documentaci√≥n](https://python.langchain.com/docs/modules/model_io/output_parsers).

Dos conceptos grandes:

**1. Instrucciones de Formato** - Un prompt autogenerado que le dice al LLM c√≥mo formatear su respuesta bas√°ndose en tu resultado deseado

**2. Analizador** - Un m√©todo que extraer√° la salida de texto de tu modelo en una estructura deseada (generalmente json)

In [98]:
# NOTA: StructuredOutputParser est√° deprecado en versiones nuevas de LangChain
# Se recomienda usar OpenAI Functions (M√©todo 2 m√°s abajo) para salidas estructuradas
# Esta celda se mantiene para referencia pero puede no funcionar en versiones recientes

# Para versiones actuales, saltea esta secci√≥n y usa directamente el M√©todo 2 (OpenAI Functions)
print("Esta celda usa APIs deprecadas. Por favor, salta a la secci√≥n 'Analizadores de Salida M√©todo 2: Funciones de OpenAI' m√°s abajo.")

Esta celda usa APIs deprecadas. Por favor, salta a la secci√≥n 'Analizadores de Salida M√©todo 2: Funciones de OpenAI' m√°s abajo.


In [99]:
# Celda deprecada - salta a la secci√≥n de OpenAI Functions
print("Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.")

Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.


In [100]:
# Celda deprecada - salta a la secci√≥n de OpenAI Functions
print("Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.")

Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.


In [101]:
# Celda deprecada - salta a la secci√≥n de OpenAI Functions
print("Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.")

Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.


In [102]:
# Celda deprecada - salta a la secci√≥n de OpenAI Functions
print("Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.")

Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.


In [103]:
# Celda deprecada - salta a la secci√≥n de OpenAI Functions
print("Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.")

Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.


In [104]:
# Celda deprecada - salta a la secci√≥n de OpenAI Functions
print("Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.")

Esta celda est√° deprecada. Usa el M√©todo 2 (OpenAI Functions) en su lugar.


### **Analizadores de Salida M√©todo 2: Funciones de OpenAI**
Cuando OpenAI lanz√≥ function calling, el juego cambi√≥. Este es el m√©todo recomendado cuando est√°s empezando.

Entrenaron modelos espec√≠ficamente para dar salidas de datos estructurados. Se volvi√≥ s√∫per f√°cil especificar un esquema Pydantic y obtener una salida estructurada.

Hay muchas formas de definir tu esquema, prefiero usar Modelos Pydantic por lo organizados que son. Si√©ntete libre de consultar la [documentaci√≥n](https://platform.openai.com/docs/guides/gpt/function-calling) de OpenAI para otros m√©todos.

Para usar este m√©todo necesitar√°s usar un modelo que soporte [function calling](https://openai.com/blog/function-calling-and-other-api-updates#:~:text=Developers%20can%20now%20describe%20functions%20to%20gpt%2D4%2D0613%20and%20gpt%2D3.5%2Dturbo%2D0613%2C). Usar√© `gpt4-0613`

**Ejemplo 1: Simple**

Comencemos definiendo un modelo simple para que extraigamos de √©l.

In [105]:
# Importar Pydantic para definir modelos de datos estructurados
from pydantic import BaseModel, Field
from typing import Optional

# Definir un modelo Pydantic para informaci√≥n de una persona
class Person(BaseModel):
    """Informaci√≥n de identificaci√≥n sobre una persona."""

    name: str = Field(..., description="El nombre de la persona")
    age: int = Field(..., description="La edad de la persona")
    fav_food: Optional[str] = Field(None, description="La comida favorita de la persona")

Entonces creemos una cadena (m√°s sobre esto m√°s adelante) que har√° la extracci√≥n por nosotros

In [106]:
# M√©todo moderno usando with_structured_output (reemplaza create_structured_output_chain)
from langchain_openai import ChatOpenAI

# Crear instancia del modelo GPT-4o-mini (modelo actual y econ√≥mico)
llm = ChatOpenAI(model='gpt-4o-mini', openai_api_key=openai_api_key)

# Crear un extractor estructurado usando el m√©todo moderno
structured_llm = llm.with_structured_output(Person)

# Ejecutar con un texto de ejemplo
result = structured_llm.invoke(
    "Sally is 13, Joey just turned 12 and loves spinach. Caroline is 10 years older than Sally."
)
result

Person(name='Sally', age=13, fav_food=None)

¬øNotas c√≥mo solo tenemos datos de una persona de esa lista? Eso es porque no especificamos que quer√≠amos m√∫ltiples. Cambiemos nuestro esquema para especificar que queremos una lista de personas si es posible.

In [107]:
# Importar Sequence para definir listas tipadas
from typing import Sequence

# Definir un modelo que puede contener m√∫ltiples personas
class People(BaseModel):
    """Informaci√≥n de identificaci√≥n sobre todas las personas en un texto."""

    people: Sequence[Person] = Field(..., description="Las personas en el texto")

Ahora llamaremos con People en lugar de Person

In [108]:
# Ahora usamos People en lugar de Person para extraer m√∫ltiples personas
structured_llm = llm.with_structured_output(People)

result = structured_llm.invoke(
    "Sally is 13, Joey just turned 12 and loves spinach. Caroline is 10 years older than Sally."
)
result

People(people=[Person(name='Sally', age=13, fav_food=None), Person(name='Joey', age=12, fav_food='spinach'), Person(name='Caroline', age=23, fav_food=None)])

Hagamos m√°s an√°lisis con √©l

**Ejemplo 2: Enum**

Ahora analicemos cuando se menciona un producto de una lista

In [109]:
# Importar enum para definir opciones limitadas
import enum

# Crear instancia del modelo con gpt-4o-mini (modelo actual)
llm = ChatOpenAI(model='gpt-4o-mini', openai_api_key=openai_api_key)

# Definir un enum con productos espec√≠ficos
class Product(str, enum.Enum):
    CRM = "CRM"
    VIDEO_EDITING = "VIDEO_EDITING"
    HARDWARE = "HARDWARE"

In [110]:
# Definir un modelo para identificar productos mencionados
class Products(BaseModel):
    """Identificar productos que fueron mencionados en un texto"""

    products: Sequence[Product] = Field(..., description="Los productos mencionados en un texto")

In [111]:
# Crear extractor para productos y ejecutarlo
structured_llm = llm.with_structured_output(Products)

result = structured_llm.invoke(
    "The CRM in this demo is great. Love the hardware. The microphone is also cool. Love the video editing"
)
result

Products(products=[<Product.CRM: 'CRM'>, <Product.HARDWARE: 'HARDWARE'>, <Product.VIDEO_EDITING: 'VIDEO_EDITING'>])

## √çndices - Estructurar documentos para que los LLMs puedan trabajar con ellos

### **Cargadores de Documentos**
Formas f√°ciles de importar datos de otras fuentes. Funcionalidad compartida con [Plugins de OpenAI](https://openai.com/blog/chatgpt-plugins) [espec√≠ficamente plugins de recuperaci√≥n](https://github.com/openai/chatgpt-retrieval-plugin)

Ver una [gran lista](https://python.langchain.com/en/latest/modules/indexes/document_loaders.html) de cargadores de documentos aqu√≠. Un mont√≥n m√°s en [Llama Index](https://llamahub.ai/) tambi√©n.

**HackerNews**

In [112]:
# Importar el cargador de documentos de HackerNews
from langchain_community.document_loaders import HNLoader

In [113]:
# Crear un cargador para una p√°gina espec√≠fica de HackerNews
loader = HNLoader("https://news.ycombinator.com/item?id=34422627")

In [114]:
# Cargar los datos (comentarios) de la p√°gina
# NOTA: HNLoader puede fallar si la estructura de HackerNews cambia
try:
    data = loader.load()
    print(f"Cargados {len(data)} comentarios exitosamente")
except AttributeError as e:
    print(f"Error al cargar datos de HackerNews: {e}")
    print("El cargador de HackerNews puede estar desactualizado. Prueba con otros cargadores de documentos.")
    data = []  # Lista vac√≠a para que las siguientes celdas no fallen

Error al cargar datos de HackerNews: 'NoneType' object has no attribute 'get'
El cargador de HackerNews puede estar desactualizado. Prueba con otros cargadores de documentos.


In [115]:
# Imprimir la cantidad de comentarios encontrados y una muestra
if len(data) > 0:
    print(f"Found {len(data)} comments")
    print(f"Here's a sample:\n\n{''.join([x.page_content[:150] for x in data[:2]])}")
else:
    print("No se pudieron cargar comentarios. El cargador de HackerNews puede tener problemas.")

No se pudieron cargar comentarios. El cargador de HackerNews puede tener problemas.


**Libros del Proyecto Gutenberg**

In [116]:
# Importar el cargador de libros del Proyecto Gutenberg
from langchain_community.document_loaders import GutenbergLoader

# Cargar un libro espec√≠fico (en este caso, un libro de Edgar Allan Poe)
loader = GutenbergLoader("https://www.gutenberg.org/cache/epub/2148/pg2148.txt")

data = loader.load()

In [117]:
# Imprimir una muestra del contenido del libro
print(data[0].page_content[1855:1984])

o.‚Äî_Seneca_.





      At Paris, just after dark one gusty evening in the autumn of 18-,


      I was enjoying the twofold l


**URLs y p√°ginas web**

Prob√©moslo con [el sitio web de Paul Graham](http://www.paulgraham.com/)

In [118]:
# Importar el cargador de URLs para p√°ginas web
from langchain_community.document_loaders import UnstructuredURLLoader

# Lista de URLs para cargar
urls = [
    "http://www.paulgraham.com/",
]

# Crear el cargador con las URLs
loader = UnstructuredURLLoader(urls=urls)

# Cargar los datos de las p√°ginas web
data = loader.load()

# Mostrar el contenido de la primera p√°gina
data[0].page_content

'New: Good Writing | Founder Mode Want to start a startup? Get funded by Y Combinator . ¬© mmxxv pg'

### **Divisores de Texto**
A menudo tus documentos son demasiado largos (como un libro) para tu LLM. Necesitas dividirlo en fragmentos. Los divisores de texto ayudan con esto.

Hay muchas formas en que podr√≠as dividir tu texto en fragmentos, experimenta con [diferentes](https://python.langchain.com/en/latest/modules/indexes/text_splitters.html) para ver cu√°l es mejor para ti.

In [119]:
# Importar el divisor de texto recursivo
from langchain_text_splitters import RecursiveCharacterTextSplitter

In [120]:
# Este es un documento largo que podemos dividir
# NOTA: Si no tienes el archivo, puedes descargarlo de:
# https://github.com/gkamradt/langchain-tutorials/tree/main/data/PaulGrahamEssays

import os

if os.path.exists('data/PaulGrahamEssays/worked.txt'):
    with open('data/PaulGrahamEssays/worked.txt') as f:
        pg_work = f.read()
    print(f"You have {len([pg_work])} document")
else:
    print("El archivo 'data/PaulGrahamEssays/worked.txt' no existe.")
    print("Puedes descargarlo de: https://github.com/gkamradt/langchain-tutorials/tree/main/data/PaulGrahamEssays")
    print("O usar tu propio texto para probar:")
    
    # Texto de ejemplo para demostraci√≥n
    pg_work = """This is a sample text for demonstration purposes. 
    In real scenarios, you would load a longer document here.
    You can replace this with any long text you want to split into chunks.
    The text splitter will divide this into smaller pieces based on the chunk_size parameter."""
    print(f"\nUsando texto de ejemplo. You have {len([pg_work])} document")

El archivo 'data/PaulGrahamEssays/worked.txt' no existe.
Puedes descargarlo de: https://github.com/gkamradt/langchain-tutorials/tree/main/data/PaulGrahamEssays
O usar tu propio texto para probar:

Usando texto de ejemplo. You have 1 document


In [121]:
# Crear un divisor de texto con configuraci√≥n personalizada
text_splitter = RecursiveCharacterTextSplitter(
    # Establecer un tama√±o de chunk peque√±o, solo para demostrar
    chunk_size = 150,
    # Superposici√≥n entre chunks para mantener contexto
    chunk_overlap  = 20,
)

# Crear documentos divididos
texts = text_splitter.create_documents([pg_work])

In [122]:
# Mostrar cu√°ntos documentos tenemos despu√©s de dividir
print (f"You have {len(texts)} documents")

You have 3 documents


In [123]:
# Vista previa de los primeros chunks
print ("Preview:")
print (texts[0].page_content, "\n")
print (texts[1].page_content)

Preview:
This is a sample text for demonstration purposes. 
    In real scenarios, you would load a longer document here. 

You can replace this with any long text you want to split into chunks.


Hay un mont√≥n de formas diferentes de hacer divisi√≥n de texto y realmente depende de tu estrategia de recuperaci√≥n y dise√±o de aplicaci√≥n. Consulta m√°s divisores [aqu√≠](https://python.langchain.com/docs/modules/data_connection/document_transformers/)

### **Recuperadores**
Forma f√°cil de combinar documentos con modelos de lenguaje.

Hay muchos tipos diferentes de recuperadores, el m√°s ampliamente soportado es el VectoreStoreRetriever

In [124]:
# Importar las clases necesarias para recuperadores y vectorstores
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings
import os

# Cargar un documento de texto
if os.path.exists('data/PaulGrahamEssays/worked.txt'):
    loader = TextLoader('data/PaulGrahamEssays/worked.txt')
    documents = loader.load()
    print("Archivo cargado exitosamente")
else:
    print("Archivo no encontrado. Usando texto de ejemplo.")
    from langchain_core.documents import Document
    documents = [Document(page_content="""This is sample text for demonstration. 
    In a real scenario, you would load a document from a file.
    This text will be split into chunks and used for retrieval demonstrations.
    You can replace this with any text content you want to experiment with.""")]

Archivo no encontrado. Usando texto de ejemplo.


In [125]:
# Preparar tu divisor de texto
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=50)

# Dividir tus documentos en textos
texts = text_splitter.split_documents(documents)

# Preparar el motor de embeddings
embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)

# Embedear tus textos y crear la base de datos vectorial FAISS
db = FAISS.from_documents(texts, embeddings)

In [126]:
# Inicializar tu recuperador
retriever = db.as_retriever()

In [127]:
# Ver el objeto recuperador
retriever

VectorStoreRetriever(tags=['FAISS', 'OpenAIEmbeddings'], vectorstore=<langchain_community.vectorstores.faiss.FAISS object at 0x0000012E5BD18750>, search_kwargs={})

In [128]:
# Obtener documentos relevantes basados en una consulta
# Nota: get_relevant_documents est√° deprecado, ahora se usa invoke
docs = retriever.invoke("what types of things did the author want to build?")

In [129]:
# Mostrar los primeros 200 caracteres de los 2 documentos m√°s relevantes
print("\n\n".join([x.page_content[:200] for x in docs[:2]]))

This is sample text for demonstration. 
    In a real scenario, you would load a document from a file.
    This text will be split into chunks and used for retrieval demonstrations.
    You can replac


### **VectorStores**
Bases de datos para almacenar vectores. Las m√°s populares son [Pinecone](https://www.pinecone.io/) y [Weaviate](https://weaviate.io/). M√°s ejemplos en la [documentaci√≥n de recuperaci√≥n](https://github.com/openai/chatgpt-retrieval-plugin#choosing-a-vector-database) de OpenAI. [Chroma](https://www.trychroma.com/) y [FAISS](https://engineering.fb.com/2017/03/29/data-infrastructure/faiss-a-library-for-efficient-similarity-search/) son f√°ciles de trabajar localmente.

Conceptualmente, piensa en ellos como tablas con una columna para embeddings (vectores) y una columna para metadatos.

Ejemplo

| Embedding      | Metadata |
| ----------- | ----------- |
| [-0.00015641732898075134, -0.003165106289088726, ...]      | {'date' : '1/2/23}       |
| [-0.00035465431654651654, 1.4654131651654516546, ...]   | {'date' : '1/3/23}        |

In [130]:
# Importar las clases necesarias
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings
import os

# Cargar el documento
if os.path.exists('data/PaulGrahamEssays/worked.txt'):
    loader = TextLoader('data/PaulGrahamEssays/worked.txt')
    documents = loader.load()
else:
    print("Archivo no encontrado. Usando texto de ejemplo.")
    from langchain_core.documents import Document
    documents = [Document(page_content="""Sample text for embeddings demonstration.
    This text will be used to create vector embeddings.
    Each piece of text gets converted into a numerical vector.
    These vectors capture the semantic meaning of the text.""")]

# Preparar tu divisor de texto
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=50)

# Dividir tus documentos en textos
texts = text_splitter.split_documents(documents)

# Preparar el motor de embeddings
embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)

Archivo no encontrado. Usando texto de ejemplo.


In [131]:
# Mostrar cu√°ntos documentos tenemos
print (f"You have {len(texts)} documents")

You have 1 documents


In [132]:
# Crear embeddings para cada documento
embedding_list = embeddings.embed_documents([text.page_content for text in texts])

In [133]:
# Mostrar informaci√≥n sobre los embeddings
print (f"You have {len(embedding_list)} embeddings")
print (f"Here's a sample of one: {embedding_list[0][:3]}...")

You have 1 embeddings
Here's a sample of one: [-0.02986394800245762, 0.0034656021744012833, 0.01732276752591133]...


Tu vectorstore almacena tus embeddings (‚òùÔ∏è) y los hace f√°cilmente buscables

## Memoria
Ayudar a los LLMs a recordar informaci√≥n.

La memoria es un t√©rmino un poco suelto. Podr√≠a ser tan simple como recordar informaci√≥n sobre la que has charlado en el pasado o recuperaci√≥n de informaci√≥n m√°s complicada.

Lo mantendremos hacia el caso de uso de Mensajes de Chat. Esto se usar√≠a para chatbots.

Hay muchos tipos de memoria, explora [la documentaci√≥n](https://python.langchain.com/en/latest/modules/memory/how_to_guides.html) para ver cu√°l se ajusta a tu caso de uso.

### Historial de Mensajes de Chat

In [134]:
# Importar las clases necesarias para trabajar con mensajes de chat
# NOTA: langchain.memory est√° deprecado, ahora usamos langchain_core.messages
from langchain_core.messages import HumanMessage, AIMessage
from langchain_openai import ChatOpenAI

# Crear instancia del modelo con temperature=0 (m√°s determinista)
chat = ChatOpenAI(temperature=0, openai_api_key=openai_api_key)

# Crear una lista simple para almacenar mensajes (reemplaza ChatMessageHistory deprecado)
messages = []

# Agregar un mensaje de la IA
messages.append(AIMessage(content="hi!"))

# Agregar un mensaje del usuario
messages.append(HumanMessage(content="what is the capital of france?"))

print("Mensajes iniciales creados")

Mensajes iniciales creados


In [135]:
# Ver los mensajes almacenados en la lista
messages

[AIMessage(content='hi!', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='what is the capital of france?', additional_kwargs={}, response_metadata={})]

In [136]:
# Obtener la respuesta de la IA usando los mensajes almacenados
ai_response = chat.invoke(messages)
ai_response

AIMessage(content='The capital of France is Paris.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 20, 'total_tokens': 27, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CfXUM123mKgDIxDh33HZTd2DG73f3', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--5aff2e15-8887-47b8-9f6d-c4cd82463d6b-0', usage_metadata={'input_tokens': 20, 'output_tokens': 7, 'total_tokens': 27, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [137]:
# Agregar la respuesta de la IA a la lista de mensajes
messages.append(ai_response)
# Ver los mensajes actualizados
messages

[AIMessage(content='hi!', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='what is the capital of france?', additional_kwargs={}, response_metadata={}),
 AIMessage(content='The capital of France is Paris.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 20, 'total_tokens': 27, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CfXUM123mKgDIxDh33HZTd2DG73f3', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--5aff2e15-8887-47b8-9f6d-c4cd82463d6b-0', usage_metadata={'input_tokens': 20, 'output_tokens': 7, 'total_tokens': 27, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 

## Cadenas ‚õìÔ∏è‚õìÔ∏è‚õìÔ∏è
Combinando diferentes llamadas LLM y acciones autom√°ticamente

Ej: Resumen #1, Resumen #2, Resumen #3 > Resumen Final

Consulta [este video](https://www.youtube.com/watch?v=f9_BWhCI4Zo&t=2s) explicando diferentes tipos de cadenas de resumen

Hay [muchas aplicaciones de cadenas](https://python.langchain.com/en/latest/modules/chains/how_to_guides.html) busca para ver cu√°les son mejores para tu caso de uso.

Cubriremos dos de ellas:

### 1. Cadenas Secuenciales Simples

Cadenas f√°ciles donde puedes usar la salida de un LLM como entrada en otro. Buenas para dividir tareas (y mantener tu LLM enfocado)

In [138]:
# Importar las clases necesarias para cadenas usando LCEL (moderno)
from langchain_openai import OpenAI
from langchain_core.prompts import PromptTemplate

# Crear instancia del modelo con temperature=1 (m√°s creativo)
llm = OpenAI(temperature=1, openai_api_key=openai_api_key)

In [139]:
# Template para la primera cadena: sugerir un plato t√≠pico basado en la ubicaci√≥n
template = """Your job is to come up with a classic dish from the area that the users suggests.
% USER LOCATION
{user_location}

YOUR RESPONSE:
"""
prompt_template = PromptTemplate(input_variables=["user_location"], template=template)

# Crear la cadena usando LCEL (LangChain Expression Language)
# El operador | encadena el prompt con el modelo
location_chain = prompt_template | llm

In [140]:
# Template para la segunda cadena: dar una receta para el plato
template = """Given a meal, give a short and simple recipe on how to make that dish at home.
% MEAL
{user_meal}

YOUR RESPONSE:
"""
prompt_template = PromptTemplate(input_variables=["user_meal"], template=template)

# Crear la cadena usando LCEL
meal_chain = prompt_template | llm

In [141]:
# Crear una cadena secuencial usando LCEL
# Primero ejecuta location_chain, luego pasa el resultado a meal_chain
# RunnablePassthrough permite pasar el resultado de una cadena a la siguiente
from langchain_core.runnables import RunnablePassthrough

# Crear una funci√≥n que toma la salida de location_chain y la formatea para meal_chain
def format_for_meal_chain(location_output):
    return {"user_meal": location_output}

# Encadenar: location_chain -> formatear -> meal_chain
overall_chain = (
    location_chain 
    | format_for_meal_chain 
    | meal_chain
)

print("Cadena secuencial creada usando LCEL (m√©todo moderno)")

Cadena secuencial creada usando LCEL (m√©todo moderno)


In [142]:
# Ejecutar la cadena completa con "Rome" como entrada
print("Ejecutando cadena con ubicaci√≥n: Rome")
print("-" * 50)

# Invocar la cadena con la ubicaci√≥n
review = overall_chain.invoke({"user_location": "Rome"})
print(review)

Ejecutando cadena con ubicaci√≥n: Rome
--------------------------------------------------
To make Spaghetti alla Carbonara at home, you will need: spaghetti, eggs, Parmesan cheese, bacon or pancetta, black pepper, and salt. Start by boiling the spaghetti in a pot of salted water until al dente, then drain and set aside. In a separate pan, cook the bacon or pancetta until crispy. Add the spaghetti to the pan and turn off the heat. In a bowl, whisk together eggs, Parmesan cheese, black pepper, and a pinch of salt. Pour the egg mixture over the spaghetti and toss until the pasta is coated evenly. The heat from the pasta will cook the eggs and create a creamy sauce. Serve hot with a sprinkle of Parmesan and extra black pepper on top. Buon appetito!


### 2. Cadena de Resumen

Ejecuta f√°cilmente a trav√©s de numerosos documentos largos y obt√©n un resumen. Consulta [este video](https://www.youtube.com/watch?v=f9_BWhCI4Zo) para otros tipos de cadenas adem√°s de map-reduce

In [143]:
# NOTA: load_summarize_chain puede estar deprecado
# Intentaremos usarlo pero si falla, usa m√©todos LCEL modernos

try:
    from langchain.chains.summarize import load_summarize_chain
    from langchain_community.document_loaders import TextLoader
    from langchain_text_splitters import RecursiveCharacterTextSplitter
    import os

    # Cargar un documento
    if os.path.exists('data/PaulGrahamEssays/disc.txt'):
        loader = TextLoader('data/PaulGrahamEssays/disc.txt')
        documents = loader.load()
    else:
        print("Archivo disc.txt no encontrado. Usando texto de ejemplo.")
        from langchain_core.documents import Document
        documents = [Document(page_content="""This is a longer text that will be summarized.
        The summarization chain takes multiple chunks of text and creates a concise summary.
        This is useful when you have very long documents and need to extract key information.
        The map-reduce approach processes each chunk and then combines the results.""" * 10)]

    # Preparar tu divisor de texto
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=700, chunk_overlap=50)

    # Dividir tus documentos en textos
    texts = text_splitter.split_documents(documents)

    # Crear cadena de resumen
    chain = load_summarize_chain(llm, chain_type="map_reduce", verbose=True)
    result = chain.run(texts)
    print(result)
except Exception as e:
    print(f"Error: {e}")
    print("La API de summarize chain puede estar deprecada. Usa m√©todos LCEL modernos en su lugar.")

Error: No module named 'langchain.chains'
La API de summarize chain puede estar deprecada. Usa m√©todos LCEL modernos en su lugar.


## Agentes ü§ñü§ñ

La Documentaci√≥n Oficial de LangChain describe a los agentes perfectamente (√©nfasis m√≠o):
> Algunas aplicaciones requerir√°n no solo una cadena predeterminada de llamadas a LLMs/otras herramientas, sino potencialmente una **cadena desconocida** que depende de la entrada del usuario. En estos tipos de cadenas, hay un "agente" que tiene acceso a un conjunto de herramientas. Dependiendo de la entrada del usuario, el agente puede entonces **decidir cu√°l, si alguna, de estas herramientas llamar**.


B√°sicamente usas el LLM no solo para salida de texto, sino tambi√©n para toma de decisiones. La genialidad y el poder de esta funcionalidad no pueden ser exagerados.

Sam Altman enfatiza que los LLMs son buenos '[motores de razonamiento](https://www.youtube.com/watch?v=L_Guz73e6fw&t=867s)'. Los agentes aprovechan esto.

### Agentes

El modelo de lenguaje que impulsa la toma de decisiones.

M√°s espec√≠ficamente, un agente toma una entrada y devuelve una respuesta correspondiente a una acci√≥n a tomar junto con una entrada de acci√≥n. Puedes ver diferentes tipos de agentes (que son mejores para diferentes casos de uso) [aqu√≠](https://python.langchain.com/en/latest/modules/agents/agents/agent_types.html).

### Herramientas

Una 'capacidad' de un agente. Esta es una abstracci√≥n encima de una funci√≥n que facilita a los LLMs (y agentes) interactuar con ella. Ej: b√∫squeda de Google.

Esta √°rea comparte similitudes con [plugins de OpenAI](https://platform.openai.com/docs/plugins/introduction).

### Toolkit

Grupos de herramientas de las que tu agente puede seleccionar

Junt√©moslos todos:

In [144]:
# NOTA: Las APIs de agentes (load_tools, initialize_agent) est√°n deprecadas
# El siguiente ejemplo muestra el patr√≥n moderno de agentes usando herramientas directamente

from langchain_openai import OpenAI
from langchain_openai import ChatOpenAI
import json
import os

# Crear instancia del modelo de chat (requerido para agentes modernos)
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0, openai_api_key=openai_api_key)

print("Modelo de chat inicializado para uso con agentes")

Modelo de chat inicializado para uso con agentes


In [145]:
# Obtener la clave API de SerpAPI desde las variables de entorno
# SerpAPI es un servicio de b√∫squeda que requiere una clave API
# Reg√≠strate en https://serpapi.com/ para obtener una clave gratuita
serpapi_api_key=os.getenv("SERP_API_KEY", "YourAPIKey")

if serpapi_api_key == "YourAPIKey":
    print("‚ö†Ô∏è ADVERTENCIA: No se encontr√≥ SERP_API_KEY en las variables de entorno")
    print("Para usar b√∫squedas web, reg√≠strate en https://serpapi.com/")
else:
    print("‚úì SERP_API_KEY configurada correctamente")

‚ö†Ô∏è ADVERTENCIA: No se encontr√≥ SERP_API_KEY en las variables de entorno
Para usar b√∫squedas web, reg√≠strate en https://serpapi.com/


In [146]:
# NOTA: load_tools est√° deprecado
# El patr√≥n moderno es crear herramientas directamente o usar langchain-community

try:
    from langchain_community.tools import SerpAPIWrapper
    from langchain_core.tools import Tool
    
    # Crear la herramienta de b√∫squeda
    search = SerpAPIWrapper(serpapi_api_key=serpapi_api_key)
    
    # Crear una herramienta usando el wrapper
    search_tool = Tool(
        name="Google Search",
        description="√ötil para buscar informaci√≥n actual en internet. Usa esto cuando necesites responder preguntas sobre eventos actuales o informaci√≥n espec√≠fica.",
        func=search.run,
    )
    
    toolkit = [search_tool]
    print("‚úì Herramienta de b√∫squeda creada exitosamente")
    
except Exception as e:
    print(f"‚ö†Ô∏è Error al crear herramienta de b√∫squeda: {e}")
    print("Continuando sin la herramienta de b√∫squeda...")
    toolkit = []

‚ö†Ô∏è Error al crear herramienta de b√∫squeda: cannot import name 'SerpAPIWrapper' from 'langchain_community.tools' (c:\Users\borja\anaconda3\envs\multiagente\Lib\site-packages\langchain_community\tools\__init__.py)
Continuando sin la herramienta de b√∫squeda...


In [147]:
# NOTA: initialize_agent est√° deprecado
# El patr√≥n moderno es usar create_react_agent o construir agentes con LangGraph

try:
    from langchain.agents import create_react_agent, AgentExecutor
    from langchain_core.prompts import PromptTemplate
    
    # Template para el agente ReAct (Reasoning + Acting)
    template = """Answer the following questions as best you can. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!

Question: {input}
Thought:{agent_scratchpad}"""

    prompt = PromptTemplate.from_template(template)
    
    # Crear el agente ReAct
    agent = create_react_agent(llm, toolkit, prompt)
    
    # Crear el executor del agente
    agent_executor = AgentExecutor(
        agent=agent, 
        tools=toolkit, 
        verbose=True,
        return_intermediate_steps=True,
        handle_parsing_errors=True
    )
    
    print("‚úì Agente ReAct creado exitosamente con patr√≥n moderno")
    
except Exception as e:
    print(f"‚ö†Ô∏è Error al crear agente: {e}")
    print("Las APIs de agentes pueden requerir instalaci√≥n adicional")
    print("Intenta: pip install langchain-community google-search-results")
    agent_executor = None

‚ö†Ô∏è Error al crear agente: cannot import name 'create_react_agent' from 'langchain.agents' (c:\Users\borja\anaconda3\envs\multiagente\Lib\site-packages\langchain\agents\__init__.py)
Las APIs de agentes pueden requerir instalaci√≥n adicional
Intenta: pip install langchain-community google-search-results


In [148]:
# Ejecutar el agente con una consulta compleja
# El agente decidir√° autom√°ticamente qu√© b√∫squedas hacer para responder

if agent_executor is not None:
    try:
        response = agent_executor.invoke({
            "input": "what was the first album of the band that Natalie Bergman is a part of?"
        })
        print("\n" + "="*50)
        print("RESPUESTA FINAL:")
        print("="*50)
        print(response.get('output', 'No se encontr√≥ respuesta'))
    except Exception as e:
        print(f"‚ö†Ô∏è Error al ejecutar agente: {e}")
        print("\nNOTA: Para usar agentes con b√∫squeda web necesitas:")
        print("1. Una clave API de SerpAPI (https://serpapi.com/)")
        print("2. Instalar: pip install google-search-results")
        print("3. Configurar SERP_API_KEY en tu archivo .env")
else:
    print("‚ö†Ô∏è El agente no est√° disponible. Verifica la celda anterior para m√°s detalles.")

‚ö†Ô∏è El agente no est√° disponible. Verifica la celda anterior para m√°s detalles.


![Wild Belle](data/WildBelle1.png)

üéµDisfrutaüéµ
https://open.spotify.com/track/1eREJIBdqeCcqNCB1pbz7w?si=c014293b63c7478c