**Variables de entorno**

In [1]:
import dotenv
import sys
import os
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
import openai
openai.api_type = os.environ["OPENAI_API_TYPE"]
openai.api_version = os.environ["OPENAI_API_VERSION"]
openai.api_base = os.environ["OPENAI_API_BASE"]
openai.api_key = os.environ["OPENAI_API_KEY"]

## **LLMs**

El componente fundamental de LangChain implica invocar un LLM con un input específico.

In [12]:
from langchain.llms import OpenAI

El parámetro de temperatura en los modelos OpenAI gestiona la aleatoriedad de la salida. Cuando se ajusta a 0, la salida está predeterminada en su mayor parte y es adecuada para tareas que requieren estabilidad y el resultado más probable. Con un valor de 1,0, el resultado puede ser incoherente e interesante, pero no es aconsejable para la mayoría de las tareas. Para tareas creativas, una temperatura entre 0,70 y 0,90 ofrece un equilibrio entre fiabilidad y creatividad. El mejor ajuste debe determinarse experimentando con diferentes valores para cada caso de uso específico. El código inicializa la variante Davinci del modelo GPT-3.

In [15]:
llm = OpenAI(
    engine="text-davinci-003",
    temperature=0.5
)

                    engine was transferred to model_kwargs.
                    Please confirm that engine is what you intended.


In [16]:
text_input = """Sugiere una ruta de aprendizaje personalizada para alguien
que busca aprender IA y especializarse en LLMs
"""
print(llm(text_input))


1. Empieza con una comprensión general de la Inteligencia Artificial (IA). Esto incluye aprender sobre los algoritmos básicos de IA, como los algoritmos de aprendizaje profundo, redes neuronales y máquinas de soporte vectorial.

2. Familiarícese con los conceptos de aprendizaje automático (ML), como regresión lineal, árboles de decisión, regresión logística y clustering.

3. Profundiza en los conceptos de redes neuronales profundas (DNNs), como arquitecturas de redes neuronales, convolucionales y recurrentes.

4. Aprende sobre los diferentes tipos de aprendizaje profundo, como el aprendizaje profundo supervisado, no supervisado y reforzado.

5. Aprende sobre los diferentes tipos de modelos de aprendizaje profundo, como redes


## **The Chains**

En LangChain, una cadena es un wrapper de extremo a extremo alrededor de múltiples componentes individuales, proporcionando una forma de lograr un caso de uso común mediante la combinación de estos componentes en una secuencia específica. El tipo de cadena más utilizado es LLMChain, que consiste en un PromptTemplate, un modelo (ya sea un LLM o un ChatModel) y un analizador de salida opcional.

La LLMChain funciona de la siguiente forma:

- Recibe múltiples variables de entrada.
- Utiliza un PromptTemplate para darle formato a las variables de entrada en un prompt específico.
- Pasa el prompt formateado al modelo de lenguaje (LLM o ChatModel)
- Si se proporciona un analizador de salida, se usa el OutputParser para analizar la salida del LLM en un formato final.

In [24]:
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chains import LLMChain

llm = OpenAI(
    engine="text-davinci-003",
    temperature=0.85)

prompt = PromptTemplate(
    input_variables=["action"],
    template="""Cuál es un buen nombre para un modelo de lenguaje 
            que hace {action}"""
)
chain = LLMChain(llm=llm, prompt=prompt) # Instanciamos la chain
print(f"El nombre sería: {chain.run('código en Python')}")

                    engine was transferred to model_kwargs.
                    Please confirm that engine is what you intended.


El nombre sería: ?

Pythonic Code Generator.


## **Memory**

En LangChain, la memoria se refiere a la funcionalidad que almacena y gestiona el historial de conversaciones entre un usuario y la IA. Ayuda a mantener el contexto y la coherencia a lo largo de la interacción, permitiendo a la IA generar respuestas más relevantes y precisas. La memoria, como la clase ConversationBufferMemory, actúa como un wrapper alrededor de ChatMessageHistory, extrayendo los mensajes y proporcionándolos a la cadena (Chain) para una mejor generación consciente del contexto.

In [26]:
from langchain.llms import OpenAI
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory

llm = OpenAI(
    engine="text-davinci-003",
    temperature=0
)
conversation = ConversationChain(
    llm=llm,
    verbose=True,
    memory=ConversationBufferMemory()
)
# Comenzamos la conversación
conversation.predict(input="Hablame sobre IA generativa.")

# Continuamos la conversación
conversation.predict(input="Puedes generar codigo?")
conversation.predict(input="Podrias ayudarme a construir una IA?")

# Veamos la conversación
conversation

                    engine was transferred to model_kwargs.
                    Please confirm that engine is what you intended.




[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Hablame sobre IA generativa.
AI:[0m

[1m> Finished chain.[0m


[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Hablame sobre IA generativa.
AI:  Generative AI es una forma de inteligencia artificial que se centra en la creación de contenido nuevo y original. Esto se logra mediante el uso de algoritmos de aprendizaje profundo para generar contenido que se asemeja a contenido c

ConversationChain(memory=ConversationBufferMemory(chat_memory=ChatMessageHistory(messages=[HumanMessage(content='Hablame sobre IA generativa.', additional_kwargs={}, example=False), AIMessage(content=' Generative AI es una forma de inteligencia artificial que se centra en la creación de contenido nuevo y original. Esto se logra mediante el uso de algoritmos de aprendizaje profundo para generar contenido que se asemeja a contenido creado por humanos. Esto se puede aplicar a muchas áreas, como la creación de imágenes, música, texto y videos.', additional_kwargs={}, example=False), HumanMessage(content='Puedes generar codigo?', additional_kwargs={}, example=False), AIMessage(content=' Sí, la IA generativa también se puede usar para generar código. Esto se logra mediante el uso de algoritmos de aprendizaje profundo para generar código que se asemeja al código creado por humanos. Esto se puede aplicar a muchas áreas, como la creación de aplicaciones web, aplicaciones móviles y software de e

### **Deep Lake VectorStore**

Deep Lake proporciona almacenamiento para embeddings y sus metadatos correspondientes en el contexto de aplicaciones LLM. Permite realizar búsquedas híbridas en estos embeddings y sus atributos para una recuperación eficaz de los datos. También se integra con LangChain, facilitando el desarrollo y despliegue de aplicaciones.

Deep Lake ofrece varias ventajas sobre el típico almacén vectorial:

- Es multimodal, lo que significa que puede utilizarse para almacenar elementos de diversas modalidades, como textos, imágenes, audio y vídeo, junto con sus representaciones vectoriales. 
- Es serverless, lo que significa que podemos crear y gestionar conjuntos de datos en la nube sin necesidad de crear y gestionar una instancia de base de datos. Este aspecto aporta una gran aceleración a los nuevos proyectos.
- Por último, es posible crear fácilmente un cargador de datos a partir de los datos cargados en un conjunto de datos de Deep Lake. Resulta práctico para ajustar modelos de aprendizaje automático utilizando frameworks populares como PyTorch y TensorFlow.

In [29]:
import os
os.environ["ACTIVELOOP_TOKEN"] = "eyJhbGciOiJIUzUxMiIsImlhdCI6MTY4OTk1MDE5MiwiZXhwIjoxNjkwMTIyOTU4fQ.eyJpZCI6ImpwYWd1aWxhcmM5OSJ9.n8wkzYiJ_nI64A5NTfQBVnJd-n9UK6Cd-WheCXeQ_ECFs_eNdXOfZzLPQYjJ84o8T2CeSLJoRjA8m7Tp7EqfsA"

Instalación deeplake:

In [None]:
#!pip install deeplake

**Dotamos al LLM de información externa a su conocimiento y utilizamos embeddings para calcular documentos similares**

In [35]:
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import DeepLake
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA

# Antes de ejecutar el siguiente código, asegúrese de tener su
# clave de Activeloop guardada en la variable de entorno "ACTIVELOOP_TOKEN".

# Instanciamos el LLM y el modelo de embeddings (text-embedding-ada-002 de OpenAI)
llm = OpenAI(
    engine="text-davinci-003",
    temperature=0
)
embeddings = OpenAIEmbeddings() # model="text-embedding-ada-002"

# Creamos documentos dummies para hacer nuestra base de conocimientos
texts = [
    "La Hackathon de LLMs de Bancolombia es un evento para impulsar el desarrollo de aplicaciones con LLMs",
    "Los equipos de la Hackathon de LLMs son conformados por máximo 4 personas y se asignará un reto"
]
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.create_documents(texts)

# Creamos el Deep Lake dataset
# Debemos insertar id organization (username de deeplake por default)
my_activeloop_org_id = "jpaguilarc99"
my_activeloop_dataset_name = "langchain_hackathon_llm_example"
dataset_path = f"hub://{my_activeloop_org_id}/{my_activeloop_dataset_name}"
db = DeepLake(dataset_path=dataset_path, embedding_function=embeddings)

# Agregamos nuestros documentos (texts) en forma de embeddings al dataset de DeepLake
db.add_documents(docs)

                    engine was transferred to model_kwargs.
                    Please confirm that engine is what you intended.


Deep Lake Dataset in hub://jpaguilarc99/langchain_hackathon_llm_example already exists, loading from the storage


|

Dataset(path='hub://jpaguilarc99/langchain_hackathon_llm_example', tensors=['embedding', 'id', 'metadata', 'text'])

  tensor      htype      shape     dtype  compression
  -------    -------    -------   -------  ------- 
 embedding  embedding  (4, 1536)  float32   None   
    id        text      (4, 1)      str     None   
 metadata     json      (4, 1)      str     None   
   text       text      (4, 1)      str     None   


 

['7ddde2d7-28cb-11ee-b8f9-fc3497bf337a',
 '7ddde2d8-28cb-11ee-9aea-fc3497bf337a']

RetrievalQA chain:

In [37]:
retrieval_qa = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever()
)

Agente que utiliza a RetrievalQA chain como una herramienta:

In [38]:
from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType

tools = [
    Tool(
        name="Retrieval QA System",
        func=retrieval_qa.run,
        description="Useful for answering questions."
    ),
]

agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

response = agent.run("Qué es la Hackathon de LLMs?")
print(response)



[1m> Entering new  chain...[0m
[32;1m[1;3m I need to find out what a Hackathon de LLMs is.
Action: Retrieval QA System
Action Input: What is a Hackathon de LLMs?[0m
Observation: [36;1m[1;3m A Hackathon de LLMs is an event to promote the development of applications using large language models (LLMs). Teams of up to four people are assigned a challenge and use AI generative technology to create original and realistic content such as text, images, music, or video.[0m
Thought:[32;1m[1;3m I now know the final answer
Final Answer: A Hackathon de LLMs is an event to promote the development of applications using large language models (LLMs). Teams of up to four people are assigned a challenge and use AI generative technology to create original and realistic content such as text, images, music, or video.[0m

[1m> Finished chain.[0m
A Hackathon de LLMs is an event to promote the development of applications using large language models (LLMs). Teams of up to four people are assigned

Aquí, el agente ha utilizado la herramienta "Retrieval QA System" con la consulta "¿Qué es la Hackathon de LLMs?", que se ejecuta en nuestro nuevo conjunto de datos Deep Lake, devolviendo el documento más similar (es decir, el documento que contiene la definición de la Hackathon de LLMs). Este documento se utiliza finalmente para generar el resultado final.

Primero recargamos un vector store existente de Deep Lake que se encuentra en una ruta de conjunto de datos especificada. A continuación, cargamos los nuevos datos textuales y los dividimos en fragmentos o chunks. Por último, añadimos estos fragmentos al conjunto de datos existente, creando y almacenando los embeddings correspondientes para cada segmento de texto añadido:

In [39]:
# Cargamos el dataset existente de Deep Lake e instanciamos el modelo de embeddings
db = DeepLake(
    dataset_path=dataset_path,
    embedding_function=embeddings
)

# Creamos nuevos documentos
texts = [
    "Mi gata es naranja y se llama La Gorda",
    "Sebastian nació en los años 80"
]
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.create_documents(texts)

# Agregamos los documentos al dataset de DeepLake
db.add_documents(docs)

Deep Lake Dataset in hub://jpaguilarc99/langchain_hackathon_llm_example already exists, loading from the storage


/

Dataset(path='hub://jpaguilarc99/langchain_hackathon_llm_example', tensors=['embedding', 'id', 'metadata', 'text'])

  tensor      htype      shape     dtype  compression
  -------    -------    -------   -------  ------- 
 embedding  embedding  (6, 1536)  float32   None   
    id        text      (6, 1)      str     None   
 metadata     json      (6, 1)      str     None   
   text       text      (6, 1)      str     None   


 

['6cb7d3a3-28cc-11ee-9092-fc3497bf337a',
 '6cb7d3a4-28cc-11ee-bdca-fc3497bf337a']

Volvemos a crear el Agent y preguntamos algo que solo se puede responder con los últimos documentos añadidos.

In [41]:
# Instanciamos el LLM
llm = OpenAI(engine="text-davinci-003", temperature=0)

# Creamos el Document Retriever
retrieval_qa = RetrievalQA.from_chain_type(
	llm=llm, chain_type="stuff", retriever=db.as_retriever()
)

# Instanciamos las tools para que use el retriever
tools = [
    Tool(
        name="Retrieval QA System",
        func=retrieval_qa.run,
        description="Useful for answering questions."
    ),
]

# Creamos el agente que utiliza las Tools
agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True
)

response = agent.run("Cómo se llama la gata naranja?")
print(response)

                    engine was transferred to model_kwargs.
                    Please confirm that engine is what you intended.




[1m> Entering new  chain...[0m
[32;1m[1;3m I need to find out the name of the orange cat.
Action: Retrieval QA System
Action Input: What is the name of the orange cat?[0m
Observation: [36;1m[1;3m La Gorda[0m
Thought:[32;1m[1;3m I now know the final answer
Final Answer: La Gorda[0m

[1m> Finished chain.[0m
La Gorda


El LLM recupera con éxito información precisa utilizando Deep Lake como Vector Storage y el modelo de lenguaje de OpenAI.

## **Agentes en LangChain**

En LangChain, los agentes son componentes de alto nivel que utilizan modelos de lenguaje (LLMs) para determinar qué acciones realizar y en qué orden. Una acción puede ser utilizar una herramienta y observar su resultado o devolvérselo al usuario. Las herramientas (tools) son funciones que realizan tareas específicas, como Google Search, búsquedas en bases de datos o Python REPL.

Los Agentes implican que un LLM tome decisiones sobre qué Acciones realizar, realice esa Acción, vea una Observación y repita eso hasta que termine.

Muchos tipos de agentes están disponibles en LangChain:

- El agente "zero-shot-react-description" utiliza el marco ReAct para decidir qué herramienta emplear basándose únicamente en la descripción de la misma. Necesita una descripción de cada herramienta.
- El agente "react-docstore" se relaciona con un docstore a través del marco ReAct. Necesita dos herramientas: una de búsqueda y otra de consulta. La herramienta de búsqueda encuentra un documento y la herramienta de búsqueda busca un término en el último documento encontrado.
- El agente de "self-ask-with-search" emplea una única herramienta denominada Respuesta intermedia, que es capaz de buscar respuestas factuales a las consultas. Es idéntica a la autopregunta original con el agente de búsqueda, en la que se proporcionaba como herramienta una API de búsqueda de Google.
- El agente "conversational-react-description" está diseñado para situaciones conversacionales. Utiliza el marco ReAct para seleccionar una herramienta y emplea la memoria para recordar interacciones conversacionales anteriores.

Para el siguiente ejemplo de Google Search se necesitarán los tokens de Google: “GOOGLE_API_KEY” y “GOOGLE_CSE_ID”

In [None]:
from langchain.llms import OpenAI

from langchain.agents import AgentType
from langchain.agents import load_tools
from langchain.agents import initialize_agent

from langchain.agents import Tool
from langchain.utilities import GoogleSearchAPIWrapper

llm = OpenAI(model="text-davinci-003", temperature=0)

# Dotamos el LLM de acceso al buscador de Google
search = GoogleSearchAPIWrapper()

# Creamos la Tool
tools = [
    Tool(
        name = "google-search",
        func=search.run,
        description="useful for when you need to search google to answer questions about current events"
    )
]

# Creamos el agente
agent = initialize_agent(tools, 
                         llm, 
                         agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, 
                         verbose=True,
                         max_iterations=6)

response = agent("What's the latest news about the Mars rover?")
print(response['output'])

## **Tools en LangChain**

LangChain proporciona una variedad de herramientas para que los agentes interactúen con el mundo exterior. Estas herramientas se pueden utilizar para crear agentes personalizados que realicen diversas tareas, como buscar en la web, responder preguntas o ejecutar código Python. En esta sección, discutiremos los diferentes tipos de herramientas disponibles en LangChain y proporcionaremos ejemplos de su creación y uso.

En nuestro ejemplo, dos herramientas están siendo definidas para su uso dentro de un agente LangChain: una herramienta de Búsqueda de Google y una herramienta de Modelo de Lenguaje que actúa específicamente como un resumidor de texto. La herramienta de búsqueda de Google, que utiliza el GoogleSearchAPIWrapper, gestionará las consultas que impliquen la búsqueda de información sobre eventos recientes. La herramienta de modelo de lenguaje aprovecha las capacidades de un LLM para resumir textos. Estas herramientas están diseñadas para ser utilizadas indistintamente por el agente, dependiendo de la naturaleza de la consulta del usuario.

In [None]:
from langchain.llms import OpenAI
from langchain.agents import Tool
from langchain.utilities import GoogleSearchAPIWrapper
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.agents import initialize_agent, AgentType

llm = OpenAI(engine="text-davinci-003", temperature=0)

prompt = PromptTemplate(
    input_variables=["query"],
    template="Escribe un resumen para el siguiente texto: {query}"
)
summarize_chain = LLMChain(llm=llm, prompt=prompt)

tools = [
    Tool(
        name="Search",
        func=search.run,
        description="useful for finding information about recent events"
    ),
    Tool(
       name='Summarizer',
       func=summarize_chain.run,
       description='useful for summarizing texts'
    ),
]

agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True  
)

response = agent("¿Cuáles son las últimas noticias sobre el explorador de Marte? A continuación, resuma los resultados.")
print(response['output'])