<a href="https://colab.research.google.com/github/FernandoBRdgz/inteligencia_artificial/blob/main/grandes_modelos_de_lenguaje/llms_con_langchain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introducción a LangChain

LangChain es un marco para desarrollar aplicaciones impulsadas por modelos de lenguaje.

**Objetivos** Revisión de los siguientes conceptos:

- LLMs (Grandes modelos de lenguaje)
- Prompt Templates (Plantillas)
- Chains (Cadenas)
- Agents and Tools (Agentes y herramientas)
- Memory (Memoria)
- Document Loaders (Cargadores de documentos)
- Indexes (Índices)

### Instalación

In [None]:
!pip install langchain

## 1. LLMs

Una interfaz genérica para todos los LLM. Ver todos los proveedores de LLM: https://python.langchain.com/en/latest/modules/models/llms/integrations.html

In [None]:
!pip install openai

In [5]:
import os
import sys

In [8]:
path = '/content/drive/MyDrive/Colab Notebooks/Inteligencia Artificial/Grandes Modelos de Lenguaje'

In [3]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [9]:
sys.path.append(path)

In [10]:
from config import api_key_openai

In [11]:
os.environ["OPENAI_API_KEY"] = api_key_openai

In [12]:
from langchain.llms import OpenAI

llm = OpenAI(temperature=0.9)  # model_name="text-davinci-003"
text = "¿Cuál sería un buen nombre para una startup disruptiva que ofrece servicios basados en inteligencia artificial?"
print(llm(text))



BrainyTech.


In [13]:
#!pip install huggingface_hub

In [14]:
#os.environ["HUGGINGFACEHUB_API_TOKEN"] = api_key_hf

In [15]:
#from langchain import HuggingFaceHub

In [16]:
## https://huggingface.co/google/flan-t5-xl
#llm = HuggingFaceHub(repo_id="google/flan-t5-xl", model_kwargs={"temperature":0, "max_length":64})

#llm("translate English to German: How old are you?")

## 2. Prompt Templates

LangChain facilita la gestión y la rápida optimización.

Normalmente, cuando usa un LLM en una aplicación, no está enviando la entrada del usuario directamente al LLM. En su lugar, debe tomar la entrada del usuario y construir un aviso, y solo luego enviarlo al LLM.

In [17]:
llm("¿Puede Andrés Manuel López Obrador tener una conversación con Porfirio Díaz?")

'\n\nNo, esto es imposible, ya que Porfirio Díaz murió en 1915.'

In [18]:
prompt = """Question: ¿Puede Andrés Manuel López Obrador tener una conversación con Porfirio Díaz?

Pensemos paso a paso.

Respuesta: """
llm(prompt)

'\nNo, no es posible que Andrés Manuel López Obrador tenga una conversación con Porfirio Díaz, ya que Porfirio Díaz murió en 1915.'

In [19]:
from langchain import PromptTemplate

template = """Pregunta: {pregunta}

Pensemos paso a paso.

Respuesta: """

prompt = PromptTemplate(template=template, input_variables=["pregunta"])

In [23]:
prompt.format(pregunta="¿Puede Andrés Manuel López Obrador tener una conversación con Porfirio Díaz?")

'Pregunta: ¿Puede Andrés Manuel López Obrador tener una conversación con Porfirio Díaz?\n\nPensemos paso a paso.\n\nRespuesta: '

In [26]:
try:
    llm(prompt)
except Exception as e:
    print("Requerimos de una cadena 'Chain'")

Requerimos de una cadena 'Chain'


## 3. Chains

Combina LLM y prompts en flujos de trabajo de varios pasos.

In [27]:
from langchain import LLMChain

llm_chain = LLMChain(prompt=prompt, llm=llm)

question = "¿Puede Andrés Manuel López Obrador tener una conversación con Porfirio Díaz?"

print(llm_chain.run(question))


No, esto no es posible dado que Porfirio Díaz fue el Presidente de México desde 1876 hasta 1911 y Andrés Manuel López Obrador es el Presidente actual de México. Por lo tanto, no hay una forma realista en que ellos puedan tener una conversación.


## 4. Agentes y Herramientas

Los agentes involucran a un LLM que toma decisiones sobre qué acciones tomar, tomar esa acción, ver una observación y repetirla hasta que se termine.


Cuando se usan correctamente, los agentes pueden ser extremadamente poderosos. Para cargar agentes, debe comprender los siguientes conceptos:

- Herramienta: Una función que realiza un deber específico. Esto puede ser cosas como: búsqueda de Google, búsqueda de base de datos, Python REPL, otras cadenas.
- LLM: El modelo de lenguaje que impulsa al agente.
- Agente: El agente a utilizar.

Herramientas: https://python.langchain.com/en/latest/modules/agents/tools.html

Tipoes de Agentes: https://python.langchain.com/en/latest/modules/agents/agents/agent_types.html

In [28]:
from langchain.agents import load_tools
from langchain.agents import initialize_agent

In [None]:
!pip install wikipedia

In [30]:
from langchain.llms import OpenAI

In [31]:
llm = OpenAI(temperature=0)
tools = load_tools(["wikipedia", "llm-math"], llm=llm)

In [32]:
agent = initialize_agent(tools, llm, agent="zero-shot-react-description", verbose=True)

In [35]:
agent.run("¿En qué año se estrenó la película Inception con Leonardo Dicaprio? ¿Cuál sería este año elevado a la potencia 0,43?")



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m I need to find out the year the movie was released and then use the calculator to calculate the power.
Action: Wikipedia
Action Input: Inception (2010 film)[0m
Observation: [36;1m[1;3mPage: Inception
Summary: Inception is a 2010 science fiction action film written and directed by Christopher Nolan, who also produced the film with Emma Thomas, his wife. The film stars Leonardo DiCaprio as a professional thief who steals information by infiltrating the subconscious of his targets. He is offered a chance to have his criminal history erased as payment for the implantation of another person's idea into a target's subconscious. The ensemble cast includes Ken Watanabe, Joseph Gordon-Levitt, Marion Cotillard, Elliot Page, Tom Hardy, Dileep Rao, Cillian Murphy, Tom Berenger, and Michael Caine.
After the 2002 completion of Insomnia, Nolan presented to Warner Bros. a written 80-page treatment for a horror film envisioning "dream ste

'El año 2010 elevado a la potencia 0,43 es 26.3253591394933.'

## 5. Memoria

Agregar Estado a Cadenas y Agentes.

La memoria es el concepto de estado persistente entre llamadas de una cadena/agente. LangChain proporciona una interfaz estándar para la memoria, una colección de implementaciones de memoria y ejemplos de cadenas/agentes que usan memoria.

In [None]:
from langchain import OpenAI, ConversationChain

In [36]:
llm = OpenAI(temperature=0)
conversation = ConversationChain(llm=llm, verbose=True)

conversation.predict(input="Hola!")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Hola!
AI:[0m

[1m> Finished chain.[0m


' Hola! ¿Cómo estás? Me llamo AI. ¿Cómo te llamas?'

In [37]:
conversation.predict(input="¿Podemos hablar de IA?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Hola!
AI:  Hola! ¿Cómo estás? Me llamo AI. ¿Cómo te llamas?
Human: ¿Podemos hablar de IA?
AI:[0m

[1m> Finished chain.[0m


' ¡Claro! ¿Qué quieres saber sobre Inteligencia Artificial?'

In [38]:
conversation.predict(input="Estoy interesado en la inteligencia artificial general")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Hola!
AI:  Hola! ¿Cómo estás? Me llamo AI. ¿Cómo te llamas?
Human: ¿Podemos hablar de IA?
AI:  ¡Claro! ¿Qué quieres saber sobre Inteligencia Artificial?
Human: Estoy interesado en la inteligencia artificial general
AI:[0m

[1m> Finished chain.[0m


' La Inteligencia Artificial General se refiere a la creación de sistemas informáticos que pueden realizar tareas inteligentes sin necesidad de programación específica. Estos sistemas pueden aprender, planificar, razonar, entender el lenguaje y tomar decisiones.'

## 6. Cargadores de documentos

La combinación de modelos de lenguaje con sus propios datos de texto es una forma poderosa de diferenciarlos. El primer paso para hacer esto es cargar los datos en "documentos", una forma elegante de decir algunos fragmentos de texto. Este módulo tiene como objetivo hacer esto fácil.

https://python.langchain.com/en/latest/modules/indexes/document_loaders.html

In [39]:
from langchain.document_loaders import NotionDirectoryLoader

In [40]:
loader = NotionDirectoryLoader("Notion_DB")
docs = loader.load()

## 7. Índices

Los índices se refieren a formas de estructurar documentos para que los LLM puedan interactuar mejor con ellos. Este módulo contiene funciones de utilidad para trabajar con documentos.

- Incrustaciones: Una incrustación es una representación numérica de una información, por ejemplo, texto, documentos, imágenes, audio, etc.
- Divisores de texto: Cuando desee manejar fragmentos largos de texto, es necesario dividir ese texto en fragmentos.
- Almacenes de vectores: Las bases de datos vectoriales almacenan e indexan incrustaciones de vectores de modelos NLP para comprender el significado y el contexto de cadenas de texto, oraciones y documentos completos para obtener resultados de búsqueda más precisos y relevantes.

In [42]:
import requests

url = "https://raw.githubusercontent.com/hwchase17/langchain/master/docs/modules/state_of_the_union.txt"
res = requests.get(url)
with open("state_of_the_union.txt", "w") as f:
    f.write(res.text)

In [43]:
from langchain.document_loaders import TextLoader

In [44]:
loader = TextLoader('./state_of_the_union.txt')
documents = loader.load()

In [45]:
from langchain.text_splitter import CharacterTextSplitter

In [46]:
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

In [None]:
!pip install sentence_transformers

In [48]:
from langchain.embeddings import HuggingFaceEmbeddings

In [None]:
embeddings = HuggingFaceEmbeddings()

#text = "This is a test document."
#query_result = embeddings.embed_query(text)
#doc_result = embeddings.embed_documents([text])

In [None]:
!pip install faiss-cpu

In [51]:
# Almacen de vectores: https://python.langchain.com/en/latest/modules/indexes/vectorstores.html
from langchain.vectorstores import FAISS

In [52]:
db = FAISS.from_documents(docs, embeddings)

query = "What did the president say about Ketanji Brown Jackson"
docs = db.similarity_search(query)

In [53]:
print(docs[0].page_content)

Tonight. I call on the Senate to: Pass the Freedom to Vote Act. Pass the John Lewis Voting Rights Act. And while you’re at it, pass the Disclose Act so Americans can know who is funding our elections. 

Tonight, I’d like to honor someone who has dedicated his life to serve this country: Justice Stephen Breyer—an Army veteran, Constitutional scholar, and retiring Justice of the United States Supreme Court. Justice Breyer, thank you for your service. 

One of the most serious constitutional responsibilities a President has is nominating someone to serve on the United States Supreme Court. 

And I did that 4 days ago, when I nominated Circuit Court of Appeals Judge Ketanji Brown Jackson. One of our nation’s top legal minds, who will continue Justice Breyer’s legacy of excellence.


In [54]:
db.save_local("faiss_index")
new_db = FAISS.load_local("faiss_index", embeddings)
docs = new_db.similarity_search(query)
print(docs[0].page_content)

Tonight. I call on the Senate to: Pass the Freedom to Vote Act. Pass the John Lewis Voting Rights Act. And while you’re at it, pass the Disclose Act so Americans can know who is funding our elections. 

Tonight, I’d like to honor someone who has dedicated his life to serve this country: Justice Stephen Breyer—an Army veteran, Constitutional scholar, and retiring Justice of the United States Supreme Court. Justice Breyer, thank you for your service. 

One of the most serious constitutional responsibilities a President has is nominating someone to serve on the United States Supreme Court. 

And I did that 4 days ago, when I nominated Circuit Court of Appeals Judge Ketanji Brown Jackson. One of our nation’s top legal minds, who will continue Justice Breyer’s legacy of excellence.


**Por hacer**

* Contrastar ejemplos con modelo flan-t5-xl
* Profundizar en el tema de Cargadores de Documentos
* Probar el último ejemplo con alguna lectura en español

**Referencias**

* https://github.com/hwchase17/langchain
* https://python.langchain.com/en/latest/index.html
