# Introduccion a LangChain

<hr>

## ¿Que es LangChain?

LangChain es un framework emergente que permite a sus usuarios crear rapidamente aplicaciones y canales al rededor de 
modelos de lenguaje.

Puede ser utilizado para la creacion de chatbots, respuestas generativas de preguntas, resumenes y mucho mas.

La idea central de la biblioteca es que podemos "encadenar" distintos componentes para crear casos de uso mas avanzados entorno a modelos de lenguaje.

LangChain proporciona muchos módulos que se pueden usar para crear aplicaciones de modelos de lenguaje. Los módulos se pueden combinar para crear aplicaciones más complejas o se pueden usar individualmente para aplicaciones simples.

<hr>

## Instalacion
Para empezar debe instalar LangChain con el siguiente comando:

In [2]:
pip install langchain

Note: you may need to restart the kernel to use updated packages.


## Configuracion del entorno

Utilizar LangChain generalmente requerira integraciones con uno o mas proveedores de modelos, almacenes de datos, APIs, etc.

Para este ejemplo utilizaremos las APIs de OpenAI, para lo cual debemos instalar su SDK de la siguiente forma:

In [2]:
pip install openai

Note: you may need to restart the kernel to use updated packages.


Despues necesitamos proveer una clave de API de OpenAI para poder hacer uso del mismo.

Para conseguir una clave de API dirigase a: [OpenAI](https://openai.com/product)

Una vez contamos con una clave, procedemos a declararla como una variable de entorno:

In [3]:
import os

os.environ["OPENAI_API_KEY"] = "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"

## Utilizando LangChain para la construccion de modelos de lenguaje

LangChain proporciona varios modulos que se pueden utilizar para la creacion de aplicaciones de modelos de lenguaje. Los modulos se pueden combinar para crear aplicaciones mas complejas o se pueden usar individualmente para aplicaciones simples, entre ellos podemos destacar:

### Prompt Templates
En informática, un "prompt" o indicacion se refiere a una solicitud o mensaje que aparece en la pantalla de un dispositivo, solicitando al usuario que realice una acción o proporcione información.

Por ejemplo, un "prompt" de inicio de sesión solicita al usuario que proporcione su nombre de usuario y contraseña para acceder a una cuenta.

La nueva forma de programar modelos de lenguaje es a través de prompts. Un prompt se refiere a la entrada al modelo. Esta entrada rara vez está codificada de forma fija, sino que a menudo se construye a partir de múltiples componentes.

Un PromptTemplate es responsable de la construcción de esta entrada. LangChain proporciona varias clases y funciones para facilitar la construcción y el trabajo con "prompts".

### Indices

Los índices (Indexes) se refieren a formas de estructurar documentos para que los LLM puedan interactuar mejor con ellos.

### Cadenas

Utilizar LLMs de forma aislada es adecuado para ciertas aplicaciones simples, pero existen casos mas complejos donde se requiere encadenar LLMs, ya sea entre si o con otras herramientas, la union de estas mismas es denominada cadena (chain).


### Modelos

#### LLMs

Un Gran Modelo de Lenguaje (Large Lenguage Model, por sus siglas en inglés) es un tipo de algoritmo de IA que se entrena con grandes cantidades de datos de lenguaje natural para aprender a generar lenguaje coherente y similar al humano, los cuales utilizan técnicas avanzadas de aprendizaje automático(ML), como redes neuronales profundas, para analizar y comprender la estructura y los patrones del lenguaje, y para generar nuevo lenguaje en función de ese conocimiento.

Los LLM son capaces de realizar una amplia gama de tareas de procesamiento de lenguaje natural (NLP), incluyendo traducción de idiomas, análisis de sentimientos, resumen de texto, completado de texto y respuestas a preguntas, entre otros.

Uno de los ejemplos más conocidos de un LLM es la serie GPT (Generative Pre-trained Transformer) de OpenAI, pero asi como este existen otros ejemplos como ser:

- [BLOOM | BigScience](https://bigscience.huggingface.co/blog/bloom)
- [LaMDA | Google](https://blog.google/technology/ai/lamda/)
- [MT-NLG | Nvidia y Microsoft](https://developer.nvidia.com/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/)
- [LLaMA | Meta AI](https://ai.facebook.com/blog/large-language-model-llama-meta-ai/)


LangChain es compatible con varios proveedores de LLM, como Hugging Face y OpenAI.

Estos modelos toman una cadena de texto como entrada y devuelven una cadena de texto como salida.

#### Modelos de Chat

Un modelo de chat, también conocido como modelo conversacional o chatbot, es un modelo de IA que simula una conversación humana a través de interacciones basadas en texto o voz. Estos modelos utilizan técnicas de procesamiento de lenguaje natural (PLN) para entender las entradas de los usuarios y generar respuestas que sean contextualmente relevantes y coherentes.

Estos modelos suelen estar respaldados por un modelo de lenguaje, pero sus APIs están más estructuradas. Específicamente, estos modelos toman una lista de mensajes de chat como entrada y devuelven un mensaje de chat.

Entre los modelos de chat mas destacados podemos encontrar:

- [ChatGPT | OpenAI](https://openai.com/blog/chatgpt)
- [Bing Chat | Microsoft](https://www.bing.com/new)
- [Bard | Google](https://blog.google/technology/ai/bard-google-ai-search-updates/)


#### Modelos de Embedding de Texto

Un modelo de embedding (incrustacion por su traduccion al español) de texto es un modelo de IA utilizado para representar palabras o frases en una forma numérica que puede ser fácilmente procesada por algoritmos de aprendizaje automático. Este modelo asigna a cada palabra o frase un vector en un espacio de alta dimensión donde las palabras con significados similares están ubicadas cerca unas de otras.

Los modelos de embedding de texto se crean típicamente utilizando arquitecturas de redes neuronales como:

- [Word2Vec](https://www.coveo.com/blog/word2vec-explained/)
- [GloVe](https://medium.com/analytics-vidhya/word-vectorization-using-glove-76919685ee0b)

Estos modelos pueden ser entrenados con grandes cantidades de datos de texto para aprender las relaciones entre palabras y para identificar patrones y correlaciones en el texto.

Una vez entrenado, el modelo de embedding de texto puede ser utilizado para una variedad de tareas de procesamiento de lenguaje natural como análisis de sentimiento, clasificación de texto y traducción automática. Por ejemplo, en el análisis de sentimiento, el modelo tomaría un texto y lo convertiría en un vector, que luego se puede alimentar a un clasificador para predecir si el sentimiento del texto es positivo o negativo.

### Agentes

Los agentes usan LLM para decidir qué acciones se deben tomar, se pueden usar herramientas como búsqueda web o calculadoras, y todo se empaqueta en un ciclo lógico de operaciones.


### Memoria

Por defecto, las cadenas y los agentes no tienen estado, lo que significa que tratan cada consulta de forma independiente, en algunas aplicaciones (los chatbots son un GRAN ejemplo) es muy importante recordar las interacciones anteriores, tanto a corto como a largo plazo, el concepto de Memoria en LangChain existe precisamente para hacer eso.


<hr>

## Construyendo una Aplicacion de Modelo de Lenguaje: LLMs

Ahora que hemos instalado LangChain y configurado nuestro entorno, podemos comenzar a construir nuestra aplicación de modelo de lenguaje.

### LLMs: Obtener predicciones de un modelo de lenguaje

El bloque de construcción más básico de LangChain es llamar a un LLM en alguna entrada.

Para este ejemplo, pretendamos que estamos construyendo un servicio que genera nombres para ideas de negocio basado en lo que hace el mismo.

In [5]:
from langchain.llms import OpenAI

# Inicializamos el LLM
# En este ejemplo, probablemente queramos que las salidas sean MÁS aleatorias.
# para esto utilizamos el argumento temperature.
# nos permite controlar que tan deterministicas son las respuestas.
# donde 0 significa que son deterministicas y 1 totalmente aleatorias.

llm = OpenAI(temperature=0.9)

# Indicamos nuestra entrada
text = "Cual seria un buen nombre para una empresa que vende calcetines coloridos?"

# Llamamos al modelo pasando como argumento nuestra entrada
print(llm(text))



Calcetines Rainbow Joy.


### Prompt Templates: Administrar prompts para LLMs

Normalmente cuando utilizamos un LLM en una aplicacion, no enviamos la entrada del usuario directamente an LLM, sino que queremos tomar la entrada del usuario, construir un prompt adecuado y enviar eso al LLM.

En el ejemplo anterior, el texto de entrada estaba predeterminado para pedir el nombre de una empresa que fabricaba calcetines coloridos, lo que quisieramos hacer es solamente tomar la entrada del usuario sobre que hace la empresa y crear un prompt con esta informacion.

In [8]:
from langchain.prompts import PromptTemplate

# Instanciamos un PromptTemplate donde indicamos nuestra entrada predeterminada y las variables a cambiar
prompt = PromptTemplate(
    input_variables=["product"],
    template="Cual seria un buen nombre para una empresa que vende {product}"
)

print(prompt.format(product="panqueques esponjosos"))

Cual seria un buen nombre para una empresa que vende panqueques esponjosos


## Cadenas: Combinando LLMs y prompts 

Una cadena en LangChain esta compuesta por multiples componentes, que pueden ser primitivos como LLMs o otras cadenas.

El tipo de cadena mas basico es un LLMChain que consta de un PromptTemplate y un LLM.

Extendiendo el ejemplo anterior, podemos construir un LLMChain que toma la entrada del usuario, lo formatea con un PromptTemplate y luego pasa la respuesta formateada a un LLM.

In [13]:
from langchain.chains import LLMChain

chain = LLMChain(llm=llm, prompt=prompt)

# Ahora podemos correr nuestra cadena solamente especificando el producto deseado.
print(chain.run("Panqueques esponjosos"))

?

Fluffy Pancake Co.
