# Langchain 101: Modelos

En este tutorial te brindaré una visión general sobre los diferentes tipos de modelos que se utilizan en Langchain

## Introducción

Esta sección de la documentación trata de los diferentes tipos de modelos que se utilizan en LangChain. En esta página repasaremos los tipos de modelos en un nivel alto, pero tendremos artículos e hilos en Twitter individuales para cada tipo de modelo.

Uno de los principales valores de LangChain es que proporciona una interfaz estándar para los modelos. Esto permite intercambiar fácilmente entre modelos. A alto nivel, hay dos tipos principales de modelos:

- **Modelos lingüísticos**: buenos para la generación de texto

- **Modelos de incrustación de texto**: buenos para convertir texto en una representación numérica.

## Modelos lingüísticos

Existen dos subtipos diferentes de modelos lingüísticos:

- **LLMs**: envuelven APIs que reciben y devuelven texto.

- **ChatModels**: modelos que reciben mensajes de chat y devuelven un mensaje de chat.

Se trata de una diferencia sutil, pero un valor añadido de LangChain es que proporciona una interfaz unificada para todos ellos. Esto es bueno porque, aunque las API subyacentes son en realidad muy diferentes, a menudo se desea utilizarlas indistintamente.

Para ver esto, echemos un vistazo a OpenAI (un wrapper del LLM de OpenAI) vs ChatOpenAI (un wrapper alrededor del ChatModel de OpenAI).

In [1]:
from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI

In [2]:
llm = OpenAI()

In [3]:
chat_model = ChatOpenAI()

### Interfaz *Text to Text*

In [None]:
llm.predict("say hi!")

In [None]:
chat_model.predict("say hi!")

### Interfaz *Messages to Messages*

In [None]:
from langchain.schema import HumanMessage

In [None]:
llm.predict_messages([HumanMessage(content="say hi!")])

In [None]:
chat_model.predict_messages([HumanMessage(content="say hi!")])

## LLMS

Los grandes modelos lingüísticos (LLM) son un componente central de LangChain. LangChain no es un proveedor de LLMs, sino que proporciona una interfaz estándar a través de la cual se puede interactuar con una variedad de LLMs.

### Cómo empezar

En este artículo y en su respectivo cuaderno explicamos cómo utilizar la clase LLM en LangChain.

La clase LLM es una clase diseñada para interactuar con LLMs. Hay un montón de proveedores LLM (OpenAI, Cohere, Hugging Face, etc) - esta clase está diseñada para proporcionar una interfaz estándar para todos ellos. En esta parte de la documentación, nos centraremos en la funcionalidad genérica de los LLM.

Para este cuaderno, trabajaremos con un wrapper LLM de OpenAI, aunque las funcionalidades destacadas son genéricas para todos los tipos de LLM.

In [None]:
from langchain.llms import OpenAI

In [None]:
llm = OpenAI(model_name="text-ada-001", n=2, best_of=2)

**Generar Texto**: La funcionalidad más básica de un LLM es sólo la capacidad de llamarlo, pasando una cadena y obteniendo de vuelta una cadena.

In [None]:
llm("Tell me a joke")

**Generar**: En términos más generales, puedes llamarlo con una lista de inputs, obteniendo de vuelta una respuesta más completa que sólo el texto. Esta respuesta completa incluye cosas como múltiples respuestas principales, así como información específica del proveedor de LLM.

In [None]:
llm_result = llm.generate(["Tell me a joke", "Tell me a poem"]*15)

In [None]:
len(llm_result.generations)

In [None]:
llm_result.generations[0]

In [None]:
llm_result.generations[-1]

También puede acceder a la información específica del proveedor que se devuelve. Esta información NO está estandarizada entre proveedores.

In [None]:
llm_result.llm_output

**Número de tokens**: También puedes estimar cuántos tokens tendrá un trozo de texto en ese modelo. Esto es útil porque los modelos tienen una longitud de contexto (y cuestan más por más tokens), lo que significa que necesitas ser consciente de lo largo que es el texto que estás pasando.

Ten en cuenta que, por defecto, los tokens se estiman utilizando tiktoken (excepto para la versión heredada <3.8, donde se utiliza un tokenizador Hugging Face)

In [None]:
llm.get_num_tokens("what a joke")

### Funcionalidad general

Todos los ejemplos aquí expuestos abordan ciertas guías "prácticas" para trabajar con LLM.

>Todas las guías aquí mencionadas son en inglés, de la documentación oficial de Langchain.
>
>>Si veo apoyo en el contenido y ⭐ el repo de Github iré trayendo "How To's" en castellano

- [How to use the async API for LLMs](https://python.langchain.com/en/latest/modules/models/llms/examples/async_llm.html)
- [How to write a custom LLM wrapper](https://python.langchain.com/en/latest/modules/models/llms/examples/custom_llm.html)
- [How (and why) to use the fake LLM](https://python.langchain.com/en/latest/modules/models/llms/examples/fake_llm.html)
- [How (and why) to use the human input LLM](https://python.langchain.com/en/latest/modules/models/llms/examples/human_input_llm.html)
- [How to cache LLM calls](https://python.langchain.com/en/latest/modules/models/llms/examples/llm_caching.html)
- [How to serialize LLM classes](https://python.langchain.com/en/latest/modules/models/llms/examples/llm_serialization.html)
- [How to stream LLM and Chat Model responses](https://python.langchain.com/en/latest/modules/models/llms/examples/streaming_llm.html)
- [How to track token usage](https://python.langchain.com/en/latest/modules/models/llms/examples/token_usage_tracking.html)

### Integraciones

Los ejemplos que aquí se presentan son guías prácticas sobre cómo integrarse con distintos proveedores de LLM.

>Todas las guías aquí mencionadas son en inglés, de la documentación oficial de Langchain.

https://python.langchain.com/en/latest/modules/models/llms/integrations.html

___

## Chat Models

Los modelos de chat son una variación de los modelos lingüísticos. Aunque los modelos de chat utilizan modelos de lenguaje, la interfaz que exponen es un poco diferente. En lugar de exponer una API de "entrada de texto, salida de texto", exponen una interfaz en la que los "mensajes de chat" son las entradas y salidas.

Las API de los modelos de chat son bastante nuevas, por lo que aún estamos tratando de encontrar las abstracciones correctas.

### Cómo empezar

En este artículo y en su respectivo cuaderno explicamo cómo empezar con los modelos de chat. La interfaz se basa en mensajes y no en texto sin formato.

In [None]:
from langchain.chat_models import ChatOpenAI
from langchain import PromptTemplate, LLMChain
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    AIMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)

In [None]:
chat = ChatOpenAI(temperature=0)

Puedes obtener finalizaciones de chat pasando uno o más mensajes al modelo de chat. La respuesta será un mensaje. Los tipos de mensajes actualmente soportados en LangChain son `AIMessage`, `HumanMessage`, `SystemMessage`, y `ChatMessage` - `ChatMessage` toma un parámetro de rol arbitrario. La mayoría de las veces, sólo tendrás que tratar con `HumanMessage`, `AIMessage` y `SystemMessage`.

In [None]:
chat([HumanMessage(content="Translate this sentence from English to French. I love programming.")])

El modelo de chat de OpenAI soporta múltiples mensajes como input. Ver [aquí](https://platform.openai.com/docs/guides/gpt/chat-completions-vs-completions) para más información. 

He aquí un ejemplo de envío de un mensaje de sistema y de usuario al modelo de chat:

In [None]:
messages = [
    SystemMessage(content="You are a helpful assistant that translates English to French."),
    HumanMessage(content="I love programming.")
]
chat(messages)

Puedes ir un paso más allá y generar terminaciones para múltiples conjuntos de mensajes utilizando `generate`. Esto devuelve un `LLMResult` con un parámetro de `message` adicional.

In [None]:
batch_messages = [
    [
        SystemMessage(content="You are a helpful assistant that translates English to French."),
        HumanMessage(content="I love programming.")
    ],
    [
        SystemMessage(content="You are a helpful assistant that translates English to French."),
        HumanMessage(content="I love artificial intelligence.")
    ],
]
result = chat.generate(batch_messages)
result

### PromptTemplates

Puedes hacer uso de las plantillas utilizando un `MessagePromptTemplate`. Puedes construir un `ChatPromptTemplate` a partir de uno o más `MessagePromptTemplates`. Puedes utilizar el `format_prompt` de `ChatPromptTemplate` - esto devuelve un `PromptValue`, que puede convertir en una cadena o en un objeto Message, dependiendo de si desea utilizar el valor formateado como entrada a un modelo llm o chat.

Para mayor comodidad, existe un método `from_template` expuesto en la plantilla. Si utilizas esta plantilla, esto es lo que parecería

In [None]:
template="You are a helpful assistant that translates {input_language} to {output_language}."
system_message_prompt = SystemMessagePromptTemplate.from_template(template)
human_template="{text}"
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

In [None]:
chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt])

# obten una finalización de chat a partir de los mensajes formateados
chat(chat_prompt.format_prompt(input_language="English", output_language="French", text="I love programming.").to_messages())

Si quisieras construir el MessagePromptTemplate más directamente, podrías crear un PromptTemplate fuera y luego pasarlo, ej:

In [None]:
prompt=PromptTemplate(
    template="You are a helpful assistant that translates {input_language} to {output_language}.",
    input_variables=["input_language", "output_language"],
)
system_message_prompt = SystemMessagePromptTemplate(prompt=prompt)

### LLMChain

Puede utilizar la LLMChain existente de una forma muy similar a la anterior: proporcione un indicador y un modelo.

In [None]:
chain = LLMChain(llm=chat, prompt=chat_prompt)

In [None]:
chain.run(input_language="English", output_language="French", text="I love programming.")

### Streaming

`ChatOpenAI` soporta streaming a través del manejo de callbacks.

In [None]:
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
chat = ChatOpenAI(streaming=True, callbacks=[StreamingStdOutCallbackHandler()], temperature=0)
resp = chat([HumanMessage(content="Write me a song about sparkling water.")])

## Guías prácticas

Todos los ejemplos aquí expuestos abordan ciertas guías "prácticas" para trabajar con modelos de chat

>Todas las guías aquí mencionadas son en inglés, de la documentación oficial de Langchain.
>
>Si veo apoyo en el contenido y ⭐ el repo de Github iré trayendo "How To's" en castellano


- [How to use few shot examples](https://python.langchain.com/en/latest/modules/models/chat/examples/few_shot_examples.html)
- [How to stream responses](https://python.langchain.com/en/latest/modules/models/chat/examples/streaming.html)

## Integraciones

Todos estos ejemplos muestran cómo integrarse con distintos modelos de chat.

- [Anthropic](https://python.langchain.com/en/latest/modules/models/chat/integrations/anthropic.html)
- [Azure](https://python.langchain.com/en/latest/modules/models/chat/integrations/azure_chat_openai.html)
- [Google Vertex AI PaLM](https://python.langchain.com/en/latest/modules/models/chat/integrations/google_vertex_ai_palm.html)
- [OpenAI](https://python.langchain.com/en/latest/modules/models/chat/integrations/openai.html)
- [PromptLayer ChatOpenAI](https://python.langchain.com/en/latest/modules/models/chat/integrations/promptlayer_chatopenai.html)

___

## Modelos de incrustación de texto (Text Embedding Models)

Esta parte de la documentación oficial explica cómo utilizar la clase Embedding en LangChain.

La clase Embedding es una clase diseñada para interactuar con embeddings. Hay muchos proveedores de Embedding (OpenAI, Cohere, Hugging Face, etc) - esta clase está diseñada para proporcionar una interfaz estándar para todos ellos.

Las incrustaciones crean una representación vectorial de un fragmento de texto. Esto es útil porque significa que podemos pensar en el texto en el espacio vectorial, y hacer cosas como la búsqueda semántica donde buscamos piezas de texto que son más similares en el espacio vectorial.

La clase base Embedding en LangChain expone dos métodos: embed_documents y embed_query. La mayor diferencia es que estos dos métodos tienen interfaces diferentes: uno trabaja sobre múltiples documentos, mientras que el otro trabaja sobre un único documento. Además de esto, otra razón para tenerlos como dos métodos separados es que algunos proveedores de incrustación tienen diferentes métodos de incrustación para documentos (para ser buscados) vs consultas (la consulta de búsqueda en sí).

Existen las siguientes integraciones para incrustaciones de texto.

- [Aleph Alpha]()
- [Amazon Bedrock]()
- [Azure OpenAI]()
- [Cohere]()
- [Elasticsearch]()
- [Fake Embeddings]()
- [Google Vertex AI PaLM]()
- [Hugging Face Hub]()
- [HuggingFace Instruct]()
- [Jina]()
- [Llama-cpp]()
- [MiniMax]()
- [ModelScope]()
- [MosaicML]()
- [OpenAI]()
- [SageMaker Endpoint]()
- [Self Hosted Embeddings]()
- [Sentence Transformers]()
- [Tensorflow Hub]()

___

## Recursos adicionales

- [Documentación Langchain](https://python.langchain.com/en/latest/modules/models.html): https://python.langchain.com/en/latest/modules/models.html