Existen diferentes modelos:

***LLMs***

Large Language Models (LLMs) Obtienen una cadena de texto como input y luego regresan una cadena de texto como output

***Chat Models***

Estos modelos generalmente cuentan con el respaldo de un modelo de lenguaje, pero sus API están más estructuradas. Específicamente, estos modelos toman una lista de mensajes de chat como entrada y devuelven un mensaje de chat como resultado.

***Text Embedding Models*** (modelo de inserción de texto)

Estos modelos toman texto como entrada y devuelven una lista de números decimales.

LangChain proporciona una interfaz estándar para los modelos. Esto permite cambiar fácilmente entre modelos. Por ejemplo OpenAi (un envoltorio para el modelo de lenguaje de OpenAI) y ChatOpenAI (un envoltorio para el modelo de chat de OpenAI):

In [1]:
from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI

llm = OpenAI() # type: ignore
chat_model = ChatOpenAI() # type: ignore

`text` -> `text` interface

In [2]:
llm.predict("say hi!")

'\n\nHi there!'

In [3]:
chat_model.predict("say hi!")

'Hi there! How can I assist you today?'

`messages` -> `message` interface

In [None]:
from langchain.schema import HumanMessage

llm.predict_messages([HumanMessage(content="say hi!")])

AIMessage(content='\n\nRobot: Hi there!', additional_kwargs={}, example=False)

In [5]:
chat_model.predict_messages([HumanMessage(content="say hi!")])

AIMessage(content='Hello there!', additional_kwargs={}, example=False)

Los Modelos de Lenguaje de Gran Escala (LLMs) son un componente central de LangChain. LangChain no es un proveedor de LLMs, sino que proporciona una interfaz estándar a través de la cual puedes interactuar con una variedad de LLMs

**La clase LLM de LangChain.**

Hay muchos provedores de LLM (OpenAi, Cohere, Hugging Face, etc), la clase LLM de LangChain esta diseñada para proveer una estandarización de la interfaz para todos ellos. Nos enfocaremos en la funcionalidad general de la clase LLM. Para detalles de como utilizar un envoltorio específico de LLM ir a [How-to Section](https://python.langchain.com/en/latest/modules/models/llms/how_to_guides.html)

In [2]:
from langchain.llms import OpenAI

llm = OpenAI(model_name="text-ada-001", n=2, best_of=2)

**Generate Text**: La funcionalidad más básica de un LLM es la habilidad de llamarlo, pasarle un string y obtener de vuelta otro string.

In [5]:
llm("Tell me a joke")

'\n\nWhy did the chicken cross the road?\n\nTo get to the other side!'

**Generate**: De manera más amblia, puedes llamarlo con una lista de entradas y obtener una respuesta más completa que solo el texto. Esta respuesta incluye cosas como múltiples respuestas principales, así como información específica del proveedor de LLM.

In [6]:
llm_result = llm.generate(["Tell me a joke", "Tell me a poem"]*15)

In [7]:
len(llm_result.generations)

30

In [8]:
llm_result.generations[0]

[Generation(text='\n\nWhy did the chicken cross the road?\n\nTo get to the other side.', generation_info={'finish_reason': None, 'logprobs': None}),
 Generation(text='\n\nWhy did the chicken cross the road?\n\nTo get to the other side.', generation_info={'finish_reason': 'stop', 'logprobs': None})]

In [9]:
llm_result.generations[-1]

[Generation(text='\n\nNo one ever comes\n\nTo the party you left\n\nOnly the memories\n\nOf your loved ones remain\n\nAs they laugh and dance\n\nAnd the love they once felt\n\n remains\n\nIn their hearts they still tell\n\nA story of a time soon\n\nWhen love was strong\n\nAnd everyone came together\n\nFor a beautiful event\n\nThat will be remembered\n\nFor a moment of pure joy\n\nAnd all you left behind\n\n remain\n\nYour friends and family\n\nAnd they keep going strong\n\nThe memories they make\n\nOf the time they shared\n\nAre still with them today', generation_info={'finish_reason': 'stop', 'logprobs': None}),
 Generation(text='\n\nHow could I be happy\n\nIf I knew all the ways\n\nThat somebody would take\n\nMy heart away in a moment\n\nIn a second how could I be happy\n\nIf I knew all the ways\n\nThat somebody would take\n\nMy heart away in a moment\n\nIn a second how could I be happy\n\nIf I knew all the ways\n\nThat somebody would take\n\nMy heart away in a moment\n\nIn a second 

También puedes acceder a la información específica del proveedor que se devuelve. Sin embargo, es importante tener en cuenta que esta información no está estandarizada entre los proveedores. Cada proveedor puede proporcionar información adicional o específica que puede ser relevante para su implementación particular del modelo de lenguaje.

In [10]:
llm_result.llm_output

{'token_usage': {'prompt_tokens': 120,
  'total_tokens': 4086,
  'completion_tokens': 3966},
 'model_name': 'text-ada-001'}


**Número de tokens**: También puedes estimar cuántos tokens habrá en un fragmento de texto en ese modelo. Esto es útil porque los modelos tienen una longitud de contexto (y más tokens implican un mayor costo), lo que significa que debes ser consciente de cuán extenso es el texto que estás pasando.

Es importante tener en cuenta que, por defecto, los tokens se estiman utilizando "tiktoken" (excepto para versiones anteriores a 3.8, donde se utiliza un tokenizador de Hugging Face).

In [12]:
llm.get_num_tokens("what a joke")

3