## Creación de un simple ChatBot que interactúa con llama 3.2

### 1. Librerías

In [1]:
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_ollama import ChatOllama
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate



## 2. Large language model

Hay diferentes modelos que se pueden usar. La mayoría necesita un "API KEY":

ChatOpenAI, ChatAnthropic, ChatVertexAI, ChatCohere, ChatNVIDIA, ChatGroq, ChatMistralAI

Existen otros modelos en la plataforma HUGGINGFACE.

Para la mayoría de los modelos hay que definir una variable de entorno:

------------------------------------------------------------------------------
import getpass

import os

export OPENAI_API_KEY="..."

os.environ["OPENAI_API_KEY"] = getpass.getpass()

from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4")

------------------------------------------------------------------------------

Usando Ollama en local no es necesario definir variables de entorno. 


In [2]:
local_llm = 'llama3.2:3b-instruct-fp16'
llm = ChatOllama(model=local_llm, temperature=0)

Algunos de los parámetros más importantes que se deben/pueden especificar:

-**model**: el nombre del modelo específico que se quiere usar (por ejemplo, para ChatOpenAI puede ser "gpt-3.5-turbo" o "gpt-4")

**temperature**: controla la aleatoriedad de la respuesta (y la capacidad "generativa"), el valor mínimo es 0 (muy baja aleatoriedad y creatividad).

**timeout**: el máximo tiempo de espera para obtener la respuesta

**max_tokens**: es un número que limita el valor máximo de palabra y puntuación en la respuesta.

**api_key**: el api key del usuario

No todos los modelos admiten los mismos parámetros.

Métodos clave del modelo de chat:

-**invoke**: El método principal para interactuar con un modelo de chat. Acepta una lista de mensajes como entrada y devuelve una lista de mensajes como salida.

-**stream**: Un método que permite transmitir la salida de un modelo de chat a medida que se genera.

-**batch**: Un método que permite agrupar varias solicitudes a un modelo de chat para su procesamiento eficiente.

-**bind_tools**: Un método que permite vincular una herramienta a un modelo de chat para su uso en el contexto de ejecución del modelo.

-**with_structured_output**: Un envoltorio alrededor del método invoke para modelos que admiten natively salida estructurada.


In [4]:
messages= 'Hola, traduce al inglés: hola'
llm.invoke(messages)

AIMessage(content='The translation of "hola" to English is:\n\nHello.', additional_kwargs={}, response_metadata={'model': 'llama3.2:3b-instruct-fp16', 'created_at': '2024-11-21T19:56:11.443261Z', 'message': {'role': 'assistant', 'content': ''}, 'done_reason': 'stop', 'done': True, 'total_duration': 5157296209, 'load_duration': 4361056375, 'prompt_eval_count': 35, 'prompt_eval_duration': 114757000, 'eval_count': 14, 'eval_duration': 678958000}, id='run-17831a6b-2ba3-4523-8076-468ea41b9601-0', usage_metadata={'input_tokens': 35, 'output_tokens': 14, 'total_tokens': 49})

### 3. Mensajes

Un mensaje suele consistir en las siguientes piezas de información:

-**Rol**: El rol del mensaje (por ejemplo, "usuario", "asistente").

-**Contenido**: El contenido del mensaje (por ejemplo, texto, datos multimodales).

-**Metadatos adicionales**: id, nombre, uso de tokens y otros metadatos específicos del modelo.

Rol
Los roles se utilizan para distinguir entre diferentes tipos de mensajes en una conversación y ayudar al modelo de chat a entender cómo responder a una secuencia determinada de mensajes.







In [5]:
messages = [
    SystemMessage(content="Translate the following from english to spanish"),
    HumanMessage(content="Hi"),
]


Se puede usar un "parser" para escribir la respuesta sin metedatos:

In [7]:
parser = StrOutputParser()
result = llm.invoke(messages)
parser.invoke(result)

'Hola'

Se pueden juntar el modelo y el parser en una "chain":

In [8]:
chain = llm | parser
chain.invoke(messages)

'Hola'

**Temperature**

Repetimos 5 veces la pregunta "Escribe un color cualquiera" y analizamos las respuestas para diferentes valores del parámetro "temperature". Para un valor de temperature=0:


In [26]:
messages = 'Hola, escribe un color cualquiera'
llm = ChatOllama(model=local_llm, temperature=0)
chain = llm | parser
for i in range(5):
    print(chain.invoke(messages))


El color que te voy a escribir es... **azul**.
El color que te voy a escribir es... **azul**.
El color que te voy a escribir es... **azul**.
El color que te voy a escribir es... **azul**.
El color que te voy a escribir es... **azul**.


Para el valor temperature=1:

In [27]:
messages = 'Hola, escribe un color cualquiera"
llm = ChatOllama(model=local_llm, temperature=1)
chain = llm | parser
for i in range(5):
    print(chain.invoke(messages))

Azul.
Turquesa.
El color que te voy a escribir es... **azul**.
**Tuspa**

Un color vibrante y emotivo que evoca una sensación de energía y creatividad.
**Rojo**

¿Te gusta el rojo? Es uno de los colores más vibrantes y emocionales que hay en el espectro visible. El rojo es una combinación perfecta de energía y pasión, y suele asociarse con sentimientos fuertes como el amor, la intensidad y la creatividad.

¿Quieres saber más sobre el significado del color rojo o tienes alguna pregunta relacionada?


**top-k y top-P**

Al igual que la temperatura, los parámetros top-K y top-P también se utilizan para controlar la diversidad de la salida del modelo.

Top-K es un número entero positivo que define la cantidad de tokens más probables de los cuales seleccionar el token de salida. Un top-K de 1 selecciona un solo token.

Top-P define el umbral de probabilidad que, una vez excedido de forma acumulativa, los tokens dejan de ser seleccionados como candidatos. Un top-P de 0 es equivalente típicamente al top K con k=1, y un top-P de 1 selecciona típicamente todos los tokens en el vocabulario del modelo.

Ejecute este ejemplo varias veces, cambie la configuración y observe el cambio en la salida.
 
- top k =64  top_p = 0.95

- top k=1 top_p =0

In [30]:
messages = "You are a creative writer. Write a short story about a cat who goes on an adventure"
llm = ChatOllama(model=local_llm, temperature=1, top_k=64,
        top_p=0.95)
chain = llm | parser
print(chain.invoke(messages))

**The Whispering Woods**

Whiskers, the curious cat, stood at the threshold of her cozy home, paw on the doorframe, as if hesitating to leave. Her tail twitched with excitement and caution, like two antennae tuning into the whispers of the universe. The moon cast a silver glow outside, illuminating the windowsill where the morning sunlight had left its mark.


The forest was alive with the secrets it kept within its ancient boughs and whispering leaves. The air vibrated with whispers – murmurs from creatures great and small – each sharing tales of long-forgotten deeds, love stories, and mysteries veiled in mist. Whiskers followed the siren's call, her ears perked up like satellite dishes tuning into a hidden frequency.

As she wandered deeper, the trees grew taller and closer together, their branches intertwined above her head. Shafts of moonlight broke through the canopy, casting dappled shadows on the forest floor. Whiskers navigated with an air of feline confidence, though every now

In [31]:
messages = "You are a creative writer. Write a short story about a cat who goes on an adventure"
llm = ChatOllama(model=local_llm, temperature=1, top_k=1,
        top_p=0)
chain = llm | parser
print(chain.invoke(messages))

**The Whiskered Wanderer**

In the sleepy town of Willowdale, where sunbeams danced through the windows and dust motes waltzed in the air, a sleek black cat named Midnight prowled the streets. Her eyes gleamed like polished onyx as she padded silently from house to house, searching for adventure.

Midnight's owner, an elderly lady named Mrs. Jenkins, had grown fond of her mischievous ways and often left treats and toys scattered about the house. But tonight, Midnight yearned for something more – a taste of freedom, a dash of excitement.

As she slipped out into the night air, the world came alive around her. Fireflies twinkled like tiny lanterns, casting a magical glow over the cobblestone streets. The scent of blooming flowers wafted on the breeze, enticing Midnight to explore further.

She padded through alleys and side streets, weaving past sleeping dogs and snoring cats. Her ears perked up at every sound – a chirping cricket, a hooting owl, or the distant rumble of thunder. With ea

In [32]:
messages = "You are a creative writer. Write a short story about a cat who goes on an adventure"
llm = ChatOllama(model=local_llm, temperature=1, top_k=5,
        top_p=0)
chain = llm | parser
print(chain.invoke(messages))

**The Whiskered Wanderer**

In the sleepy town of Willowdale, where sunbeams danced through the windows and dust motes waltzed in the air, a sleek black cat named Midnight prowled the streets. Her eyes gleamed like polished onyx as she padded silently from house to house, searching for adventure.

Midnight's owner, an elderly lady named Mrs. Jenkins, had grown fond of her mischievous ways and often left treats and toys scattered about the house. But tonight, Midnight yearned for something more – a taste of freedom, a dash of excitement.

As she slipped out into the night air, the world came alive around her. Fireflies twinkled like tiny lanterns, casting a magical glow over the cobblestone streets. The scent of blooming flowers wafted on the breeze, enticing Midnight to explore further.

She padded through alleys and side streets, weaving past sleeping dogs and snoring cats. Her ears perked up at every sound – a chirping cricket, a hooting owl, or the distant rumble of thunder. With ea

## 2. Prompt templates

Si se quieren hacer preguntas siempre del mismo tipo, dando las mismas instrucciones al sustema, se pueden definir "prompt templates", que pueden contener variables, definidas entre {}.

In [18]:
system_template = "Translate the following into {language}, write only the translated word:"

In [35]:
prompt_template = ChatPromptTemplate.from_messages(
    [("system", system_template), ("user", "{text}")]
)

In [36]:
llm = ChatOllama(model=local_llm, temperature=0)
result = prompt_template.invoke({"language": "italian", "text": "hi"})
result

ChatPromptValue(messages=[SystemMessage(content='Translate the following into italian, write only the translated word:', additional_kwargs={}, response_metadata={}), HumanMessage(content='hi', additional_kwargs={}, response_metadata={})])

In [37]:
chain = prompt_template | llm | parser

In [38]:
chain.invoke({"language": "italian", "text": "hi"})



'Ciao'

In [40]:
prompt_template = ChatPromptTemplate([
    ("system", "You are a helpful assistant"),
    ("user", "Tell me a joke about {topic}")
])

chain = prompt_template | llm | parser
chain.invoke({"topic": "cats"})

'Why did the cat join a band?\n\nBecause it wanted to be the purr-cussionist!'