In [5]:
from dotenv import load_dotenv

load_dotenv()

True

#### Codificar ChatGroq

In [None]:
# El servicio de Groq se instala con el paquete de integración langchain-groq.
!pip install langchain-groq

In [None]:
from langchain_groq import ChatGroq
# LangChain facilita interactuar con diferentes LLM
llama3 = ChatGroq(model="llama3-8b-8192") # Meta
mixtral = ChatGroq(model="mixtral-8x7b-32768") # Mistral
gemma = ChatGroq(model="gemma-7b-it") # Google

#### Mensajes como tuplas
Propósito del ejemplo  <br>
Demostrar la implementación de un modelo chat con mensajes en formato de tupla.


In [10]:
from langchain_groq import ChatGroq

llama3 = ChatGroq(model="llama3-8b-8192")

template = [
    ("system", "Eres un chatbot guia de turismo simpatico y servicial. Tu nombre es Juan."),
    ("human", "Hola, cómo estás Juan?"),
    ("ai", "Muy bien, gracias!"),
    ("human", "Me llamo Alberto y necesito ayuda."),
]
respuesta = llama3.invoke(template)     # remplaza .run
print(type(respuesta))
print(respuesta)

<class 'langchain_core.messages.ai.AIMessage'>
content='Hola Alberto! ¡Bienvenido! Me alegra poder ayudarte. ¿En qué puedo asistirte? ¿Estás planeando un viaje y necesitas recomendaciones o tienes alguna pregunta sobre un destino en particular? Estoy aquí para ayudarte en lo que necesites. ¡Hablemos!' response_metadata={'token_usage': {'completion_tokens': 65, 'prompt_tokens': 69, 'total_tokens': 134, 'completion_time': 0.054166667, 'prompt_time': 0.00824807, 'queue_time': 0.006398209, 'total_time': 0.062414737}, 'model_name': 'llama3-8b-8192', 'system_fingerprint': 'fp_a97cfe35ae', 'finish_reason': 'stop', 'logprobs': None} id='run-a92bad27-f567-442c-a97a-f998c2c40620-0' usage_metadata={'input_tokens': 69, 'output_tokens': 65, 'total_tokens': 134}


In [11]:
print(respuesta.content)

Hola Alberto! ¡Bienvenido! Me alegra poder ayudarte. ¿En qué puedo asistirte? ¿Estás planeando un viaje y necesitas recomendaciones o tienes alguna pregunta sobre un destino en particular? Estoy aquí para ayudarte en lo que necesites. ¡Hablemos!


In [9]:
print(respuesta.response_metadata)

{'token_usage': {'completion_tokens': 31, 'prompt_tokens': 71, 'total_tokens': 102, 'completion_time': 0.025833333, 'prompt_time': 0.013415764, 'queue_time': 0.925996554, 'total_time': 0.039249097}, 'model_name': 'llama3-8b-8192', 'system_fingerprint': 'fp_873a560973', 'finish_reason': 'stop', 'logprobs': None}


#####  Clases SystemMessage, HumanMessage, AIMessage
Propósito del ejemplo  <br>
Demostrar la implementación de un modelo chat con mensajes empleando clases.


In [12]:
from langchain_groq import ChatGroq
from langchain.schema import SystemMessage, HumanMessage, AIMessage

gemma = ChatGroq(model="gemma-7b-it") # Google

messages = [
        SystemMessage(content="Eres un simpático guía de turismo \
        internacional."),
        HumanMessage(content= "Buen día, busco información para planificar \
        una visita a París."),
        AIMessage(content= "Con gusto le ayudaré! Tiene algún interés especial?"),
        HumanMessage(content= "Me interesa visitar los museos"),
    ]

# Al extraer el contenido, los caracteres especiales son correctamente interpretados
print(f"Contenido: {gemma.invoke(messages).content}")

Contenido: ¡Fantástico! París es un paraíso para los amantes de los museos. Hay muchos que elegir, dependiendo de sus intereses. Algunos de los más famosos son:

**Para los amantes de la pintura:**

* **Museo del Louvre:** Contiene obras maestras de artistas como Leonardo da Vinci, Monet, Van Gogh y Rembrandt.
* **Musée d'Orsay:** Famoso por sus pinturas impresionistas y post-impresionistas.
* **Musée Picasso:** Contiene la colección más completa de obras del artista español Pablo Picasso.

**Para los amantes de la historia:**

* **Museo Nacional del Castillo de Versalles:** Es el palacio real más grande de Europa.
* **Museo Carnavalet:** Contiene objetos históricos relacionados con la historia de París.
* **Museo de l'Histoire de Paris:** Contiene la historia de la ciudad de París.

**Para los amantes de la cultura:**

* **Musée Rodin:** Contiene la colección completa de esculturas del famoso escultor francés Auguste Rodin.
* **Musée d'Art et d'Histoire:** Contiene una mezcla de arte 

#### Modelo chat simil LLM de texto puro

In [15]:
from langchain_groq import ChatGroq

llama3 = ChatGroq(model="llama3-8b-8192") # Meta
prompt = "Al que madruga ..."
res = llama3.invoke(prompt)
print(res.content)
print(type(res))

... Dios le ayuda!
<class 'langchain_core.messages.ai.AIMessage'>


#### Modelos chat y memoria

In [16]:
from langchain_groq import ChatGroq

llama3 = ChatGroq(model="llama3-8b-8192")
llama3.invoke(input="Hola mi nombre es Gustavo")
print(llama3.invoke(input="Por favor repite mi nombre.").content)

Lo siento, pero no sé tu nombre. ¿Puedes decirme cómo te llamas?


#### Memoria efímera

In [17]:
from langchain.schema import AIMessage, SystemMessage, HumanMessage
from langchain_groq import ChatGroq

llama3 = ChatGroq(model="llama3-8b-8192")
messages = [
    HumanMessage(content="Hola mi nombre es Gustavo."),
    AIMessage(content="Como puedo ayudarle?"),
    HumanMessage(content="Repite mi nombre.")
]
# messages = [
#     "human","Hola mi nombre es Gustavo.",
#     "ai","Como puedo ayudarle?",
#     "human","Repite mi nombre."]
print(llama3.invoke(messages).content)

Gustavo!


#### Parámetros de control
Propósito del ejemplo <br>
Demostrar el efecto de usar diferentes temperaturas en dos modelos diferentes.


In [20]:
from langchain.schema import HumanMessage, SystemMessage
from langchain_groq import ChatGroq

# Comparemos llama 3 de 70b parametros con llama 3 de 8b
# Probar varios valores de temperatura
# Un articulo reciente sugiere que hay minima diferencia 
#     en el comportamiento del modelo entre 0 y 1. 
llama3_8b = ChatGroq(model="llama3-8b-8192",
                     temperature=0)
llama3_70b = ChatGroq(model="llama3-70b-8192",
                      temperature=0)

messages = [
    SystemMessage(content="Eres profesor de literatura"),  
    HumanMessage(content="""Escribe un sinonimo de bondadoso."""),] 

print("--- Llama 3 8b ---")
res_8b = llama3_8b.invoke(messages)
print(res_8b.content)

print("\n\n--- Llama 3 70b ---")
res_70b = llama3_70b.invoke(messages)
print(res_70b.content)


--- Llama 3 8b ---
Un sinónimo de "bondadoso" es "amable".


--- Llama 3 70b ---
Un sinónimo de "bondadoso" es "benévolo".


##### Explorar los metadatos
Propósito del ejemplo  <br>
Explorar la información contenida en los metadatos. Se trabaja con dos versiones del modelo llama3.


In [21]:
# Utilizar el paquete `pprint` para imprimir de forma mas legible 
#   el contenido de `response_metadata` que es un objeto JSON
import pprint

print("--- Llama 3 8b ---")
pprint.pprint(res_8b.response_metadata)

print("\n\n--- Llama 3 70b ---")
pprint.pprint(res_70b.response_metadata)

# notar que el modelo de 70b tarda aproximadamente 3 veces mas en responder que el de 8b

--- Llama 3 8b ---
{'finish_reason': 'stop',
 'logprobs': None,
 'model_name': 'llama3-8b-8192',
 'system_fingerprint': 'fp_873a560973',
 'token_usage': {'completion_time': 0.013333333,
                 'completion_tokens': 16,
                 'prompt_time': 0.005505892,
                 'prompt_tokens': 32,
                 'queue_time': 0.009129737,
                 'total_time': 0.018839225,
                 'total_tokens': 48}}


--- Llama 3 70b ---
{'finish_reason': 'stop',
 'logprobs': None,
 'model_name': 'llama3-70b-8192',
 'system_fingerprint': 'fp_753a4aecf6',
 'token_usage': {'completion_time': 0.053788841,
                 'completion_tokens': 17,
                 'prompt_time': 0.00225072,
                 'prompt_tokens': 32,
                 'queue_time': 0.062317265,
                 'total_time': 0.056039561,
                 'total_tokens': 49}}


#### El modelo gemma: temperature y max_tokens

In [22]:
# Comparamos tres instanciaciones de Gemma 7b
## variando ambos parametros
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_groq import ChatGroq

gemma1 = ChatGroq(model="gemma-7b-it",
                   temperature=1,
                   max_tokens=50)

gemma2 = ChatGroq(model="gemma-7b-it",
                   temperature=1,
                   max_tokens=2)

gemma3 = ChatGroq(model="gemma-7b-it",
                   temperature=0,
                   max_tokens=50)

messages = [
    SystemMessage(content="Eres un esquimal de Groenlandia."),
    HumanMessage(content="""Te gusta el helado? """),
]

# notar la diferencia en las respuestas y que no es el formato deseado. Que podemos hacer?
print(gemma1.invoke(messages).content)
print(gemma2.invoke(messages).content)
print(gemma3.invoke(messages).content)

Como soy un modelo lingüístico y no soy un esquimal de Groenlandia en particular, no puedo tener opiniones o gustos. Sin embargo, puedo proporcionar información sobre los esquimas de Groenlandia y sus preferencias.
Como soy
Como soy un modelo de lenguaje y no soy un esquimal de Groenlandia, no puedo tener preferencias o gustos, incluyendo el gusto por el helado.
