# **Build a simple LLM application with chat models and prompt templates**


***

**Français :** L'objectif est de créer une application simple avec LangChain qui est capable de traduire un texte en anglais vers une autre langue.

L'application utilise un seul appel à un modèle de langage (LLM) avec un peu de prompting.

***

***
**English :** The goal is to create a simple app with LangChain that can translate text from English to another language.

The app uses a single call to a language model (LLM) with a bit of prompting.

***

In [1]:
import getpass
import os

try:
    # load environment variables from .env file (requires `python-dotenv`)
    from dotenv import load_dotenv

    load_dotenv()
except ImportError:
    pass

os.environ["LANGSMITH_TRACING"] = "false"
# os.environ["LANGSMITH_TRACING"] = "true"

if "LANGSMITH_API_KEY" not in os.environ:     #connexion au compte LangSmith pour la vérification/test/... du LLM
    os.environ["LANGSMITH_API_KEY"] = getpass.getpass(
        prompt="Enter your LangSmith API key (optional): "
    )
if "LANGSMITH_PROJECT" not in os.environ:    #entrer le nom du projet
    os.environ["LANGSMITH_PROJECT"] = getpass.getpass(
        prompt='Enter your LangSmith Project Name (default = "default"): '
    )
    if not os.environ.get("LANGSMITH_PROJECT"):   #clé de openAI
        os.environ["LANGSMITH_PROJECT"] = "default"


Enter your LangSmith API key (optional):  ········
Enter your LangSmith Project Name (default = "default"):  ········


In [2]:
ollama_api_key = os.environ["OLLAMA_API_KEY"]
# print(ollama_api_key)

from langchain.chat_models import init_chat_model
heders = headers = {
'Authorization': f"Bearer {ollama_api_key}"
}

model = init_chat_model("llama3.3:70b", model_provider="ollama", base_url="https://ollama.ccad.unc.edu.ar/ollama", client_kwargs={'headers': headers})


In [3]:
model.invoke("Hello")

AIMessage(content='Hello! How can I assist you today?', additional_kwargs={}, response_metadata={'model': 'llama3.3:70b', 'created_at': '2025-06-10T19:18:39.833884221Z', 'done': True, 'done_reason': 'stop', 'total_duration': 15172080226, 'load_duration': 19860627, 'prompt_eval_count': 11, 'prompt_eval_duration': 1158521069, 'eval_count': 10, 'eval_duration': 13992438854, 'model_name': 'llama3.3:70b'}, id='run--fa38ef38-ea43-4474-9b39-459c09541b03-0', usage_metadata={'input_tokens': 11, 'output_tokens': 10, 'total_tokens': 21})

In [4]:
print(model.invoke("Hello").content) #affiche que la réponse renvoyée par le LLM

It's nice to meet you. Is there something I can help you with or would you like to chat?


***

**Français :** Le message que renvoit **model.invoke ("Hello, world !")** est un "objet complet" retourné par LangChain. Cet objet contient **la réponse du modèle**("Hello! How can I assist you today?"), mais aussi beaucoup d'autres information techniques comme **le nombre de tokens utilisés** (21 = 11 "prompt" + 10 "réponse"), **le nom du modèle**, et des détails **pour suivre ou analyser les appels**.

Pour juste afficher la réponse du LLM, on peut utiliser ".content" :

==> ***print(model.invoke("Hello").content)***

pour ne voir que le texte retrouné à l'utilisateur par le LLM.

***
***
**English :** When you run **model.invoke("Hello, world!")**, LangChain returns a full object. This object includes **the model's response** (for example, "Hello! How can I assist you today?"), but also other technical information such as **the number of tokens used** (21 in total: 11 for the prompt and 10 for the response), **the name of the model**, and **some metadata useful for tracking or analyzing the call**.

If you only want to display the model's response text, the part the user sees, you can use the .content attribute like this:

==> **print(model.invoke("Hello").content)**

This will show only the response generated by the LLM, without all the extra information.

***



---


# **USING LANGUAGE MODELS**

---



***

**Français :** Dans cet exemple, on apprend à utiliser un modèle de langage avec LangChain. La première étape consiste à installer la bibliothèque LangChain avec le modèle OpenAI.

Le modèle de chat dans LangChain est un "Runnable", ainsi on peut lui donner en entrée de message? Un exemple de message est créé avec une liste de deux objets : un message système demandant de traduire un texte de l'anglais vers l'italien, et un message utilisateur contenant le texte à traduire ("hi!"). On envoit ces messages au modèle via la méthode `.invoke(messages)` pour obtenir une réponse.

Le modèle retourne une réponse sous forme de AIMessage, qui contient les informations sur la sortie générée, comme le texte traduit ("Ciao!") ainsi que des détails sur l'utilisation des tokens (nombre de tokens utilisés pour la demande et la réponse).

Enfin, LangChain prend également en charge l'invocation asynchrone et le streaming, permettant de récupérer les réponses du modèle par tokens individuels. Cela permet de traiter chaque token au fur et à mesure qu'il est généré, ce qui est utile pour des applications où la rapidité de la réponse est cruciale, comme dans les systèmes de chat en temps réel.


***
***
**English :** In this example, we learn how to use a language model with LangChain.
The first step is to install the LangChain library along with the OpenAI model.

The chat model in LangChain is a Runnable, so we can give it a message input.
An example message is created using a list of two objects:
a system message asking to translate text from English to Italian,
and a user message containing the text to translate ("hi!").
We send these messages to the model using the .invoke(messages) method to get a response.

The model returns a response as an AIMessage, which contains information about the generated output,
such as the translated text ("Ciao!") and details about token usage
(the number of tokens used for the prompt and the response).

Finally, LangChain also supports asynchronous invocation and streaming,
which allows us to receive the model’s response token by token.
This is useful for applications where response speed is important,
such as in real-time chat systems.

***

***
**Translation : english ---> italian**

***

In [5]:
##Traduction anglais ---> iatlien
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage("Translate the following from English into Italian"),
    HumanMessage("hi!"),
]

model.invoke(messages) #objet complet

AIMessage(content='Ciao!', additional_kwargs={}, response_metadata={'model': 'llama3.3:70b', 'created_at': '2025-06-10T20:28:13.787389555Z', 'done': True, 'done_reason': 'stop', 'total_duration': 13542526897, 'load_duration': 3131487071, 'prompt_eval_count': 24, 'prompt_eval_duration': 5238506500, 'eval_count': 4, 'eval_duration': 5169308708, 'model_name': 'llama3.3:70b'}, id='run--0da6352f-f5dc-47bc-9f9b-e10fdc4a577a-0', usage_metadata={'input_tokens': 24, 'output_tokens': 4, 'total_tokens': 28})

In [6]:
print(model.invoke(messages).content) #affiche ce qui est renvoyé à l'utilisateur

Ciao!


***
**Translation : english ---> chinese**

***

In [7]:
##Traduction anglais ---> chinois
messages_bis = [
    SystemMessage("Translate the following from English into Chinese"),
    HumanMessage("hi!"),
]

model.invoke(messages_bis) #objet complet

AIMessage(content='你好！（nǐ hǎo）', additional_kwargs={}, response_metadata={'model': 'llama3.3:70b', 'created_at': '2025-06-10T20:28:53.715889725Z', 'done': True, 'done_reason': 'stop', 'total_duration': 21671275011, 'load_duration': 19519990, 'prompt_eval_count': 24, 'prompt_eval_duration': 1991469224, 'eval_count': 11, 'eval_duration': 19658882093, 'model_name': 'llama3.3:70b'}, id='run--d144861b-2714-4a1a-b2a7-f7a037b1d42a-0', usage_metadata={'input_tokens': 24, 'output_tokens': 11, 'total_tokens': 35})

In [8]:
print(model.invoke(messages_bis).content) #affiche ce qui est renvoyé à l'utilisateur

！(nǐ hǎo)


***
**Français :** On remarque que la traduction a bien été exécutée pour les deux langues, l'italien et le chinois.

***
***
**English :** We can see that the translation was successfully done for both languages: Italian and Chinese.

***

In [9]:
##Exemples de 3 façons différentes d'appeler "model.invoke"

model.invoke("Hello") #simple chaîne de texte

model.invoke([{"role": "user", "content": "Hello"}]) #format structuré avec un dictionnaire

model.invoke([HumanMessage("Hello")]) #format orienté objet

AIMessage(content="Hello! It's nice to meet you. Is there something I can help you with or would you like to chat?", additional_kwargs={}, response_metadata={'model': 'llama3.3:70b', 'created_at': '2025-06-10T20:31:21.834778045Z', 'done': True, 'done_reason': 'stop', 'total_duration': 46872452948, 'load_duration': 20004653, 'prompt_eval_count': 11, 'prompt_eval_duration': 1081495896, 'eval_count': 25, 'eval_duration': 45769958153, 'model_name': 'llama3.3:70b'}, id='run--cdaae87e-c5d3-47e3-add3-2dd043657bab-0', usage_metadata={'input_tokens': 11, 'output_tokens': 25, 'total_tokens': 36})

In [10]:
print(model.invoke("Hello").content)

print(model.invoke([{"role": "user", "content": "Hello"}]).content)

print(model.invoke([HumanMessage("Hello")]).content)

###Les trois appels renvoient donc bien la même chose###

It's nice to meet you. Is there something I can help you with or would you like to chat?
Hello! It's nice to meet you. Is there something I can help you with or would you like to chat?
Hello! How can I assist you today?


***
**Français :** **Le streaming** permet de recevoir les réponses du modèle de manière progressive, token par token.

Étant donné que les modèles de chat sont des "Runnables" (objets exécutables), ils offrent une interface standard qui supporte l'exécution **asynchrone** et **le streaming**, ce qui permet d'obtenir chaque token **au fur et à mesure de la génération de la réponse**.

***
***
**English :** **Streaming** allows us to receive the model’s responses gradually, token by token.

Since chat models are Runnables (executable objects), they provide a standard interface that supports **asynchronous** execution and **streaming**, which makes it possible to get each token as **the response is being generated**.

***

In [11]:
for token in model.stream(messages):
    print(token.content, end="|")

C|iao|!||



---


# **PROMPT TEMPLATES**
---



***
**Français :** Ici, on crée un modèle de prompt pour formater les entrées utilisateur avant de les envoyer au modèle de langage.

Tout d'abord, on définit une **variable "system_template"** pour donner une instruction générale au modèle. Cette instruction est de traduire un texte de l'anglais vers une langue spécifiée par la variable {language}.

Ensuite, un **objet "ChatPromptTemplate"** est créé avec deux parties :
*   **le message système :** est défini par le **"system_template"** ---> indique la tâche (traduire vers la langue cible)
*   **le message utilisateur :** est défini par une variable {text} ---> indique le texte à traduire

En utilisant **ChatPromptTemplate.from_messages()**, on assemble ces deux messages sous forme de modèle de prompt.

Enfin, en appelant **prompt_template.invoke()** avec un dictionnaire contenant les valeurs de la langue ("Italian") et du texte ("hi!"), ces valeurs sont injectées dans le modèle de prompt, ce qui génère un message final prêt à être envoyé au modèle de langage pour effectuer la traduction.

Ainsi, on transforme **les entrées utilisateur brutes** en un format **structuré**, **facile à traiter** par le modèle de langage.


***
***
**English :** Here, we create a prompt template to format user inputs before sending them to the language model.

First, we define a **variable "system_template"** to give a general instruction to the model.
This instruction is to translate a text from English to a language specified by the variable {language}.

Next, a ChatPromptTemplate object is created with two parts:
* **the system message:** defined by the system_template ---> it tells the task (translate to the target language)
* **the user message:** defined by a variable {text} ---> it shows the text to translate

Using **ChatPromptTemplate.from_messages()**, we combine these two messages into one prompt template.

Finally, by calling **prompt_template.invoke()** with a dictionary containing the language ("Italian") and the text ("hi!"), these values are inserted into the prompt.
This produces a final message ready to be sent to the language model for translation.

So, we turn raw user inputs into a structured format that is easy for the language model to handle.

***

In [12]:
from langchain_core.prompts import ChatPromptTemplate

system_template = "Translate the following from English into {language}"

prompt_template = ChatPromptTemplate.from_messages([("system", system_template), ("user", "{text}")])

In [13]:
prompt = prompt_template.invoke({"language": "Italian", "text": "hi!"})

prompt

ChatPromptValue(messages=[SystemMessage(content='Translate the following from English into Italian', additional_kwargs={}, response_metadata={}), HumanMessage(content='hi!', additional_kwargs={}, response_metadata={})])

In [14]:
prompt.to_messages()

[SystemMessage(content='Translate the following from English into Italian', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='hi!', additional_kwargs={}, response_metadata={})]

In [15]:
response = model.invoke(prompt)
print(response.content)

Ciao!
