# 01- Intéraction simple avec un LLM

Dans ce premier exercice, nous allons poser les bases de notre agent d’IA en apprenant à interagir directement avec l'API d'un LLM provider.

L'objectif n’est pas encore de construire une logique complexe, mais simplement de comprendre comment envoyer une requête à un LLM et récupérer sa réponse en Python.

À la fin de cet exercice, vous serez capable d’appeler un modèle de langage depuis un notebook, de lui fournir un prompt textuel et d’afficher la réponse générée.

## Définition des variables
| Paramètre        | Description |
|------------------|-------------|
| Endpoint         | URL du service exposé par le fournisseur pour envoyer des requêtes au modèle. |
| Modèle           | Identifiant du modèle de langage à utiliser pour générer les réponses. |
| Clé d'API        | Permet de s’authentifier auprès du fournisseur de LLM et d’autoriser les appels à l’API. |
| Prompt / Messages| Texte ou structure de messages envoyés au modèle pour guider la génération. |


In [None]:
from dotenv import dotenv_values
config = dotenv_values("../../.env")

# Call to local lm studio
API_URL = "http://localhost:1234/v1/chat/completions"
API_KEY = ""
MODEL_NAME = "qwen/qwen3-4b-2507"

# Call to remote llm
# API_URL = "https://api.openai.com/v1/chat/completions"
# API_KEY = config.get("LLM_API_KEY")
# MODEL_NAME = "gpt-4.1-nano"

## Appel HTTP vers un LLM

Le code suivant effectue une requête HTTP POST vers le point d’accès du llm provider, en s’authentifiant à l’aide d’une clé d’API passée dans les en-têtes. Le corps de la requête précise le modèle utilisé, le message utilisateur qui sert de prompt.

Une fois la requête exécutée, la réponse est récupérée au format JSON.

In [22]:
import requests
from rich import print

response = requests.post(API_URL,
    headers={
        "Authorization": f"Bearer {API_KEY}"
    },
    json={
        "model": MODEL_NAME,
        "messages": [
            {
                "role": "user",
                "content": "List in few word the most popular development languages"
            }
        ],
        "frequency_penalty": 1.3 #  Les valeurs positives pénalisent les nouveaux tokens en fonction de leur fréquence actuelle dans le texte, ce qui réduit la probabilité que le modèle répète la même ligne mot pour mot.
    }
)

print(response.json())
print(response.json()['choices'][0]['message']['content'])

## Demander le résumé d'un article
Le code suivant importe le contenu d'un article dans la variable `article_content`.

<ins>**Exercice:**</ins> Compléter ce code pour demander au llm de résumer l'article donc le contenu est mentionné

In [23]:
import sys
from pathlib import Path
sys.path.append(str(Path("../../utils").resolve()))
from file_reader import read_file

article_content = read_file(str(Path("../../assets/articles/001-article.md")))
print(article_content)