
# Ollama x Python –

Ce que vous allez faire :
1. Vérifier que le serveur **Ollama** répond
2. Lister vos modèles locaux
3. Choisir un modèle (par défaut `llama3.1:8b`)
4. Générer du texte avec `/api/generate`
5. Discuter avec `/api/chat` 


## 0) Dépendances

In [None]:

# !pip install requests -q


## 1) Connexion serveur Ollama

In [1]:

import requests

OLLAMA_HOST = "http://localhost:11434"

r = requests.get(f"{OLLAMA_HOST}/api/version")
print("Statut HTTP :", r.status_code)
print("Version serveur :", r.json())


Statut HTTP : 200
Version serveur : {'version': '0.6.2'}


## 2) Lister les modèles

In [2]:

r = requests.get(f"{OLLAMA_HOST}/api/tags")
data = r.json()
models = [m["name"] for m in data.get("models", [])]
print("Modèles locaux :")
for m in models:
    print(" -", m)


Modèles locaux :
 - deepseek-r1:1.5b
 - llama3.1:8b
 - deepseek-r1:latest
 - llava:latest
 - mistral:latest
 - deepseek-r1:8b
 - llama3.2:latest
 - llama3.2:1b
 - deepseek-r1:7b


## 3) Choisir un modèle

In [3]:

MODEL = "llama3.1:8b"  # Changez si besoin, ex: "deepseek-r1:8b"
print("Modèle utilisé :", MODEL)


Modèle utilisé : llama3.1:8b


## 4) /api/generate 

In [4]:

payload = {
    "model": MODEL,
    "prompt": "Explique en 2 phrases ce qu'est un LLM et un cas d'usage.",
    "stream": False  # <--- important
}
r = requests.post(f"{OLLAMA_HOST}/api/generate", json=payload)
print("Content-Type:", r.headers.get("Content-Type"))
resp = r.json()  # OK car stream=False renvoie un seul JSON
print(resp.get("response", ""))


Content-Type: application/json; charset=utf-8
Un Large Language Model (LLM) est un modèle informatique conçu pour traiter du langage naturel, capable de comprendre et de générer du texte cohérent. Ce type de modèles utilisent des algorithmes de traitement automatique du langage (TAL) et d'apprentissage automatique profond pour traiter des données textuelles massives.

Un cas d'usage consiste à utiliser un LLM en tant que support de rédaction, car il peut produire rapidement de la documentation, des contenus de blog ou même des articles complètement autonomes, ce qui facilite le travail des équipes de contenu.


## 5) /api/chat 

In [5]:

messages = [
    {"role": "system", "content": "Tu es un assistant concis et pédagogique."},
    {"role": "user", "content": "Donne 3 bonnes pratiques pour écrire un prompt efficace."},
]

payload = {
    "model": MODEL,
    "messages": messages,
    "stream": False  
}
r = requests.post(f"{OLLAMA_HOST}/api/chat", json=payload)
print("Content-Type:", r.headers.get("Content-Type"))
data = r.json()  # OK car stream=False
print(data["message"]["content"])


Content-Type: application/json; charset=utf-8
Voici trois bonnes pratiques pour écrire un prompt efficace :

1. **Soyez clair et spécifique** : Formulez votre demande de manière précise et concrète, en évitant les ambiguïtés ou les termes vagues. Cela permettra à l'assistant d'apporter une réponse pertinente et adaptée.

2. **Soyez précis dans vos objectifs** : Définissez clairement ce que vous voulez atteindre avec votre demande, en indiquant les résultats attendus ou les informations nécessaires. Cela facilitera l’entraînement de l’assistant à fournir une réponse optimale.

3. **Restez concis et structuré** : Évitez les phrases longues et tortueuses pour formuler votre demande. Faites en sorte qu'elle soit facile à lire, claire et directe, ce qui rendra la tâche plus efficace pour l'assistant de fournir une réponse pertinente.

Cela contribuera à améliorer les résultats obtenus avec l’assistant et facilitera votre travail.
