# Fine-tuning de modèle

## Etape 1 : Génération de données synthétiques

In [8]:
import os
import openai

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file

openai.api_key  = os.environ['OPENAI_API_KEY']

embedding_model = "text-embedding-3-small"
llm_model = "gpt-4.1-nano"

In [47]:
prompt_generate_data_template = """Vous êtes un assistant expert en gestion de projet. 
On va vous fournir un intitulé de projet, et vous devez produire une fiche projet complète en suivant les champs JSON suivants :

Titre: <titre du projet>,
Contexte: <quel est le contexte et le besoin du projet>,
Objectifs: <liste d'objectifs du projet>,
Description: <description détaillée du projet>,
Parties_prenantes: <rôles impliqués dans le projet>,
Budget_estime: <budget prévisionnel>,
Echeancier: <durée ou étapes principales>

Faites en sorte d'adapter le ton au domaine du projet et de fournir des contenus plausibles.

Voici l'intitulé : {project_title} 
"""

In [48]:
from langchain.prompts import ChatPromptTemplate
template = ChatPromptTemplate.from_template(prompt_generate_data_template)

In [49]:
from langchain_core.output_parsers import StrOutputParser
from langchain_openai import ChatOpenAI

generate_queries = (
    template 
    | ChatOpenAI(temperature=0, model=llm_model)
    | StrOutputParser() 
)

In [None]:
queries = generate_queries.invoke({"project_title": "Développement d'une application mobile de gestion de tâches"})
print(queries)

{
  "Titre": "Développement d'une application mobile de gestion de tâches",
  "Contexte": "Dans un environnement professionnel et personnel de plus en plus dynamique, la gestion efficace des tâches est essentielle pour améliorer la productivité et la coordination. Actuellement, il existe une demande croissante pour des solutions mobiles intuitives permettant aux utilisateurs de planifier, suivre et prioriser leurs activités en temps réel. Ce projet vise à répondre à ce besoin en développant une application mobile innovante et conviviale.",
  "Objectifs": [
    "Concevoir une application mobile multiplateforme (iOS et Android) pour la gestion de tâches",
    "Intégrer des fonctionnalités de création, modification, suppression et priorisation des tâches",
    "Permettre la synchronisation en temps réel avec d'autres outils de calendrier et de messagerie",
    "Offrir une interface utilisateur intuitive et accessible",
    "Assurer la sécurité et la confidentialité des données utilisateur

In [53]:
train_examples = [
        ("Développement d'une application mobile de gestion de tâches",{
  "Titre": "Développement d'une application mobile de gestion de tâches",
  "Contexte": "Dans un environnement professionnel et personnel de plus en plus dynamique, la gestion efficace des tâches est essentielle pour améliorer la productivité et la coordination. Actuellement, il existe une demande croissante pour des solutions mobiles intuitives permettant aux utilisateurs de planifier, suivre et prioriser leurs activités en temps réel. Ce projet vise à répondre à ce besoin en développant une application mobile innovante et conviviale.",
  "Objectifs": [
    "Concevoir une application mobile multiplateforme (iOS et Android) pour la gestion de tâches",
    "Intégrer des fonctionnalités de création, modification, suppression et priorisation des tâches",
    "Permettre la synchronisation en temps réel avec d'autres outils de calendrier et de messagerie",
    "Offrir une interface utilisateur intuitive et accessible",
    "Assurer la sécurité et la confidentialité des données utilisateur",
    "Lancer une version bêta pour recueillir les retours utilisateurs et ajuster le produit"
  ],
  "Description": "Ce projet consiste à développer une application mobile de gestion de tâches qui facilite l'organisation quotidienne des utilisateurs. La solution sera conçue avec une interface moderne et ergonomique, intégrant des fonctionnalités telles que la catégorisation des tâches, les rappels, la priorisation, et la synchronisation avec des services tiers comme Google Calendar ou Outlook. Le développement sera réalisé en suivant une méthodologie agile, permettant des itérations rapides et une adaptation continue aux besoins des utilisateurs. La phase de test comprendra une version bêta accessible à un groupe restreint d'utilisateurs pour recueillir des feedbacks et améliorer la stabilité et la convivialité de l'application avant le déploiement officiel.",
  "Parties_prenantes": [
    "Chef de projet",
    "Équipe de développement (développeurs iOS et Android)",
    "Designer UX/UI",
    "Responsable qualité / Testeur",
    "Partenaires technologiques (fournisseurs d'API et services tiers)",
    "Utilisateurs finaux (bêta-testeurs et clients)"
  ],
  "Budget_estime": "150 000 euros",
  "Echeancier": "Durée totale estimée : 9 mois, répartis en :\n- Phase de conception et planification : 2 mois\n- Développement itératif et intégration : 4 mois\n- Tests et ajustements : 2 mois\n- Lancement de la version bêta et collecte de feedbacks : 1 mois"
})
]

import json
with open("train.jsonl", "w", encoding="utf-8") as f:
    for title, fiche in train_examples:
        # Préparer le message au format chat
        messages = [
            {"role": "system", "content": "Tu es un assistant qui génère des fiches projets en JSON."},
            {"role": "user", "content": f"Titre du projet : {title}"},
            {"role": "assistant", "content": json.dumps(fiche, ensure_ascii=False)}
        ]
        record = {"messages": messages}
        f.write(json.dumps(record, ensure_ascii=False) + "\n")
print("Fichier JSONL créé avec succès.")

Fichier JSONL créé avec succès.


In [56]:
def generate_project_names():
    project_names = [
        "Création d'un site web e-commerce",
        "Développement d'une plateforme de cours en ligne",
        "Mise en place d'un système de gestion de la relation client (CRM)",
        "Lancement d'une campagne de marketing digital",
        "Conception d'une application de suivi de la santé",
        "Développement d'un logiciel de gestion des ressources humaines",
        "Implémentation d'un système de gestion des stocks",
        "Création d'une application de réservation de voyages",
        "Développement d'un outil de collaboration pour les équipes",
        "Mise en place d'un système de sécurité informatique",
        "Lancement d'une application de livraison de repas",
        "Conception d'un site web pour une ONG",
        "Développement d'une application de gestion financière personnelle",
        "Création d'un système de gestion de projet en ligne",
        "Mise en place d'une plateforme de crowdfunding",
        "Développement d'une application de réalité augmentée pour le tourisme",
        "Conception d'un logiciel de gestion de la chaîne d'approvisionnement",
        "Lancement d'une application de fitness et bien-être",
        "Création d'un outil de gestion des événements",
        "Développement d'une application de gestion des tâches pour les équipes",
        "Mise en place d'un système de gestion des connaissances",
        "Conception d'une application de suivi des habitudes"
    ]
    return project_names

In [54]:
def generate_data_from_project_names(project_names):
    """
    Génère des fiches projet à partir d'une liste de noms de projets.
    """
    results = []
    for project_name in project_names:
        fiche = generate_queries.invoke({"project_title": project_name})
        results.append((project_name, json.loads(fiche)))
    return results

In [55]:
def write_jsonl(examples):
    with open("train.jsonl", "w", encoding="utf-8") as f:
        for title, fiche in examples:
            # Préparer le message au format chat
            messages = [
                {"role": "system", "content": "Tu es un assistant qui génère des fiches projets en JSON."},
                {"role": "user", "content": f"Titre du projet : {title}"},
                {"role": "assistant", "content": json.dumps(fiche, ensure_ascii=False)}
            ]
            record = {"messages": messages}
            f.write(json.dumps(record, ensure_ascii=False) + "\n")
    print("Fichier JSONL créé avec succès.")

In [59]:
project_names = generate_project_names()
project_names.__len__()

22

In [60]:
data_examples = generate_data_from_project_names(project_names)
data_examples[0]

("Création d'un site web e-commerce",
 {'Titre': "Création d'un site web e-commerce",
  'Contexte': "Dans un contexte de croissance du commerce en ligne, l'entreprise souhaite renforcer sa présence digitale pour atteindre une clientèle plus large et améliorer ses ventes. La création d'un site web e-commerce permettra de proposer ses produits en ligne, d'offrir une expérience utilisateur optimisée et de moderniser ses outils de vente.",
  'Objectifs': ['Développer une plateforme de vente en ligne performante et sécurisée',
   'Offrir une expérience utilisateur intuitive et responsive',
   'Intégrer un système de gestion des commandes, paiements et stocks',
   'Optimiser le référencement naturel pour attirer plus de trafic',
   'Mettre en place un outil de suivi des performances et des ventes'],
  'Description': "Ce projet consiste en la conception, le développement et la mise en ligne d'un site web e-commerce pour l'entreprise. Il inclut l'analyse des besoins, la conception de l'interfa

In [61]:
write_jsonl(data_examples)

Fichier JSONL créé avec succès.


In [None]:
import openai

# Upload du fichier d'entraînement
response = openai.files.create(
    file=open("train.jsonl", "rb"),
    purpose="fine-tune"
)

TypeError: 'FileObject' object is not subscriptable

In [64]:
print(response)

FileObject(id='file-A16KdTu9tVP17EUCw2WnCq', bytes=58601, created_at=1747657645, filename='train.jsonl', object='file', purpose='fine-tune', status='processed', expires_at=None, status_details=None)


In [68]:
import openai
from openai import OpenAI

client = OpenAI()

try:
    response_fine_tuning = client.fine_tuning.jobs.create(
        model="gpt-4.1-nano-2025-04-14",
        training_file='file-A16KdTu9tVP17EUCw2WnCq',
    )
except openai.APIConnectionError as e:
    print("The server could not be reached")
    print(e.__cause__)  # an underlying Exception, likely raised within httpx.
except openai.RateLimitError as e:
    print("A 429 status code was received; we should back off a bit.")
except openai.APIStatusError as e:
    print("Another non-200-range status code was received")
    print(e.status_code)
    print(e.response)

In [69]:
response_fine_tuning

FineTuningJob(id='ftjob-LlOP6EfCbYmkOhuNvHbgGVDe', created_at=1747658083, error=Error(code=None, message=None, param=None), fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(batch_size='auto', learning_rate_multiplier='auto', n_epochs='auto'), model='gpt-4.1-nano-2025-04-14', object='fine_tuning.job', organization_id='org-haw8wfVB8Mp3wHdN674qWHN3', result_files=[], seed=1638729243, status='validating_files', trained_tokens=None, training_file='file-A16KdTu9tVP17EUCw2WnCq', validation_file=None, estimated_finish=None, integrations=[], metadata=None, method=Method(dpo=None, supervised=MethodSupervised(hyperparameters=MethodSupervisedHyperparameters(batch_size='auto', learning_rate_multiplier='auto', n_epochs='auto')), type='supervised'), user_provided_suffix=None, usage_metrics=None, shared_with_openai=False, eval_id=None)

In [70]:
all_jobs = []
# Automatically fetches more pages as needed.
for job in client.fine_tuning.jobs.list(
    limit=20,
):
    # Do something with job here
    all_jobs.append(job)
print(all_jobs)

[FineTuningJob(id='ftjob-LlOP6EfCbYmkOhuNvHbgGVDe', created_at=1747658083, error=Error(code=None, message=None, param=None), fine_tuned_model=None, finished_at=None, hyperparameters=Hyperparameters(batch_size=1, learning_rate_multiplier=0.1, n_epochs=4), model='gpt-4.1-nano-2025-04-14', object='fine_tuning.job', organization_id='org-haw8wfVB8Mp3wHdN674qWHN3', result_files=[], seed=1638729243, status='queued', trained_tokens=None, training_file='file-A16KdTu9tVP17EUCw2WnCq', validation_file=None, estimated_finish=None, integrations=[], metadata=None, method=Method(dpo=None, supervised=MethodSupervised(hyperparameters=MethodSupervisedHyperparameters(batch_size=1, learning_rate_multiplier=0.1, n_epochs=4)), type='supervised'), user_provided_suffix=None, usage_metrics=None, shared_with_openai=False, eval_id=None)]


In [71]:
title = "Développement d'une application de gestion des rendez-vous médicaux"

conversation = [
                {"role": "system", "content": "Tu es un assistant qui génère des fiches projets en JSON."},
                {"role": "user", "content": f"Titre du projet : {title}"},
            ]

print(conversation)

[{'role': 'system', 'content': 'Tu es un assistant qui génère des fiches projets en JSON.'}, {'role': 'user', 'content': "Titre du projet : Développement d'une application de gestion des rendez-vous médicaux"}]


In [73]:
response_completion = client.chat.completions.create(
    model="gpt-4.1-nano",
    messages=conversation
)

print(response_completion.choices[0].message.content)

{
  "title": "Développement d'une application de gestion des rendez-vous médicaux",
  "description": "Ce projet vise la conception et la mise en œuvre d'une application permettant aux patients et aux professionnels de la santé de gérer efficacement les rendez-vous médicaux, avec des fonctionnalités telles que la prise de rendez-vous en ligne, la notifications automatiques, et la gestion du dossier médical.",
  "objectives": [
    "Simplifier la prise et le gestion des rendez-vous médicaux",
    "Améliorer la communication entre patients et professionnels de santé",
    "Réduire le taux de rendez-vous manqués grâce à des notifications automatiques",
    "Fournir un accès sécurisé et efficace aux dossiers médicaux"
  ],
  "stakeholders": [
    "Patients",
    "Médecins et professionnels de la santé",
    "Administrateurs de la plateforme",
    "Développeurs et équipe technique"
  ],
  "technologies": [
    "React Native ou Flutter pour l'application mobile",
    "Node.js avec Express pou

In [76]:
response_completion = client.chat.completions.create(
    model="ft:gpt-4.1-nano-2025-04-14:personal::BYupkmIT",
    messages=conversation
)

print(response_completion.choices[0].message.content)

PermissionDeniedError: Error code: 403 - {'error': {'message': 'Project `proj_a1Uco8pN4OkDLpe9MDDWiUsK` does not have access to model `ft:gpt-4.1-nano-2025-04-14:personal::BYupkmIT`', 'type': 'invalid_request_error', 'param': None, 'code': 'model_not_found'}}