# 🎓 Projet : Développement d’un modèle GPT (LLM) pour l’assistance à la préparation des concours sénégalais

📌 Objectif général
Créer un modèle de type GPT (Generative Pretrained Transformer) pour aider les candidats aux concours sénégalais en leur fournissant :

🧠 Explication claire de concepts (mathématiques, français, anglais, SVT, culture générale, etc.)

✍️ Assistance aux épreuves écrites (exercices corrigés, résumés de cours)

🧪 Aide aux tests psychotechniques avec exemples, conseils, et explications

📅 Fonction de simulation de concours antérieurs :

Choix d’une date/session passée

Proposition des sujets correspondants

Génération de solutions détaillées

Suggestion de recommandations personnalisées (exercices ciblés, ressources...)

🧠 Le modèle sera entraîné sur un corpus éducatif adapté au contexte sénégalais, intégrant des annales, manuels scolaires, et contenus validés


## 🛠️ **Étapes techniques du projet**

1. **Collecte et préparation des données**  
   - Collecter des sujets de concours, des annales, et des manuels scolaires adaptés au contexte sénégalais.

2. **Tokenisation**  
   - Convertir le texte en tokens (nombres), en utilisant des techniques comme **Byte Pair Encoding (BPE)** ou **WordPiece**.

3. **Entraînement d’un mini GPT (PyTorch)**  
   - Construire un modèle GPT simplifié à partir de zéro (basé sur l’architecture **nanoGPT**), incluant embeddings, self-attention, et feedforward layers.

4. **Dockerisation**  
   - Conteneuriser le modèle avec Docker pour garantir une exécution portable sur n’importe quel environnement.

5. **Déploiement Kubernetes (optionnel)**  
   - Utiliser Kubernetes pour déployer et gérer l’application à grande échelle, en assurant sa scalabilité.


## 🧱 🧱 Architecture simplifiée pour le Mini-GPT

```
📄 Textes (concours, manuels)
     ↓
🔢 Tokenisation (texte → IDs)
     ↓
🤖 Création du Mini-Modèle GPT (PyTorch)
     ↓
💬 Interface utilisateur simple
     ↓
📦 Docker + ☸️ Kubernetes (Déploiement)

```


## 📊 Planning proposé

| Etape | Objectifs |
|--------|-----------|
| Etape1 | Compréhension GPT + préparation corpus + tokenisation |
| Etape2 | Construction modèle + entraînement local |
| Etape3 | Dockerisation + déploiement Kubernetes + interface/démo |


## ✅ État d'avancement actuel

- 📌 Choix du thème : mini-GPT pour candidats aux concours 🇸🇳  
- 📂 Début de collecte de textes : sujets ENA, Bac, etc.  
- 📘 Étude de l’architecture Transformer  
- 🧪 Tokenisation en cours  
- 🐳 Docker installé + Kubernetes en cours d’apprentissage


## 🔜 Prochaines étapes

- Finaliser corpus + tokenizer  
- Créer et entraîner un mini GPT (PyTorch)  
- Créer un `Dockerfile` pour conteneuriser l'app  
- Déployer avec Kubernetes (Minikube ou cluster local)
