# Création d'un Assistant Pédagogique (pour Python)

## Roadmap

### Phase 1 : Foundation (2-3 semaines)


**Objectif** : Créer un chatbot basique avec RAG sur la documentation Python

**Setup de l'environnement:**
- Installer Python, créer un environnement virtuel
- Setup LangChain + LangGraph
- Choisir et configurer le LLM (voir stack ci-dessous)


**Création de la base de connaissances:**
- Scraper/télécharger la documentation Python officielle
- Chunking et embedding des documents
- Setup de la base vectorielle (Chroma/FAISS)


**Chatbot RAG basique:**
- Implémentation du retrieval augmented generation
- Interface simple (CLI puis Streamlit)
- Tests avec questions Python de base

### Phase 2 : Système de quêtes (3-4 semaines)

**Objectif :** Intégrer le système de quêtes existant

**Modélisation des quêtes**
- Structure de données pour les quêtes/challenges
- Base de données SQLite pour persister les données
- Système de progression utilisateur


**Agent pédagogique**
- LangGraph pour orchestrer les conversations
- États : exploration libre, quête guidée, évaluation
- Personnalisation selon le niveau de l'apprenant

### Phase 3 : Génération de contenu (4-5 semaines)

**Objectif :** L'IA peut créer de nouvelles quêtes

**Templates de génération:**
- Prompts structurés pour créer des exercices
- Validation automatique du code généré
- Système de difficulté progressive


**Évaluation automatique:**
- Exécution sécurisée de code Python
- Feedback automatique sur les solutions

### Phase 4 : MCP et interface avancée (2-3 semaines)

**Objectif :** Finaliser avec MCP et interface utilisateur
- Stack recommandée (gratuite/low-cost)
- LLM

**Option 1 (gratuite) : Ollama + Llama 3.1 8B**
- Totalement gratuit, fonctionne en local
- Performances correctes pour un prototype
- RAM nécessaire : 8-16GB

**Option 2 (low-cost) : OpenAI GPT-3.5-turbo**
- ~$0.002/1K tokens, très abordable pour un prototype
- Meilleure qualité que les modèles locaux
- Idéal pour démarrer rapidement

**Base vectorielle :** 
- Chroma : Gratuit, simple à utiliser
- Alternative : FAISS (Facebook AI)

**Framework :**
- LangChain + LangGraph : Gratuits, parfaits pour votre cas
- LangSmith : Monitoring gratuit jusqu'à 5K traces/mois

**Base de données:**
- SQLite : Gratuit, suffisant pour un prototype
- Supabase : PostgreSQL gratuit (500MB)

**Interface:**
- Streamlit : Interface web simple et gratuite
- Gradio : Alternative également gratuite

**Hébergement:**
- Streamlit Cloud : Gratuit pour projets open source
- Hugging Face Spaces : Gratuit avec GPU limité
- Railway/Render : Tiers gratuits généreux

## **Architecture technique :**

┌─────────────────┐    ┌──────────────┐    ┌─────────────┐
│   Interface     │────│  LangGraph   │────│    RAG      │
│  (Streamlit)    │    │   Agent      │    │  (Chroma)   │
└─────────────────┘    └──────────────┘    └─────────────┘
                              │                     │
                       ┌──────────────┐    ┌─────────────┐
                       │   Quests     │    │    LLM      │
                       │  Database    │    │ (Ollama/API)│
                       │  (SQLite)    │    └─────────────┘
                       └──────────────┘

### **Estimation budgétaire**

**Version 100% gratuite : 0€ :**
- Ollama + modèles open source
- Chroma + SQLite
- Streamlit Cloud

**Version low-cost optimale : ~10-20€/mois :**
- OpenAI API pour le LLM
- Supabase pour la DB
- Hosting sur Railway

**Recommandations pour commencer**
- Commencez avec la stack gratuite (Ollama + Chroma + SQLite)
- Créez d'abord un RAG simple sur la doc Python
- Itérez rapidement avec des utilisateurs test
- Migrez vers des solutions payantes seulement si nécessaire

## **Arborescence complète**

python-learning-assistant/
├── README.md
├── requirements.txt
├── .env.example
├── .gitignore
├── docker-compose.yml
├── Dockerfile
├── pyproject.toml
│
├── src/
│   ├── __init__.py
│   │
│   ├── core/
│   │   ├── __init__.py
│   │   ├── config.py              # Configuration générale
│   │   ├── database.py            # Connexions DB
│   │   ├── exceptions.py          # Exceptions personnalisées
│   │   └── logger.py              # Configuration des logs
│   │
│   ├── models/
│   │   ├── __init__.py
│   │   ├── user.py                # Modèle utilisateur
│   │   ├── quest.py               # Modèle quête
│   │   ├── progress.py            # Modèle progression
│   │   └── schemas.py             # Pydantic schemas
│   │
│   ├── rag/
│   │   ├── __init__.py
│   │   ├── document_loader.py     # Chargement des docs
│   │   ├── embeddings.py          # Gestion des embeddings
│   │   ├── vector_store.py        # Store vectoriel (Chroma)
│   │   ├── retriever.py           # Récupération contexte
│   │   └── indexer.py             # Indexation des documents
│   │
│   ├── llm/
│   │   ├── __init__.py
│   │   ├── ollama_client.py       # Client Ollama
│   │   ├── prompts.py             # Templates de prompts
│   │   ├── chains.py              # LangChain chains
│   │   └── validators.py          # Validation des réponses
│   │
│   ├── agents/
│   │   ├── __init__.py
│   │   ├── base_agent.py          # Agent de base
│   │   ├── tutor_agent.py         # Agent tuteur principal
│   │   ├── quest_generator.py     # Générateur de quêtes
│   │   ├── code_evaluator.py      # Évaluateur de code
│   │   └── state_manager.py       # Gestion des états LangGraph
│   │
│   ├── quests/
│   │   ├── __init__.py
│   │   ├── quest_manager.py       # Gestionnaire de quêtes
│   │   ├── quest_loader.py        # Chargement des quêtes
│   │   ├── progress_tracker.py    # Suivi progression
│   │   └── difficulty_adjuster.py # Ajustement difficulté
│   │
│   ├── code_execution/
│   │   ├── __init__.py
│   │   ├── sandbox.py             # Environnement sécurisé
│   │   ├── executor.py            # Exécuteur de code
│   │   ├── validator.py           # Validation du code
│   │   └── security.py            # Sécurité d'exécution
│   │
│   ├── api/
│   │   ├── __init__.py
│   │   ├── main.py                # FastAPI app
│   │   ├── routes/
│   │   │   ├── __init__.py
│   │   │   ├── chat.py            # Routes chat
│   │   │   ├── quests.py          # Routes quêtes
│   │   │   ├── users.py           # Routes utilisateurs
│   │   │   └── admin.py           # Routes admin
│   │   └── middleware/
│   │       ├── __init__.py
│   │       ├── auth.py            # Authentification
│   │       ├── rate_limit.py      # Rate limiting
│   │       └── cors.py            # CORS
│   │
│   └── utils/
│       ├── __init__.py
│       ├── text_processing.py     # Traitement de texte
│       ├── file_utils.py          # Utilitaires fichiers
│       ├── validation.py          # Validations génériques
│       └── helpers.py             # Fonctions utilitaires
│
├── ui/
│   ├── __init__.py
│   ├── streamlit_app.py           # App Streamlit principale
│   ├── components/
│   │   ├── __init__.py
│   │   ├── chat_interface.py      # Interface de chat
│   │   ├── quest_display.py       # Affichage des quêtes
│   │   ├── progress_bar.py        # Barre de progression
│   │   ├── code_editor.py         # Éditeur de code
│   │   └── sidebar.py             # Barre latérale
│   ├── styles/
│   │   ├── main.css               # Styles CSS
│   │   └── components.css         # Styles composants
│   └── assets/
│       ├── images/
│       │   ├── logo.png
│       │   └── icons/
│       └── fonts/
│
├── data/
│   ├── raw/                       # Données brutes
│   │   ├── documentation/
│   │   │   ├── python_docs/       # Doc Python officielle
│   │   │   ├── pandas_docs/       # Doc Pandas
│   │   │   └── sql_docs/          # Doc SQL
│   │   └── external_resources/
│   │
│   ├── processed/                 # Données traitées
│   │   ├── chunks/                # Documents découpés
│   │   ├── embeddings/            # Embeddings calculés
│   │   └── indexed/               # Documents indexés
│   │
│   ├── quests/                    # Quêtes pédagogiques
│   │   ├── python_basics/
│   │   │   ├── variables.json
│   │   │   ├── functions.json
│   │   │   ├── loops.json
│   │   │   └── classes.json
│   │   ├── python_intermediate/
│   │   │   ├── decorators.json
│   │   │   ├── generators.json
│   │   │   └── async.json
│   │   └── python_advanced/
│   │       ├── metaclasses.json
│   │       ├── context_managers.json
│   │       └── performance.json
│   │
│   └── databases/
│       ├── users.db               # Base utilisateurs
│       ├── progress.db            # Base progression
│       └── analytics.db           # Base analytics
│
├── vector_stores/
│   ├── chroma_db/                 # Base vectorielle Chroma
│   │   ├── python_docs/
│   │   ├── pandas_docs/
│   │   └── sql_docs/
│   └── backups/
│       └── daily/
│
├── scripts/
│   ├── setup/
│   │   ├── install_ollama.sh      # Installation Ollama
│   │   ├── download_models.sh     # Téléchargement modèles
│   │   ├── setup_database.py      # Setup base de données
│   │   └── init_vector_store.py   # Initialisation vector store
│   │
│   ├── data_processing/
│   │   ├── scrape_docs.py         # Scraping documentation
│   │   ├── process_documents.py   # Traitement documents
│   │   ├── create_embeddings.py   # Création embeddings
│   │   └── index_documents.py     # Indexation
│   │
│   ├── quest_management/
│   │   ├── create_quest.py        # Création de quête
│   │   ├── validate_quests.py     # Validation quêtes
│   │   └── export_quests.py       # Export quêtes
│   │
│   ├── maintenance/
│   │   ├── backup_data.py         # Sauvegarde données
│   │   ├── clean_logs.py          # Nettoyage logs
│   │   └── update_embeddings.py   # Mise à jour embeddings
│   │
│   └── deployment/
│       ├── deploy_streamlit.py    # Déploiement Streamlit
│       ├── health_check.py        # Vérification santé
│       └── migrate_db.py          # Migration base
│
├── tests/
│   ├── __init__.py
│   ├── conftest.py                # Configuration pytest
│   │
│   ├── unit/
│   │   ├── __init__.py
│   │   ├── test_models.py         # Tests modèles
│   │   ├── test_rag.py            # Tests RAG
│   │   ├── test_agents.py         # Tests agents
│   │   ├── test_quests.py         # Tests quêtes
│   │   └── test_utils.py          # Tests utilitaires
│   │
│   ├── integration/
│   │   ├── __init__.py
│   │   ├── test_api.py            # Tests API
│   │   ├── test_database.py       # Tests base de données
│   │   ├── test_llm_integration.py # Tests intégration LLM
│   │   └── test_end_to_end.py     # Tests bout en bout
│   │
│   ├── fixtures/
│   │   ├── sample_quests.json     # Quêtes de test
│   │   ├── sample_docs.md         # Documents de test
│   │   └── mock_responses.json    # Réponses mockées
│   │
│   └── performance/
│       ├── test_response_time.py  # Tests performance
│       ├── test_memory_usage.py   # Tests mémoire
│       └── load_tests.py          # Tests de charge
│
├── docs/
│   ├── README.md
│   ├── INSTALLATION.md            # Guide installation
│   ├── USAGE.md                   # Guide utilisation
│   ├── DEVELOPMENT.md            # Guide développement
│   ├── API.md                    # Documentation API
│   ├── CONTRIBUTING.md           # Guide contribution
│   │
│   ├── architecture/
│   │   ├── overview.md           # Vue d'ensemble
│   │   ├── rag_system.md         # Système RAG
│   │   ├── agents.md             # Architecture agents
│   │   └── database_schema.md    # Schéma base de données
│   │
│   ├── tutorials/
│   │   ├── quick_start.md        # Démarrage rapide
│   │   ├── creating_quests.md    # Création de quêtes
│   │   ├── customizing_agents.md # Personnalisation agents
│   │   └── deployment.md         # Déploiement
│   │
│   └── examples/
│       ├── simple_chat.py        # Exemple chat simple
│       ├── quest_creation.py     # Exemple création quête
│       └── custom_agent.py       # Exemple agent personnalisé
│
├── logs/
│   ├── app.log                   # Logs application
│   ├── error.log                 # Logs erreurs
│   ├── performance.log           # Logs performance
│   └── archived/                 # Logs archivés
│       └── YYYY-MM/
│
├── config/
│   ├── development.yaml          # Config développement
│   ├── production.yaml           # Config production
│   ├── logging.yaml              # Config logging
│   └── ollama_models.yaml        # Config modèles Ollama
│
└── deployment/
    ├── docker/
    │   ├── Dockerfile.app         # Dockerfile application
    │   ├── Dockerfile.ollama      # Dockerfile Ollama
    │   └── docker-compose.yml     # Compose complet
    │
    ├── kubernetes/
    │   ├── deployment.yaml        # Déploiement K8s
    │   ├── service.yaml           # Service K8s
    │   └── configmap.yaml         # ConfigMap K8s
    │
    ├── streamlit_cloud/
    │   ├── streamlit_config.toml  # Config Streamlit Cloud
    │   └── secrets.toml           # Secrets (gitignore)
    │
    └── scripts/
        ├── deploy.sh              # Script déploiement
        ├── rollback.sh            # Script rollback
        └── health_check.sh        # Script santé

### **Détails des composants principaux:**

**/src/core/**

config.py : Variables d'environnement, configuration Ollama, chemins
database.py : Connexions SQLite, migrations, pool de connexions
logger.py : Configuration des logs avec rotation automatique

**/src/rag/**

document_loader.py : Chargement docs Python, Markdown, PDF
embeddings.py : Embeddings avec sentence-transformers (gratuit)
vector_store.py : Interface Chroma, recherche sémantique
retriever.py : Récupération contexte pertinent, scoring

**/src/agents/**

tutor_agent.py : Agent principal avec LangGraph, gestion conversations
quest_generator.py : Génération automatique de quêtes
code_evaluator.py : Évaluation et correction de code Python
state_manager.py : États : libre, guidé, évaluation, aide

**/src/quests/**

quest_manager.py : CRUD quêtes, attribution selon niveau
progress_tracker.py : Suivi progression, statistiques
difficulty_adjuster.py : Ajustement automatique difficulté

**/data/quests/**

Structure JSON pour chaque quête :

In [None]:
{
  "id": "python_basics_variables",
  "title": "Les variables en Python",
  "description": "Apprendre à déclarer et utiliser des variables",
  "difficulty": "beginner",
  "estimated_time": 30,
  "prerequisites": [],
  "learning_objectives": [...],
  "steps": [...],
  "exercises": [...],
  "hints": [...],
  "solution": "...",
  "tests": [...]
}

**/scripts/setup/**

install_ollama.sh : Installation automatique Ollama
download_models.sh : Téléchargement Llama 3.1 8B
setup_database.py : Création tables SQLite
init_vector_store.py : Initialisation Chroma avec docs Python

### **Stack technique détaillée**

- LLM : Ollama + Llama 3.1 8B (gratuit, local)
- Vector Store : Chroma (gratuit, persistant)
- Embeddings : sentence-transformers/all-MiniLM-L6-v2 (gratuit)
- Database : SQLite (gratuit, intégré)
- Framework : LangChain + LangGraph (gratuit)
- UI : Streamlit (gratuit)
- API : FastAPI (gratuit)
- Deployment : Streamlit Cloud (gratuit)

### **Points clés de cette architecture :**


**Structure modulaire**

- Séparation claire entre RAG, agents, quêtes et interface
- Chaque composant peut être développé et testé indépendamment
- Facilite l'ajout de nouvelles fonctionnalités

**Évolutivité**

- Structure prête pour ajouter d'autres langages (pandas, SQL, etc.)
- Système de quêtes extensible via JSON
- Architecture microservices possible avec FastAPI

**Déploiement simple**

- Docker pour la containerisation
- Scripts d'installation automatisés
- Configuration pour Streamlit Cloud (gratuit)

**Données organisées**

- Séparation entre données brutes, traitées et vectorisées
- Système de sauvegarde intégré
- Quêtes organisées par niveau de difficulté

### **Ordre de développement recommandé :**

- Core + RAG (semaine 1-2)
- Quêtes basiques (semaine 3)
- Agents LangGraph (semaine 4-5)
- Interface Streamlit (semaine 6)
- Génération de contenu (semaine 7-8)