# 🍃 PARTIE 6 : MONGODB ET BASES NOSQL

### 🌟 Ce que vous allez apprendre :
- **Documents** : Structure JSON flexible
- **Collections** : Équivalent des tables SQL
- **Requêtes** : Find, aggregate, update
- **Index** : Performance et optimisation
- **Python** : PyMongo pour l'integration

### 🛠️ Prérequis :
- MongoDB installé (ou Docker)
- Exécutez d'abord la cellule système ci-dessous

---

In [3]:
# 📦 INSTALLATION DES PACKAGES NÉCESSAIRES
# Exécutez cette cellule en premier pour installer tous les packages requis

import subprocess
import sys

def install_package(package):
    """Installe un package Python via pip"""
    try:
        subprocess.check_call([sys.executable, "-m", "pip", "install", package])
        print(f"✅ {package} installé avec succès")
    except subprocess.CalledProcessError:
        print(f"❌ Erreur lors de l'installation de {package}")

# Liste des packages nécessaires pour ce notebook
packages = [
    "pandas>=1.5.0",
    "numpy>=1.20.0", 
    "ipywidgets>=7.6.0",
    "pymongo>=4.0.0"
]

print("🚀 Installation des packages pour MongoDB...")
print("Cela peut prendre quelques minutes...")

for package in packages:
    install_package(package)

print("\n✨ Installation terminée ! Vous pouvez maintenant exécuter les cellules suivantes.")
print("📝 Note: Redémarrez le kernel si nécessaire après l'installation.")

🚀 Installation des packages pour MongoDB...
Cela peut prendre quelques minutes...



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.1.1[0m[39;49m -> [0m[32;49m25.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


✅ pandas>=1.5.0 installé avec succès



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.1.1[0m[39;49m -> [0m[32;49m25.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


✅ numpy>=1.20.0 installé avec succès



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.1.1[0m[39;49m -> [0m[32;49m25.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


✅ ipywidgets>=7.6.0 installé avec succès
✅ pymongo>=4.0.0 installé avec succès

✨ Installation terminée ! Vous pouvez maintenant exécuter les cellules suivantes.
📝 Note: Redémarrez le kernel si nécessaire après l'installation.
✅ pymongo>=4.0.0 installé avec succès

✨ Installation terminée ! Vous pouvez maintenant exécuter les cellules suivantes.
📝 Note: Redémarrez le kernel si nécessaire après l'installation.



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.1.1[0m[39;49m -> [0m[32;49m25.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


In [2]:
# 🔧 SYSTÈME D'AIDE MONGODB (Exécuter une fois)
import sys
import os
from IPython.display import HTML, display
import ipywidgets as widgets
import pandas as pd
import json
from datetime import datetime, timedelta
import random
from pathlib import Path

# Tentative d'import PyMongo
try:
    import pymongo
    from pymongo import MongoClient
    PYMONGO_AVAILABLE = True
except ImportError:
    PYMONGO_AVAILABLE = False

class MongoHelper:
    def __init__(self):
        self.success_style = """
        <div style="background: linear-gradient(90deg, #4CAF50, #45a049); color: white; padding: 15px; border-radius: 10px; margin: 10px 0; text-align: center; font-weight: bold; font-size: 16px;">
            🍃 {message} 🍃
        </div>
        """
        self.mongo_dir = Path("mongo_data")
        self.mongo_dir.mkdir(exist_ok=True)
        self.client = None
        self.db = None
        
        # Base de données des aides cachées
        self.helps = {
            "6.1.1": {
                "hint": "Utilisez pip install pymongo pour installer le driver Python de MongoDB.",
                "solution": """# Installation via pip (dans un terminal)
# pip install pymongo

# Vérification de l'installation
try:
    import pymongo
    from pymongo import MongoClient
    print(f"✅ PyMongo version {pymongo.version} installé !")
    print("🍃 MongoDB driver prêt à utiliser")
except ImportError:
    print("❌ PyMongo non installé")
    print("👉 Installez avec: pip install pymongo")""",
                "explanation": "PyMongo est le driver officiel MongoDB pour Python. Il permet de se connecter et d'interagir avec MongoDB."
            },
            "6.1.1": {
                "hint": "Utilisez pip install pymongo pour installer le driver Python de MongoDB.",
                "solution": """# Installation via pip (dans un terminal)
# pip install pymongo

# Vérification de l'installation
try:
    import pymongo
    from pymongo import MongoClient
    print(f"✅ PyMongo version {pymongo.version} installé !")
    print("🍃 MongoDB driver prêt à utiliser")
except ImportError:
    print("❌ PyMongo non installé")
    print("👉 Installez avec: pip install pymongo")""",
                "explanation": "PyMongo est le driver officiel MongoDB pour Python. Il permet de se connecter et d'interagir avec MongoDB."
            },
            "6.1.2": {
                "hint": "MongoClient() crée une connexion. Par défaut, il se connecte à localhost:27017.",
                "solution": """from pymongo import MongoClient

# Connexion à MongoDB (local par défaut)
client = MongoClient('mongodb://localhost:27017/')

# Test de connexion
try:
    # Force une connexion pour tester
    client.server_info()
    print("✅ Connexion à MongoDB réussie !")
    
    # Sélectionner une base de données
    db = client['entreprise_db']
    print(f"📊 Base de données '{db.name}' sélectionnée")
    
    # Lister les bases existantes  
    print("\\n📋 Bases de données disponibles:")
    for db_name in client.list_database_names():
        print(f"  - {db_name}")
        
except Exception as e:
    print(f"❌ Erreur de connexion: {e}")
    print("💡 Assurez-vous que MongoDB est démarré")""",
                "explanation": "MongoClient gère automatiquement la connexion. Une base de données est créée automatiquement lors de la première écriture."
            },
            "6.2.1": {
                "hint": "insert_many() pour plusieurs documents, insert_one() pour un seul. find() récupère les documents.",
                "solution": """# Sélectionner la collection
collection = db['employes']

# Données d'exemple
employes_data = [
    {
        "nom": "Dupont", 
        "prenom": "Jean",
        "departement": "IT",
        "salaire": 55000,
        "age": 32,
        "competences": ["Python", "MongoDB", "Docker"],
        "date_embauche": datetime(2022, 3, 15)
    },
    {
        "nom": "Martin", 
        "prenom": "Marie",
        "departement": "RH", 
        "salaire": 48000,
        "age": 29,
        "competences": ["Recrutement", "Formation"],
        "date_embauche": datetime(2023, 1, 10)
    },
    {
        "nom": "Durand", 
        "prenom": "Pierre",
        "departement": "Finance",
        "salaire": 62000,
        "age": 35,
        "competences": ["Comptabilité", "Analyse financière"],
        "date_embauche": datetime(2021, 9, 1)
    }
]

# Insertion des documents
result = collection.insert_many(employes_data)
print(f"✅ {len(result.inserted_ids)} employés ajoutés")

# Vérification - lire tous les documents
print("\\n👥 EMPLOYÉS DANS LA BASE:")
for employe in collection.find():
    print(f"- {employe['prenom']} {employe['nom']} ({employe['departement']}) - {employe['salaire']}€")""",
                "explanation": "MongoDB stocke des documents JSON. insert_many() retourne les IDs générés. find() sans paramètre récupère tous les documents."
            },
            "6.2.2": {
                "hint": "find() avec des filtres JSON. update_many() et delete_many() pour modifier/supprimer.",
                "solution": """# 1. REQUÊTES DE LECTURE
print("🔍 REQUÊTES DE LECTURE")
print("="*30)

# Employés IT
print("💻 Employés IT:")
it_employes = collection.find({"departement": "IT"})
for emp in it_employes:
    print(f"  - {emp['prenom']} {emp['nom']}")

# Salaires > 50000
print("\\n💰 Salaires > 50000€:")
hauts_salaires = collection.find({"salaire": {"$gt": 50000}})
for emp in hauts_salaires:
    print(f"  - {emp['prenom']} {emp['nom']}: {emp['salaire']}€")

# 2. MISE À JOUR
print("\\n🔄 MISES À JOUR")
print("="*20)

# Augmentation salaire IT (+5%)
result_update = collection.update_many(
    {"departement": "IT"},
    {"$mul": {"salaire": 1.05}}
)
print(f"✅ {result_update.modified_count} salaires IT augmentés")

# 3. SUPPRESSION (exemple - ne supprime rien ici)
print("\\n🗑️ SUPPRESSIONS")
print("="*20)

# Compter avant suppression fictive
nb_avant = collection.count_documents({})
print(f"📊 Employés avant: {nb_avant}")

# Exemple suppression (filtre impossible pour ne rien supprimer)
result_delete = collection.delete_many({"age": {"$lt": 0}})  # Personne n'a moins de 0 ans
print(f"🗑️ {result_delete.deleted_count} employés supprimés")""",
                "explanation": "MongoDB utilise des opérateurs comme $gt (greater than), $mul (multiply). Les opérations retournent des objets avec des statistiques."
            },
            "6.3.1": {
                "hint": "aggregate() avec des pipelines. $match pour filtrer, $group pour grouper, $sort pour trier.",
                "solution": """# Pipeline d'agrégation complexe
pipeline = [
    # 1. Grouper par département
    {
        "$group": {
            "_id": "$departement",
            "nb_employes": {"$sum": 1},
            "salaire_moyen": {"$avg": "$salaire"},
            "salaire_max": {"$max": "$salaire"},
            "salaire_min": {"$min": "$salaire"},
            "age_moyen": {"$avg": "$age"}
        }
    },
    # 2. Trier par salaire moyen décroissant
    {
        "$sort": {"salaire_moyen": -1}
    },
    # 3. Ajouter des champs calculés
    {
        "$addFields": {
            "ecart_salaire": {"$subtract": ["$salaire_max", "$salaire_min"]},
            "budget_departemental": {"$multiply": ["$nb_employes", "$salaire_moyen"]}
        }
    }
]

print("📊 ANALYSE PAR DÉPARTEMENT")
print("="*40)

# Exécution de l'agrégation
resultats = collection.aggregate(pipeline)

for dept in resultats:
    print(f"\\n🏢 DÉPARTEMENT: {dept['_id']}")
    print(f"  👥 Employés: {dept['nb_employes']}")
    print(f"  💰 Salaire moyen: {dept['salaire_moyen']:.0f}€")
    print(f"  📈 Salaire max: {dept['salaire_max']:.0f}€")
    print(f"  📉 Salaire min: {dept['salaire_min']:.0f}€")
    print(f"  🎂 Âge moyen: {dept['age_moyen']:.1f} ans")
    print(f"  💸 Budget total: {dept['budget_departemental']:.0f}€")
    print(f"  📊 Écart salarial: {dept['ecart_salaire']:.0f}€")""",
                "explanation": "Les pipelines d'agrégation MongoDB sont très puissants. Chaque étape transforme les données. C'est l'équivalent des GROUP BY SQL mais plus flexible."
            },
            "6.3.2": {
                "hint": "create_index() pour créer des index. explain() pour analyser les performances. Les index composés optimisent plusieurs critères à la fois.",
                "solution": """# Optimisation complète avec index

# 1. Analyser les requêtes actuelles
print("📊 ANALYSE AVANT OPTIMISATION")
explain_before = collection.find({"categorie": "Smartphone"}).explain()
stats_before = explain_before['executionStats']
print(f"Documents examinés: {stats_before['totalDocsExamined']}")
print(f"Temps d'exécution: {stats_before['executionTimeMillis']}ms")

# 2. Créer les index optimaux
print("\\n🔧 CRÉATION DES INDEX")

# Index simple pour catégorie
collection.create_index("categorie")
print("✅ Index créé sur 'categorie'")

# Index composé catégorie + prix
collection.create_index([("categorie", 1), ("prix", -1)])
print("✅ Index composé créé sur 'categorie' + 'prix'")

# Index de recherche textuelle
collection.create_index([("nom", "text")])
print("✅ Index de texte créé sur 'nom'")

# Index partiel pour produits chers
collection.create_index(
    "prix", 
    partialFilterExpression={"prix": {"$gt": 100}}
)
print("✅ Index partiel créé pour prix > 100")

# 3. Analyser après optimisation
print("\\n📈 ANALYSE APRÈS OPTIMISATION")
explain_after = collection.find({"categorie": "Smartphone"}).explain()
stats_after = explain_after['executionStats']
print(f"Documents examinés: {stats_after['totalDocsExamined']}")
print(f"Temps d'exécution: {stats_after['executionTimeMillis']}ms")

# 4. Calculer l'amélioration
if stats_before['executionTimeMillis'] > 0:
    improvement = stats_before['executionTimeMillis'] / max(stats_after['executionTimeMillis'], 1)
    print(f"🚀 Amélioration: {improvement:.1f}x plus rapide")

# 5. Lister tous les index
print("\\n📋 INDEX CRÉÉS:")
for index in collection.list_indexes():
    print(f"  - {index['name']}: {index.get('key', {})}")

# 6. Tests de performance spécialisés
print("\\n🔍 TESTS DE RECHERCHE:")

# Recherche textuelle
texte_results = list(collection.find({"$text": {"$search": "phone"}}))
print(f"Recherche texte 'phone': {len(texte_results)} résultats")

# Recherche avec index composé
compose_results = list(collection.find({
    "categorie": "Smartphone", 
    "prix": {"$gte": 200, "$lte": 800}
}))
print(f"Recherche avec index composé: {len(compose_results)} résultats")

print("\\n✅ Optimisation terminée - Performance améliorée !")""",
                "explanation": "Les index accélèrent drastiquement les requêtes. Les index composés sont optimaux pour plusieurs critères. explain() montre l'utilisation des index."
            }
        }
    
    def solution(self, code, explanation=""):
        html = f"""
        <details style="margin: 10px 0; border: 1px solid #ddd; border-radius: 5px; padding: 5px;">
            <summary style="cursor: pointer; background: #e8f5e8; padding: 10px; border-radius: 3px; font-weight: bold;">
                🔍 Solution MongoDB (cliquer pour révéler)
            </summary>
            <div style="background: #fafafa; padding: 15px; margin-top: 10px; border-radius: 3px;">
                {f'<p><strong>🍃 Explication MongoDB:</strong> {explanation}</p>' if explanation else ''}
                <pre style="background: #f8f8f8; padding: 10px; border-radius: 3px; overflow-x: auto;"><code>{code}</code></pre>
            </div>
        </details>
        """
        display(HTML(html))
    
    def hint(self, text):
        html = f"""
        <details style="margin: 10px 0; border: 1px solid #ddd; border-radius: 5px; padding: 5px;">
            <summary style="cursor: pointer; background: #fff3e0; padding: 10px; border-radius: 3px; font-weight: bold;">
                💡 Conseil MongoDB (cliquer pour révéler)
            </summary>
            <div style="background: #fffdf7; padding: 15px; margin-top: 10px; border-radius: 3px;">
                {text}
            </div>
        </details>
        """
        display(HTML(html))
    
    def help(self, step):
        """Affiche l'aide pour une étape donnée"""
        if step not in self.helps:
            display(HTML(f"<p style='color: red;'>❌ Aide non trouvée pour l'étape {step}</p>"))
            return
            
        help_data = self.helps[step]
        html_content = f"""
        <div style="border: 1px solid #ddd; border-radius: 8px; margin: 10px 0; font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;">
            <details style="cursor: pointer;">
                <summary style="background: linear-gradient(90deg, #FFA726, #FF9800); color: white; padding: 12px; border-radius: 8px 8px 0 0; font-weight: bold;">
                    💡 Aide pour l'étape {step}
                </summary>
                <div style="padding: 15px; background: #f9f9f9;">
                    <details style="margin-bottom: 15px;">
                        <summary style="color: #1976D2; font-weight: bold; cursor: pointer; padding: 5px;">🔍 Indice</summary>
                        <div style="margin: 10px 0; padding: 10px; background: #E3F2FD; border-left: 4px solid #1976D2; border-radius: 4px;">
                            {help_data['hint']}
                        </div>
                    </details>
                    
                    <details style="margin-bottom: 15px;">
                        <summary style="color: #388E3C; font-weight: bold; cursor: pointer; padding: 5px;">✅ Solution</summary>
                        <div style="margin: 10px 0; padding: 15px; background: #E8F5E8; border-left: 4px solid #4CAF50; border-radius: 4px;">
                            <pre style="background: #2d2d2d; color: #f8f8f2; padding: 15px; border-radius: 5px; overflow-x: auto; margin: 0;"><code>{help_data['solution']}</code></pre>
                        </div>
                    </details>
                    
                    <details>
                        <summary style="color: #7B1FA2; font-weight: bold; cursor: pointer; padding: 5px;">📚 Explication</summary>
                        <div style="margin: 10px 0; padding: 10px; background: #F3E5F5; border-left: 4px solid #9C27B0; border-radius: 4px;">
                            {help_data['explanation']}
                        </div>
                    </details>
                </div>
            </details>
        </div>
        """
        display(HTML(html_content))
    
    def _test_connection(self, connection_string="mongodb://localhost:27017/"):
        """Teste la connexion MongoDB"""
        if not PYMONGO_AVAILABLE:
            return False, "PyMongo non installé"
        
        try:
            client = MongoClient(connection_string, serverSelectionTimeoutMS=3000)
            client.server_info()  # Force une connexion
            return True, "Connexion réussie"
        except Exception as e:
            return False, str(e)
    
    def _check_collection_exists(self, collection_name):
        """Vérifie si une collection existe"""
        if not self.db:
            return False
        return collection_name in self.db.list_collection_names()
    
    def _check_dataframe(self, df_name, min_rows=None):
        try:
            frame = sys._getframe(2)
            df = frame.f_globals.get(df_name, frame.f_locals.get(df_name))
            
            if df is None:
                return False, f"❌ DataFrame '{df_name}' non trouvé"
            
            if not isinstance(df, pd.DataFrame):
                return False, f"❌ '{df_name}' n'est pas un DataFrame pandas"
            
            if min_rows and len(df) < min_rows:
                return False, f"❌ DataFrame trop petit: {len(df)} lignes (minimum: {min_rows})"
            
            return True, f"✅ DataFrame '{df_name}': {df.shape[0]} lignes × {df.shape[1]} colonnes"
            
        except Exception as e:
            return False, f"❌ Erreur: {e}"
    
    def check_pymongo_button(self):
        output = widgets.Output()
        button = widgets.Button(
            description="🐍 Vérifier PyMongo",
            button_style='info',
            layout=widgets.Layout(width='200px', height='35px')
        )
        
        def on_click(b):
            with output:
                output.clear_output()
                if PYMONGO_AVAILABLE:
                    print(f"🎉 PyMongo installé !")
                    print(f"📊 Version: {pymongo.version}")
                else:
                    print("❌ PyMongo non installé")
                    print("💡 Installez avec: pip install pymongo")
        
        button.on_click(on_click)
        display(widgets.VBox([button, output]))
    
    def check_connection_button(self, connection_string="mongodb://localhost:27017/"):
        output = widgets.Output()
        button = widgets.Button(
            description="🔗 Tester Connexion",
            button_style='warning',
            layout=widgets.Layout(width='200px', height='35px')
        )
        
        def on_click(b):
            with output:
                output.clear_output()
                success, message = self._test_connection(connection_string)
                if success:
                    print(f"🎉 Connexion MongoDB réussie !")
                    print(f"🌐 Serveur: {connection_string}")
                else:
                    print(f"❌ Connexion échouée: {message}")
                    print("💡 Vérifiez que MongoDB est démarré")
        
        button.on_click(on_click)
        display(widgets.VBox([button, output]))
    
    def check_collection_button(self, collection_name, min_docs=None):
        output = widgets.Output()
        button = widgets.Button(
            description=f"📊 Vérifier {collection_name}",
            button_style='success',
            layout=widgets.Layout(width='220px', height='35px')
        )
        
        def on_click(b):
            with output:
                output.clear_output()
                if self._check_collection_exists(collection_name):
                    collection = self.db[collection_name]
                    count = collection.count_documents({})
                    print(f"🎉 Collection '{collection_name}' trouvée !")
                    print(f"📊 Documents: {count}")
                    
                    if min_docs and count < min_docs:
                        print(f"⚠️ Pas assez de documents (minimum: {min_docs})")
                    else:
                        print("✅ Données suffisantes")
                        
                    # Afficher un exemple de document
                    sample = collection.find_one()
                    if sample:
                        print("\n🔍 Exemple de document:")
                        print(json.dumps(sample, default=str, indent=2)[:200] + "...")
                else:
                    print(f"❌ Collection '{collection_name}' non trouvée")
        
        button.on_click(on_click)
        display(widgets.VBox([button, output]))
    
    def check_query_button(self, df_name, min_rows=None):
        output = widgets.Output()
        button = widgets.Button(
            description=f"🔍 Vérifier Requête",
            button_style='primary',
            layout=widgets.Layout(width='200px', height='35px')
        )
        
        def on_click(b):
            with output:
                output.clear_output()
                success, message = self._check_dataframe(df_name, min_rows)
                if success:
                    print(f"🎉 Requête réussie !")
                    print(message)
                else:
                    print(message)
        
        button.on_click(on_click)
        display(widgets.VBox([button, output]))
    
    def success(self, message):
        html = self.success_style.format(message=message)
        display(HTML(html))
    
    def demo_button(self, demo_func, button_text="🎬 Voir la démonstration"):
        output = widgets.Output()
        button = widgets.Button(
            description=button_text,
            button_style='info',
            layout=widgets.Layout(width='250px', height='35px')
        )
        
        def on_click(b):
            with output:
                output.clear_output()
                demo_func()
        
        button.on_click(on_click)
        display(widgets.VBox([button, output]))
    
    def create_sample_data(self):
        """Crée des données d'exemple au format JSON"""
        # Données produits
        produits = [
            {
                "_id": i,
                "nom": random.choice(["Laptop", "Smartphone", "Tablet", "Monitor", "Keyboard", "Mouse"]),
                "prix": round(random.uniform(50, 2000), 2),
                "categorie": random.choice(["Électronique", "Informatique", "Accessoires"]),
                "stock": random.randint(0, 100),
                "marque": random.choice(["Apple", "Samsung", "Dell", "HP", "Logitech"]),
                "date_creation": datetime.now() - timedelta(days=random.randint(1, 365)),
                "actif": random.choice([True, False]),
                "tags": random.sample(["populaire", "nouveau", "promo", "premium", "bestseller"], k=random.randint(1, 3)),
                "specs": {
                    "poids": round(random.uniform(0.1, 5.0), 2),
                    "couleur": random.choice(["noir", "blanc", "gris", "argent"]),
                    "garantie": random.randint(12, 36)
                }
            }
            for i in range(1, 101)
        ]
        
        # Données commandes
        commandes = [
            {
                "_id": i,
                "client_id": random.randint(1, 50),
                "date_commande": datetime.now() - timedelta(days=random.randint(1, 30)),
                "statut": random.choice(["en_attente", "expediee", "livree", "annulee"]),
                "total": round(random.uniform(20, 500), 2),
                "articles": [
                    {
                        "produit_id": random.randint(1, 100),
                        "quantite": random.randint(1, 5),
                        "prix_unitaire": round(random.uniform(10, 200), 2)
                    }
                    for _ in range(random.randint(1, 4))
                ],
                "adresse_livraison": {
                    "rue": f"{random.randint(1, 999)} rue {random.choice(['des Fleurs', 'de la Paix', 'du Commerce'])}",
                    "ville": random.choice(["Paris", "Lyon", "Marseille", "Toulouse", "Nice"]),
                    "code_postal": f"{random.randint(10000, 99999)}"
                }
            }
            for i in range(1, 51)
        ]
        
        # Sauvegarder en JSON
        with open(self.mongo_dir / 'produits.json', 'w', encoding='utf-8') as f:
            json.dump(produits, f, ensure_ascii=False, indent=2, default=str)
        
        with open(self.mongo_dir / 'commandes.json', 'w', encoding='utf-8') as f:
            json.dump(commandes, f, ensure_ascii=False, indent=2, default=str)
        
        return True

# Création de l'assistant MongoDB
mongo_helper = MongoHelper()

# Création des données d'exemple
mongo_helper.create_sample_data()

print("🍃 Système d'aide MongoDB chargé !")
if PYMONGO_AVAILABLE:
    print(f"✅ PyMongo disponible (version {pymongo.version})")
else:
    print("⚠️ PyMongo non installé - installez avec: pip install pymongo")
print("📁 Données d'exemple créées dans mongo_data/")
print("✨ Prêt pour MongoDB !")

🍃 Système d'aide MongoDB chargé !
✅ PyMongo disponible (version 4.15.2)
📁 Données d'exemple créées dans mongo_data/
✨ Prêt pour MongoDB !


---

## 🌟 Section 6.1 : Installation et Connexion

### 🎯 Objectif :
Installer PyMongo et se connecter à MongoDB.

### 📝 Étape 6.1.1 : Installation de PyMongo

**Instructions :**
Installer le driver Python pour MongoDB.

In [None]:
# 📝 ÉTAPE 6.1.1 : Installation PyMongo
# Installez PyMongo si ce n'est pas déjà fait :
# pip install pymongo
#
# Si vous utilisez un notebook :
# !pip install pymongo
#
# PyMongo est le driver officiel Python pour MongoDB
# Il permet de :
# - Se connecter à MongoDB
# - Exécuter des requêtes
# - Gérer les collections et documents

print("📦 Installation PyMongo")
print("Commande: pip install pymongo")
print("\nOu dans ce notebook:")
print("!pip install pymongo")

In [None]:
# ✅ VÉRIFICATION PyMongo
mongo_helper.check_pymongo_button()

### 📝 Étape 6.1.2 : Connexion à MongoDB

**Instructions :**
Établir une connexion avec MongoDB.

In [None]:
# 📝 ÉTAPE 6.1.2 : Connexion MongoDB
# Créez une connexion MongoDB :
# 1. Importez MongoClient depuis pymongo
# 2. Créez un client avec l'URL de connexion
# 3. Sélectionnez une base de données

# Options de connexion :
# - Local : mongodb://localhost:27017/
# - Docker : mongodb://localhost:27017/ (si conteneur MongoDB)
# - Atlas : mongodb+srv://user:pass@cluster.mongodb.net/

# Syntaxe :
# from pymongo import MongoClient
# client = MongoClient('mongodb://localhost:27017/')
# db = client['ma_base']

# 👇 Créez votre connexion ici :

In [None]:
# 💡 Aide pour la connexion
mongo_helper.help("6.1.2")

mongo_helper.success("Section 6.1 terminée ! Connexion MongoDB établie !")

---

## 🌟 Section 6.2 : CRUD Operations

### 🎯 Objectif :
Maîtriser Create, Read, Update, Delete avec MongoDB.

### 📝 Étape 6.2.1 : INSERT - Créer des documents

**Instructions :**
Insérer des documents dans des collections MongoDB.

In [None]:
# 📝 ÉTAPE 6.2.1 : Insertion de documents
# Créez une collection 'produits' et insérez des documents :
#
# 1. Document unique avec insert_one() :
# produit = {
#     "nom": "iPhone 15",
#     "prix": 999.99,
#     "categorie": "Smartphone",
#     "stock": 50,
#     "specs": {
#         "couleur": "noir",
#         "stockage": "128GB"
#     }
# }
# 
# 2. Plusieurs documents avec insert_many() :
# produits = [{...}, {...}, {...}]
#
# Syntaxe :
# collection = db['nom_collection']
# result = collection.insert_one(document)
# result = collection.insert_many(documents)

# 👇 Insérez vos documents ici :

### 📝 Étape 6.2.2 : FIND - Lire des documents

**Instructions :**
Récupérer des documents avec des requêtes.

In [None]:
# 📝 ÉTAPE 6.2.2 : Requêtes de lecture
# Exécutez ces requêtes sur la collection produits :
#
# 1. Tous les documents :
#    tous_produits = list(collection.find())
#
# 2. Avec filtres :
#    produits_chers = list(collection.find({"prix": {"$gt": 500}}))
#    smartphones = list(collection.find({"categorie": "Smartphone"}))
#
# 3. Projection (colonnes spécifiques) :
#    noms_prix = list(collection.find({}, {"nom": 1, "prix": 1, "_id": 0}))
#
# 4. Limitation et tri :
#    top_3_chers = list(collection.find().sort("prix", -1).limit(3))
#
# Convertissez ensuite en DataFrame pandas pour l'analyse

# 👇 Exécutez vos requêtes ici :

In [None]:
# 💡 Aide pour CRUD MongoDB
mongo_helper.help("6.2.1")

mongo_helper.success("Section 6.2 terminée ! CRUD MongoDB maîtrisé !")

---

## 🌟 Section 6.3 : Requêtes Avancées et Agrégation

### 🎯 Objectif :
Utiliser le framework d'agrégation pour des analyses complexes.

### 📝 Étape 6.3.1 : Pipeline d'agrégation

**Instructions :**
Créer des pipelines d'agrégation pour analyser les données.

In [None]:
# 📝 ÉTAPE 6.3.1 : Pipelines d'agrégation
# Créez ces pipelines d'analyse :
#
# 1. Statistiques par catégorie :
# pipeline_stats = [
#     {"$group": {
#         "_id": "$categorie",
#         "nombre_produits": {"$sum": 1},
#         "prix_moyen": {"$avg": "$prix"},
#         "prix_max": {"$max": "$prix"},
#         "stock_total": {"$sum": "$stock"}
#     }},
#     {"$sort": {"prix_moyen": -1}}
# ]
#
# 2. Produits populaires (stock faible) :
# pipeline_populaires = [
#     {"$match": {"stock": {"$lt": 30}}},
#     {"$sort": {"stock": 1}},
#     {"$project": {"nom": 1, "prix": 1, "stock": 1, "_id": 0}}
# ]
#
# 3. Prix par tranche :
# pipeline_tranches = [
#     {"$bucket": {
#         "groupBy": "$prix",
#         "boundaries": [0, 100, 500, 1000, 5000],
#         "default": "Plus de 5000",
#         "output": {"count": {"$sum": 1}}
#     }}
# ]
#
# Exécutez avec : collection.aggregate(pipeline)

# 👇 Créez vos pipelines d'agrégation ici :

### 📝 Étape 6.3.2 : Conversion vers pandas

**Instructions :**
Convertir les résultats MongoDB en DataFrames pour l'analyse.

In [None]:
# 📝 ÉTAPE 6.3.2 : MongoDB vers pandas
# Convertissez les résultats d'agrégation en DataFrames :
#
# 1. Exécuter les pipelines :
# stats_resultats = list(collection.aggregate(pipeline_stats))
# populaires_resultats = list(collection.aggregate(pipeline_populaires))
#
# 2. Convertir en DataFrames :
# df_stats_categories = pd.DataFrame(stats_resultats)
# df_produits_populaires = pd.DataFrame(populaires_resultats)
#
# 3. Analyser avec pandas :
# print(df_stats_categories.describe())
# print(df_produits_populaires.head())
#
# 4. Créer des visualisations simples :
# df_stats_categories.plot(x='_id', y='prix_moyen', kind='bar')

# 👇 Convertissez et analysez ici :

In [None]:
# 🎬 Démonstration d'agrégation complète
def demo_aggregation():
    print("📊 DÉMONSTRATION AGRÉGATION MONGODB")
    print("="*40)
    
    # Exemple de pipeline complexe
    pipeline_exemple = [
        # Étape 1: Filtrer les produits actifs
        {"$match": {"prix": {"$gt": 0}}},
        
        # Étape 2: Ajouter des champs calculés
        {"$addFields": {
            "tranche_prix": {
                "$switch": {
                    "branches": [
                        {"case": {"$lt": ["$prix", 100]}, "then": "Budget"},
                        {"case": {"$lt": ["$prix", 500]}, "then": "Moyen"},
                        {"case": {"$lt": ["$prix", 1000]}, "then": "Cher"}
                    ],
                    "default": "Premium"
                }
            }
        }},
        
        # Étape 3: Grouper par catégorie et tranche
        {"$group": {
            "_id": {
                "categorie": "$categorie",
                "tranche": "$tranche_prix"
            },
            "nombre": {"$sum": 1},
            "prix_moyen": {"$avg": "$prix"}
        }},
        
        # Étape 4: Trier par prix moyen
        {"$sort": {"prix_moyen": -1}}
    ]
    
    print("Pipeline d'agrégation complexe:")
    print("1. $match: Filtrage")
    print("2. $addFields: Calculs")
    print("3. $group: Agrégation")
    print("4. $sort: Tri")
    print("\n💡 Chaque étape transforme les données pour l'étape suivante")

mongo_helper.demo_button(demo_aggregation, "🎬 Pipeline complexe")

In [None]:
# 💡 Aide pour l'agrégation
mongo_helper.help("6.3.1")
print("📊 Statistiques par catégorie:")
print(df_stats_categories)

print("\n⚠️ Produits en rupture de stock:")
print(df_produits_populaires)

# 6. Métriques business
valeur_stock_total = df_stats_categories['stock_total'].sum()
categorie_plus_chere = df_stats_categories.loc[df_stats_categories['prix_moyen'].idxmax(), '_id']

print(f"\n💰 Valeur stock total: {valeur_stock_total} unités")
print(f"💎 Catégorie premium: {categorie_plus_chere}")""",
    "Les pipelines MongoDB sont très puissants pour l'analyse. Combinez avec pandas pour la visualisation."
)

mongo_helper.success("Section 6.3 terminée ! Agrégation MongoDB maîtrisée !")

---

## 🌟 Section 6.4 : Index et Performance

### 🎯 Objectif :
Optimiser les performances avec des index et analyser l'efficacité des requêtes.

In [None]:
# 📝 ÉTAPE 6.4 : Index et optimisation
# Créez des index pour optimiser les performances :
#
# 1. Index simple sur une colonne fréquemment recherchée :
# collection.create_index("categorie")
#
# 2. Index composé sur plusieurs colonnes :
# collection.create_index([("categorie", 1), ("prix", -1)])
#
# 3. Index de texte pour la recherche :
# collection.create_index([("nom", "text"), ("description", "text")])
#
# 4. Index partiel (avec condition) :
# collection.create_index("prix", partialFilterExpression={"prix": {"$gt": 100}})
#
# Analysez les performances avec :
# result = collection.find({"categorie": "Smartphone"}).explain()
#
# Listez les index existants :
# indexes = list(collection.list_indexes())

print("📋 GESTION DES INDEX MONGODB:")
print("="*30)
print("🔧 Créer des index:")
print("  collection.create_index('champ')            # Simple")
print("  collection.create_index([('a', 1), ('b', -1)]) # Composé")
print("  collection.create_index([('text', 'text')])  # Recherche texte")
print("\n📊 Analyser les performances:")
print("  collection.find(query).explain()['executionStats']")
print("\n🔍 Gestion:")
print("  collection.list_indexes()                   # Lister")
print("  collection.drop_index('nom_index')          # Supprimer")

# Exemple pratique d'optimisation
optimisation_exemple = """
# AVANT: Requête lente sans index
# Temps: 50ms pour 10000 documents
collection.find({"categorie": "Smartphone", "prix": {"$gt": 500}})

# OPTIMISATION: Créer index composé
collection.create_index([("categorie", 1), ("prix", 1)])

# APRÈS: Même requête avec index
# Temps: 2ms pour 10000 documents
# Amélioration: 25x plus rapide !
"""

print("\n⚡ EXEMPLE D'OPTIMISATION:")
print(optimisation_exemple)

# 👇 Créez vos index ici :

In [None]:
# 💡 Aide complète pour les index
mongo_helper.help("6.3.2")
mongo_helper.help("6.3.2")

mongo_helper.success("FÉLICITATIONS ! Vous maîtrisez MongoDB complètement !")

In [None]:
# 🎉 VALIDATION FINALE MONGODB
mongo_helper.success("MAÎTRE MONGODB ! NoSQL maîtrisé !")

print("\n🏆 COMPÉTENCES MONGODB ACQUISES :")
print("✅ Installation et connexion PyMongo")
print("✅ CRUD operations complètes")
print("✅ Requêtes avancées et filtres")
print("✅ Framework d'agrégation")
print("✅ Pipelines de transformation")
print("✅ Index et optimisation des performances")
print("✅ Intégration avec pandas")
print("✅ Recherche textuelle")
print("✅ Gestion des documents complexes")

print("\n🚀 VOUS MAÎTRISEZ MAINTENANT :")
print("🐍 Python avancé et structures de données")
print("📊 Pandas pour l'analyse de données")
print("🏭 ETL et pipelines de données")
print("🗄️ SQLite et bases relationnelles")
print("🐳 Docker et containerisation")
print("🍃 MongoDB et bases NoSQL")

print("\n📚 RESSOURCES POUR ALLER PLUS LOIN :")
print("📖 MongoDB University: https://university.mongodb.com")
print("🎯 PyMongo docs: https://pymongo.readthedocs.io")
print("🛠️ MongoDB Compass (GUI): https://www.mongodb.com/products/compass")
print("☁️ MongoDB Atlas (Cloud): https://www.mongodb.com/cloud/atlas")

print("\n🎯 PROCHAINES ÉTAPES SUGGÉRÉES :")
print("🔗 APIs REST avec FastAPI")
print("📊 Visualisation avec Plotly/Streamlit")
print("🤖 Machine Learning avec scikit-learn")
print("☁️ Déploiement cloud (AWS, GCP, Azure)")
print("⚡ Microservices et architecture moderne")