# MongoDB for Data Engineers

Ce module pr√©sente **MongoDB**, la base de donn√©es NoSQL documentaire la plus populaire.

---

## Pr√©requis

| Niveau | Comp√©tence |
|--------|------------|
| ‚úÖ Requis | Avoir suivi le module `08_intro_big_data_distributed` |
| ‚úÖ Requis | Comprendre les 5V du Big Data |
| ‚úÖ Requis | Comprendre CAP |
| ‚úÖ Requis | Conna√Ætre le format JSON |

## Objectifs du module

√Ä la fin de ce notebook, tu seras capable de :

- Configurer MongoDB Atlas (gratuit, cloud)
- Ma√Ætriser le CRUD (Create, Read, Update, Delete)
- Utiliser les op√©rateurs de filtrage et comparaison
- √âcrire des agr√©gations
- Cr√©er des index pour optimiser les performances

---

## MongoDB dans l'√©cosyst√®me Big Data

Tu as vu dans le module pr√©c√©dent que MongoDB est une base **NoSQL documentaire**. Voici comment elle r√©pond aux d√©fis du Big Data :

### Rappel : Les 5V

| V | Comment MongoDB r√©pond |
|---|------------------------|
| **Volume** | Sharding horizontal (donn√©es r√©parties sur plusieurs serveurs) |
| **Velocity** | √âcritures rapides, r√©plication temps r√©el |
| **Variety** | Sch√©ma flexible (JSON), pas de structure rigide |
| **Veracity** | Validation de sch√©ma optionnelle |
| **Value** | Agr√©gations puissantes, int√©gration BI |

### Rappel : CAP & BASE

| Concept | MongoDB |
|---------|--------|
| **CAP** | CP (Consistency + Partition tolerance) par d√©faut |
| **BASE** | Coh√©rence configurable (forte ou √©ventuelle) |

---

**üí° Pas d'installation n√©cessaire** : Tout se fait dans le cloud avec MongoDB Atlas !

**üìù Note** : Les commandes s'ex√©cutent dans **MongoDB Shell** ou **l'interface web Atlas**.

---

# Partie 1 : C'est quoi MongoDB ?

## 1.1 Explication simple

**MongoDB** est une base de donn√©es qui stocke les donn√©es au format **JSON** (comme des fichiers texte structur√©s).

### Comparaison : SQL vs MongoDB

**Base de donn√©es SQL** (MySQL, PostgreSQL) :
```sql
Table : employes
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ id ‚îÇ   nom    ‚îÇ age ‚îÇ ville ‚îÇ salaire ‚îÇ
‚îú‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îº‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î§
‚îÇ 1  ‚îÇ Alice    ‚îÇ 25  ‚îÇ Paris ‚îÇ 45000   ‚îÇ
‚îÇ 2  ‚îÇ Bob      ‚îÇ 30  ‚îÇ Lyon  ‚îÇ 50000   ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

-- Requ√™te SQL
SELECT * FROM employes WHERE ville = 'Paris';
```

**MongoDB** (NoSQL) :
```javascript
Collection : employes
[
  {
    "_id": 1,
    "nom": "Alice",
    "age": 25,
    "ville": "Paris",
    "salaire": 45000,
    "competences": ["Python", "SQL"]
  },
  {
    "_id": 2,
    "nom": "Bob",
    "age": 30,
    "ville": "Lyon",
    "salaire": 50000,
    "competences": ["Java", "Docker"]
  }
]

// Requ√™te MongoDB
db.employes.find({ ville: "Paris" })
```

### Diff√©rences principales :

| Aspect | SQL | MongoDB |
|--------|-----|----------|
| **Structure** | Tableaux avec colonnes fixes | Documents JSON flexibles |
| **Sch√©ma** | Rigide (d√©fini √† l'avance) | Flexible (peut changer) |
| **Format** | Lignes et colonnes | Documents JSON |
| **Tableaux** | Difficile (tables s√©par√©es) | Facile (int√©gr√©) |
| **Langage** | SQL | JavaScript/JSON |

## 1.2 Vocabulaire de base

| SQL | MongoDB | Explication | Exemple |
|-----|---------|-------------|----------|
| **Database** | **Database** | Conteneur principal | `entreprise` |
| **Table** | **Collection** | Groupe de donn√©es similaires | `employes`, `produits` |
| **Row** | **Document** | Une entr√©e de donn√©es | `{nom: "Alice", age: 25}` |
| **Column** | **Field** | Un attribut | `nom`, `age`, `ville` |

### Structure visuelle :

```
MongoDB Server
  ‚îî‚îÄ‚îÄ Database: ma_boutique
       ‚îú‚îÄ‚îÄ Collection: clients
       ‚îÇ    ‚îú‚îÄ‚îÄ Document 1: { nom: "Alice", email: "alice@email.com" }
       ‚îÇ    ‚îî‚îÄ‚îÄ Document 2: { nom: "Bob", email: "bob@email.com" }
       ‚îÇ
       ‚îî‚îÄ‚îÄ Collection: produits
            ‚îú‚îÄ‚îÄ Document 1: { nom: "Laptop", prix: 899 }
            ‚îî‚îÄ‚îÄ Document 2: { nom: "Souris", prix: 29 }
```

## 1.3 Format des documents

MongoDB stocke les donn√©es en **BSON** (Binary JSON).

### Exemple de document complet :

```javascript
{
  "_id": ObjectId("507f1f77bcf86cd799439011"),  // ID unique automatique
  "nom": "Alice Dupont",                        // String (texte)
  "age": 28,                                     // Number (entier)
  "salaire": 55000.50,                           // Number (d√©cimal)
  "actif": true,                                 // Boolean (vrai/faux)
  "date_embauche": ISODate("2022-01-15"),       // Date
  "competences": ["Python", "SQL", "MongoDB"],  // Array (tableau)
  "adresse": {                                   // Object (objet imbriqu√©)
    "rue": "123 Main St",
    "ville": "Paris",
    "code_postal": "75001"
  },
  "notes": null                                  // Null (vide)
}
```

### Points importants :

- Chaque document a un champ `_id` unique (cr√©√© automatiquement si absent)
- On peut imbriquer des objets et des tableaux
- Pas besoin que tous les documents aient les m√™mes champs
- La syntaxe ressemble √† JavaScript/JSON

## 1.4 Pourquoi utiliser MongoDB en Data Engineering ?

### Avantages :

**1. Flexibilit√© du sch√©ma**

- Pas besoin de d√©finir la structure √† l'avance
- Parfait pour des donn√©es qui changent souvent
- Chaque document peut √™tre diff√©rent

```javascript
// Document 1 : simple
{ nom: "Alice", age: 25 }

// Document 2 : plus d√©taill√© (dans la m√™me collection !)
{ nom: "Bob", age: 30, ville: "Lyon", competences: ["Python"], manager: "Alice" }
```

**2. Format JSON natif**

- Les APIs web utilisent JSON
- Pas de conversion n√©cessaire
- Facile √† lire et manipuler

**3. Performance**

- Lectures et √©critures tr√®s rapides
- G√®re facilement des millions de documents
- Scalabilit√© horizontale (ajouter des serveurs)

**4. Donn√©es imbriqu√©es**

- Stocke des structures complexes facilement
- Pas besoin de multiples tables et jointures

```javascript
// Tout dans un seul document !
{
  "commande_id": "CMD001",
  "client": { "nom": "Alice", "email": "alice@example.com" },
  "articles": [
    { "produit": "Laptop", "quantite": 1, "prix": 899 },
    { "produit": "Souris", "quantite": 2, "prix": 29 }
  ],
  "total": 957
}
```

## 1.5 Quand utiliser MongoDB ?

### Utilisez MongoDB pour :

| Cas d'usage | Pourquoi |
|-------------|----------|
|  **Applications web/mobile** | API JSON, scalabilit√© |
|  **Collecte de logs** | Volume √©lev√©, structure flexible |
|  **E-commerce (catalogues)** | Produits avec attributs variables |
|  **Donn√©es IoT** | Millions d'√©critures/seconde |
|  **CMS (contenu)** | Structures diverses |
|  **Prototypage rapide** | Pas de sch√©ma pr√©d√©fini |
|  **Donn√©es JSON d'APIs** | Format natif |

### N'utilisez PAS MongoDB pour :

| Cas d'usage | Pr√©f√©rez SQL |
|-------------|---------------|
|  **Transactions bancaires** | Besoin d'ACID strict |
|  **Relations multiples complexes** | Nombreuses jointures |
|  **Reporting BI traditionnel** | Requ√™tes SQL ad-hoc |
|  **Data Warehouse** | Sch√©ma en √©toile |

### üí° R√®gle simple :

- Donn√©es **flexibles**, **JSON**, **volume √©lev√©** ‚Üí **MongoDB**  
- Donn√©es **structur√©es**, **relations strictes**, **transactions complexes** ‚Üí **SQL (PostgreSQL, MySQL)**

---

# Partie 2 : Setup MongoDB Atlas

## 2.1 Pourquoi MongoDB Atlas ?

**MongoDB Atlas** = MongoDB h√©berg√© dans le cloud (gratuit)

### Avantages :

**Gratuit** : Tier M0 avec 512 MB de stockage  
**Pas d'installation** : Tout dans le navigateur  
**Interface graphique** : Data Explorer facile  
**S√©curis√©** : Backup automatique  
**MongoDB Shell int√©gr√©** : Testez vos commandes directement  

## 2.2 Cr√©er votre compte (5 minutes)

### ‚ñ∂Ô∏è √âtape 1 : Inscription

1. Allez sur üëâ **[cloud.mongodb.com](https://cloud.mongodb.com/)**
2. Cliquez sur **"Try Free"**
3. Inscrivez-vous avec email/mot de passe (ou Google)

### ‚ñ∂Ô∏è √âtape 2 : Cr√©er un cluster gratuit

1. Choisissez **M0 (FREE)** üéâ
2. **Provider** : AWS (ou Google Cloud/Azure)
3. **R√©gion** : Choisissez proche de vous
   - Europe : Frankfurt, Paris, London
   - Am√©rique : N. Virginia, Oregon
   - Asie : Singapore, Mumbai
4. **Cluster Name** : `Cluster0` (par d√©faut, vous pouvez changer)
5. Cliquez **"Create"**

‚è≥ **Attendez 2-3 minutes** que le cluster se cr√©e

### ‚ñ∂Ô∏è √âtape 3 : Cr√©er un utilisateur

1. Dans la popup de s√©curit√© :
2. **Authentication Method** : Username and Password
3. **Username** : `admin` (ou votre choix)
4. **Password** : Cr√©ez un mot de passe fort
   - ‚ö†Ô∏è **NOTEZ-LE BIEN** quelque part !
5. Cliquez **"Create User"**

### ‚ñ∂Ô∏è √âtape 4 : Autoriser l'acc√®s

1. Dans la popup : **"Where would you like to connect from?"**
2. Choisissez **"My Local Environment"**
3. Option 1 (recommand√©e pour apprendre) :
   - Cliquez **"Add My Current IP Address"**
4. Option 2 (plus simple mais moins s√©curis√©e) :
   - Mettez `0.0.0.0/0` pour autoriser toutes les IPs
5. Cliquez **"Finish and Close"**

‚úÖ **Votre cluster est pr√™t !**

## 2.3 Acc√©der √† MongoDB Shell

### M√©thode 1 : MongoDB Shell Web (le plus simple)

1. Dans MongoDB Atlas, allez sur **"Database"** (menu gauche)
2. Cliquez sur **"Browse Collections"** sur votre cluster
3. En bas de page, cliquez sur l'onglet **"MongoDB Shell"** ou **">_ mongosh"**
4. Une console s'ouvre dans le navigateur 

### M√©thode 2 : Data Explorer (interface graphique)

1. Cliquez sur **"Browse Collections"**
2. Vous pouvez cr√©er des bases de donn√©es et collections visuellement
3. Pratique pour visualiser, mais on va utiliser des commandes

### üí° Dans ce tutoriel

Toutes les commandes ci-dessous sont √† taper dans :
- **MongoDB Shell Web** (dans Atlas)
- Ou **mongosh** (si vous l'installez localement)
- Ou **Data Explorer** ‚Üí Insert Document (pour ajouter des donn√©es)

**On utilise la syntaxe JavaScript/MongoDB, pas Python !**

---

# 3Ô∏è‚É£ Partie 3 : Commandes MongoDB de base

## 3.1 Cr√©er une base de donn√©es et une collection

### Cr√©er/S√©lectionner une base de donn√©es

```javascript
// Cr√©er ou utiliser la base de donn√©es "ma_premiere_db"
use ma_premiere_db
```

**Note** : La base de donn√©es n'est cr√©√©e r√©ellement que quand vous ins√©rez des donn√©es.

### Voir la base de donn√©es actuelle

```javascript
db
```

### Lister toutes les bases de donn√©es

```javascript
show dbs
```

### Lister les collections

```javascript
show collections
```

## 3.2 CREATE - Ins√©rer des documents

### Ins√©rer UN document

```javascript
// Cr√©er la collection "employes" et ins√©rer un document
db.employes.insertOne({
  nom: "Alice Dupont",
  age: 28,
  poste: "Data Engineer",
  salaire: 55000,
  ville: "Paris"
})
```

**R√©sultat** :
```javascript
{
  acknowledged: true,
  insertedId: ObjectId("507f1f77bcf86cd799439011")
}
```

### Ins√©rer PLUSIEURS documents

```javascript
db.employes.insertMany([
  {
    nom: "Bob Martin",
    age: 32,
    poste: "Data Analyst",
    salaire: 48000,
    ville: "Lyon"
  },
  {
    nom: "Charlie Dubois",
    age: 35,
    poste: "Data Scientist",
    salaire: 65000,
    ville: "Paris"
  },
  {
    nom: "David Laurent",
    age: 29,
    poste: "Data Engineer",
    salaire: 58000,
    ville: "Marseille"
  },
  {
    nom: "Eve Bernard",
    age: 26,
    poste: "Data Analyst",
    salaire: 45000,
    ville: "Lyon"
  }
])
```

**R√©sultat** :
```javascript
{
  acknowledged: true,
  insertedIds: {
    '0': ObjectId("..."),
    '1': ObjectId("..."),
    '2': ObjectId("..."),
    '3': ObjectId("...")
  }
}
```

## 3.3 READ - Lire des documents

### Lire TOUS les documents

```javascript
db.employes.find()
```

### Lire avec un affichage format√© (pretty)

```javascript
db.employes.find().pretty()
```

### Lire UN seul document

```javascript
db.employes.findOne()
```

### Filtrer : employ√©s √† Paris

```javascript
db.employes.find({ ville: "Paris" })
```

### Filtrer : salaire sup√©rieur √† 50000

```javascript
db.employes.find({ salaire: { $gt: 50000 } })
```

**Op√©rateurs de comparaison** :
- `$gt` : greater than (>)
- `$gte` : greater than or equal (>=)
- `$lt` : less than (<)
- `$lte` : less than or equal (<=)
- `$eq` : equal (=)
- `$ne` : not equal (!=)

### Filtrer avec plusieurs conditions (AND)

```javascript
// Employ√©s √† Paris avec salaire > 50000
db.employes.find({
  ville: "Paris",
  salaire: { $gt: 50000 }
})
```

### Filtrer avec OR

```javascript
// Employ√©s √† Paris OU Lyon
db.employes.find({
  $or: [
    { ville: "Paris" },
    { ville: "Lyon" }
  ]
})
```

### S√©lectionner certains champs seulement (projection)

```javascript
// Afficher seulement nom et salaire (sans _id)
db.employes.find(
  {},
  { nom: 1, salaire: 1, _id: 0 }
)
```

**Note** : `1` = inclure, `0` = exclure

## 3.4 Trier, limiter, compter

### Trier par salaire (croissant)

```javascript
db.employes.find().sort({ salaire: 1 })
```

### Trier par salaire (d√©croissant)

```javascript
db.employes.find().sort({ salaire: -1 })
```

**Note** : `1` = croissant, `-1` = d√©croissant

### Limiter les r√©sultats (top 3)

```javascript
// Top 3 salaires
db.employes.find().sort({ salaire: -1 }).limit(3)
```

### Sauter des r√©sultats (pagination)

```javascript
// Sauter les 2 premiers, afficher les 3 suivants
db.employes.find().skip(2).limit(3)
```

### Compter les documents

```javascript
// Compter tous les employ√©s
db.employes.countDocuments()

// Compter les employ√©s √† Paris
db.employes.countDocuments({ ville: "Paris" })

// Compter les employ√©s avec salaire > 50000
db.employes.countDocuments({ salaire: { $gt: 50000 } })
```

## 3.5 UPDATE - Modifier des documents

### Modifier UN document

```javascript
// Augmenter le salaire d'Alice
db.employes.updateOne(
  { nom: "Alice Dupont" },           // Condition
  { $set: { salaire: 60000 } }       // Modification
)
```

**R√©sultat** :
```javascript
{
  acknowledged: true,
  matchedCount: 1,
  modifiedCount: 1
}
```

### Modifier PLUSIEURS documents

```javascript
// Augmenter tous les salaires de Lyon de 2000‚Ç¨
db.employes.updateMany(
  { ville: "Lyon" },
  { $inc: { salaire: 2000 } }       // $inc = incr√©menter
)
```

### Op√©rateurs de modification

```javascript
// $set : d√©finir une valeur
{ $set: { ville: "Paris" } }

// $inc : incr√©menter
{ $inc: { age: 1 } }

// $mul : multiplier
{ $mul: { salaire: 1.1 } }  // Augmentation de 10%

// $unset : supprimer un champ
{ $unset: { notes: "" } }

// $rename : renommer un champ
{ $rename: { "nom": "nom_complet" } }
```

### Ajouter un champ √† tous les documents

```javascript
db.employes.updateMany(
  {},
  { $set: { actif: true } }
)
```

## 3.6 DELETE - Supprimer des documents

### Supprimer UN document

```javascript
db.employes.deleteOne({ nom: "Test User" })
```

### Supprimer PLUSIEURS documents

```javascript
// Supprimer tous les employ√©s de Test
db.employes.deleteMany({ ville: "Test" })
```

### ‚ö†Ô∏è Supprimer TOUS les documents

```javascript
// ATTENTION : Supprime tout !
db.employes.deleteMany({})
```

### Supprimer une collection enti√®re

```javascript
db.employes.drop()
```

### Supprimer une base de donn√©es

```javascript
db.dropDatabase()
```

---

# 4Ô∏è‚É£ Partie 4 : Agr√©gations simples

## 4.1 Grouper et compter

### Compter les employ√©s par ville

```javascript
db.employes.aggregate([
  {
    $group: {
      _id: "$ville",              // Grouper par ville
      nombre: { $sum: 1 }         // Compter
    }
  }
])
```

**R√©sultat** :
```javascript
[
  { _id: "Paris", nombre: 2 },
  { _id: "Lyon", nombre: 2 },
  { _id: "Marseille", nombre: 1 }
]
```

### Salaire moyen par ville

```javascript
db.employes.aggregate([
  {
    $group: {
      _id: "$ville",
      nombre: { $sum: 1 },
      salaire_moyen: { $avg: "$salaire" },
      salaire_max: { $max: "$salaire" },
      salaire_min: { $min: "$salaire" }
    }
  },
  {
    $sort: { salaire_moyen: -1 }   // Trier par salaire moyen d√©croissant
  }
])
```

### Grouper par poste

```javascript
db.employes.aggregate([
  {
    $group: {
      _id: "$poste",
      nombre: { $sum: 1 },
      salaire_moyen: { $avg: "$salaire" }
    }
  }
])
```

## 4.2 Filtrer avant d'agr√©ger

```javascript
// Statistiques pour les employ√©s avec salaire > 50000
db.employes.aggregate([
  {
    $match: { salaire: { $gt: 50000 } }   // Filtrer d'abord
  },
  {
    $group: {
      _id: "$ville",
      nombre: { $sum: 1 },
      salaire_moyen: { $avg: "$salaire" }
    }
  }
])
```

## 4.3 Statistiques globales

```javascript
// Statistiques sur tous les salaires
db.employes.aggregate([
  {
    $group: {
      _id: null,                          // null = pas de groupement
      total_employes: { $sum: 1 },
      salaire_moyen: { $avg: "$salaire" },
      salaire_total: { $sum: "$salaire" },
      salaire_max: { $max: "$salaire" },
      salaire_min: { $min: "$salaire" }
    }
  }
])
```

---

# R√©sum√©

## Ce que vous avez appris 

### Concepts
1. **MongoDB** = Base de donn√©es NoSQL (documents JSON)
2. **Vocabulaire** : Database ‚Üí Collection ‚Üí Document ‚Üí Field
3. **Diff√©rence SQL/NoSQL** : Structure fixe vs flexible
4. **Quand utiliser MongoDB** : APIs, logs, IoT, e-commerce

### Commandes essentielles

```javascript
// BASES
use ma_db                    // Cr√©er/utiliser DB
show dbs                     // Lister les DBs
show collections             // Lister les collections

// CREATE
db.collection.insertOne({...})
db.collection.insertMany([{...}, {...}])

// READ
db.collection.find()                     // Tout
db.collection.find({ ville: "Paris" })   // Filtr√©
db.collection.findOne()
db.collection.find().sort({ age: -1 })   // Tri√©
db.collection.find().limit(5)            // Limit√©
db.collection.countDocuments()

// UPDATE
db.collection.updateOne({ _id: 1 }, { $set: { age: 30 } })
db.collection.updateMany({ ville: "Lyon" }, { $inc: { salaire: 1000 } })

// DELETE
db.collection.deleteOne({ _id: 1 })
db.collection.deleteMany({ ville: "Test" })

// AGGREGATE
db.collection.aggregate([
  { $group: { _id: "$ville", count: { $sum: 1 } } }
])
```

## Op√©rateurs importants üìù

### Comparaison
- `$gt` : > (greater than)
- `$gte` : >= (greater than or equal)
- `$lt` : < (less than)
- `$lte` : <= (less than or equal)
- `$eq` : = (equal)
- `$ne` : != (not equal)

### Modification
- `$set` : D√©finir une valeur
- `$inc` : Incr√©menter
- `$mul` : Multiplier
- `$unset` : Supprimer un champ

### Agr√©gation
- `$sum` : Somme
- `$avg` : Moyenne
- `$max` : Maximum
- `$min` : Minimum
- `$group` : Grouper
- `$match` : Filtrer

---

# 5Ô∏è‚É£ Partie 5 : Index ‚Äî Optimiser les performances

## 5.1 Pourquoi les index ?

Sans index, MongoDB doit scanner **tous** les documents pour trouver ceux qui correspondent au filtre. Avec un index, la recherche est **beaucoup plus rapide**.

| Sans index | Avec index |
|------------|------------|
| Scan complet (lent) | Recherche directe (rapide) |
| O(n) | O(log n) |
| 1M docs = 1M comparaisons | 1M docs = ~20 comparaisons |

---

## 5.2 Cr√©er un index

### Index simple (un champ)

```javascript
// Index sur le champ "email" (croissant)
db.employes.createIndex({ email: 1 })

// Index sur le champ "salaire" (d√©croissant)
db.employes.createIndex({ salaire: -1 })
```

### Index compos√© (plusieurs champs)

```javascript
// Index sur ville + poste (pour requ√™tes fr√©quentes)
db.employes.createIndex({ ville: 1, poste: 1 })
```

### Index unique

```javascript
// Emp√™che les doublons sur email
db.employes.createIndex({ email: 1 }, { unique: true })
```

---

## 5.3 G√©rer les index

```javascript
// Lister tous les index
db.employes.getIndexes()

// Supprimer un index
db.employes.dropIndex({ email: 1 })

// Supprimer tous les index (sauf _id)
db.employes.dropIndexes()
```

---

## 5.4 Analyser les performances

```javascript
// Voir le plan d'ex√©cution
db.employes.find({ ville: "Paris" }).explain("executionStats")
```

**Regarder** :

- `totalDocsExamined` : Combien de documents scann√©s
- `executionTimeMillis` : Temps d'ex√©cution
- `stage: "IXSCAN"` = Index utilis√© ‚úÖ
- `stage: "COLLSCAN"` = Scan complet ‚ùå

---

## 5.5 Bonnes pratiques

| R√®gle | Explication |
|-------|-------------|
| Indexer les champs de filtrage fr√©quents | `ville`, `email`, `date` |
| Indexer les champs de tri | `ORDER BY` = index |
| Pas trop d'index | Chaque index ralentit les √©critures |
| Index compos√© : ordre important | Le champ le plus filtrant en premier |

---

# 6Ô∏è‚É£ Partie 6 : Recherche avanc√©e

## 6.1 Recherche avec expressions r√©guli√®res

```javascript
// Noms commen√ßant par "A"
db.employes.find({ nom: { $regex: "^A" } })

// Noms contenant "dupont" (insensible √† la casse)
db.employes.find({ nom: { $regex: "dupont", $options: "i" } })

// Emails Gmail
db.employes.find({ email: { $regex: "@gmail\.com$" } })
```

---

## 6.2 Op√©rateurs de tableau

```javascript
// Document avec un tableau
db.employes.insertOne({
  nom: "Alice",
  competences: ["Python", "SQL", "MongoDB"]
})

// Trouver ceux qui ont "Python" dans leurs comp√©tences
db.employes.find({ competences: "Python" })

// Trouver ceux qui ont Python ET SQL
db.employes.find({ competences: { $all: ["Python", "SQL"] } })

// Trouver ceux qui ont au moins 3 comp√©tences
db.employes.find({ competences: { $size: 3 } })
```

---

## 6.3 Recherche dans les objets imbriqu√©s

```javascript
// Document avec objet imbriqu√©
db.employes.insertOne({
  nom: "Bob",
  adresse: {
    ville: "Paris",
    code_postal: "75001"
  }
})

// Rechercher par ville imbriqu√©e (notation point√©e)
db.employes.find({ "adresse.ville": "Paris" })

// Rechercher par code postal
db.employes.find({ "adresse.code_postal": { $regex: "^75" } })
```

---

## Cheatsheet : SQL vs MongoDB

| Op√©ration | SQL | MongoDB |
|-----------|-----|--------|
| **Tout s√©lectionner** | `SELECT * FROM table` | `db.collection.find()` |
| **Filtrer** | `WHERE col = 'val'` | `find({ col: 'val' })` |
| **Sup√©rieur √†** | `WHERE col > 10` | `find({ col: { $gt: 10 } })` |
| **ET** | `WHERE a = 1 AND b = 2` | `find({ a: 1, b: 2 })` |
| **OU** | `WHERE a = 1 OR b = 2` | `find({ $or: [{a:1}, {b:2}] })` |
| **IN** | `WHERE col IN (1,2,3)` | `find({ col: { $in: [1,2,3] } })` |
| **LIKE** | `WHERE col LIKE '%val%'` | `find({ col: { $regex: 'val' } })` |
| **Projection** | `SELECT a, b FROM` | `find({}, { a:1, b:1 })` |
| **Trier** | `ORDER BY col ASC` | `.sort({ col: 1 })` |
| **Limiter** | `LIMIT 10` | `.limit(10)` |
| **Compter** | `SELECT COUNT(*)` | `.countDocuments()` |
| **Grouper** | `GROUP BY col` | `aggregate([{$group:{_id:'$col'}}])` |
| **Insert** | `INSERT INTO ... VALUES` | `insertOne({...})` |
| **Update** | `UPDATE ... SET ... WHERE` | `updateOne({filter}, {$set:{...}})` |
| **Delete** | `DELETE FROM ... WHERE` | `deleteOne({filter})` |

---

## Exercices pratiques ‚Äî √Ä toi de jouer !

### Collection disponible : `employes`
```javascript
{ nom, age, poste, salaire, ville, competences: [...] }
```

---

### Exercice 1 ‚Äî Facile
Trouver tous les employ√©s qui habitent √† Lyon.

<details><summary>üí° Solution</summary>

```javascript
db.employes.find({ ville: "Lyon" })
```
</details>

---

### Exercice 2 ‚Äî Facile
Compter le nombre total d'employ√©s.

<details><summary>üí° Solution</summary>

```javascript
db.employes.countDocuments()
```
</details>

---

### Exercice 3 ‚Äî Interm√©diaire
Trouver les 3 employ√©s les mieux pay√©s (nom et salaire uniquement).

<details><summary>üí° Solution</summary>

```javascript
db.employes.find({}, { nom: 1, salaire: 1, _id: 0 })
  .sort({ salaire: -1 })
  .limit(3)
```
</details>

---

### Exercice 4 ‚Äî Interm√©diaire
Augmenter de 5% le salaire de tous les Data Engineers.

<details><summary>üí° Solution</summary>

```javascript
db.employes.updateMany(
  { poste: "Data Engineer" },
  { $mul: { salaire: 1.05 } }
)
```
</details>

---

### Exercice 5 ‚Äî Avanc√©
Calculer le salaire moyen par poste, tri√© du plus √©lev√© au plus bas.

<details><summary>üí° Solution</summary>

```javascript
db.employes.aggregate([
  { $group: { _id: "$poste", salaire_moyen: { $avg: "$salaire" } } },
  { $sort: { salaire_moyen: -1 } }
])
```
</details>

---

### Exercice 6 ‚Äî Avanc√©
Trouver les employ√©s qui ont "Python" dans leurs comp√©tences et gagnent plus de 50000‚Ç¨.

<details><summary>üí° Solution</summary>

```javascript
db.employes.find({
  competences: "Python",
  salaire: { $gt: 50000 }
})
```
</details>

---

# Quiz Final

Testez vos connaissances !

### ‚ùì Q1. Quelle est la diff√©rence principale entre SQL et MongoDB ?
a) SQL est gratuit, MongoDB est payant  
b) SQL utilise des tableaux avec un sch√©ma fixe, MongoDB utilise des documents JSON flexibles  
c) SQL est plus rapide que MongoDB  
d) MongoDB ne peut pas stocker de nombres

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì SQL utilise des **tableaux avec colonnes fixes** (sch√©ma rigide), tandis que MongoDB utilise des **documents JSON flexibles** o√π chaque document peut avoir des champs diff√©rents.
</details>

---

### ‚ùì Q2. Dans MongoDB, comment appelle-t-on l'√©quivalent d'une "table" SQL ?
a) Document  
b) Database  
c) Collection  
d) Field

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : c** ‚Äì Une **Collection** est l'√©quivalent d'une table SQL. Elle contient plusieurs documents (√©quivalents des lignes).
</details>

---

### ‚ùì Q3. Quelle commande permet d'ins√©rer plusieurs documents √† la fois ?
a) `db.collection.insert([...])`  
b) `db.collection.insertMany([...])`  
c) `db.collection.addMultiple([...])`  
d) `db.collection.bulkInsert([...])`

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì La commande `insertMany([...])` permet d'ins√©rer plusieurs documents en une seule fois.
</details>

---

### ‚ùì Q4. Comment trouver tous les employ√©s avec un salaire sup√©rieur √† 50000 ?
a) `db.employes.find({ salaire > 50000 })`  
b) `db.employes.find({ salaire: { $gt: 50000 } })`  
c) `db.employes.find({ salaire: 50000+ })`  
d) `db.employes.search({ salaire: "greater than 50000" })`

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì On utilise l'op√©rateur `$gt` (greater than) : `{ salaire: { $gt: 50000 } }`
</details>

---

### ‚ùì Q5. Que fait la commande `db.employes.updateMany({}, { $inc: { age: 1 } })` ?
a) Supprime tous les employ√©s  
b) Augmente l'√¢ge de tous les employ√©s de 1  
c) D√©finit l'√¢ge de tous les employ√©s √† 1  
d) Multiplie l'√¢ge de tous les employ√©s par 1

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì L'op√©rateur `$inc` **incr√©mente** la valeur. Ici, il augmente l'√¢ge de chaque employ√© de 1 (comme pour f√™ter leurs anniversaires !).
</details>

---

### ‚ùì Q6. Quelle est la meilleure utilisation de MongoDB ?
a) Gestion de transactions bancaires complexes  
b) Collecte de logs et donn√©es IoT avec structure flexible  
c) Reporting BI avec jointures multiples  
d) Calculs scientifiques complexes

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì MongoDB excelle pour la **collecte de logs**, **donn√©es IoT**, **APIs JSON**, et toute donn√©e avec une **structure flexible** et un **volume √©lev√©**.
</details>

---

### ‚ùì Q7. Comment trier les r√©sultats par salaire d√©croissant ?
a) `db.employes.find().sort({ salaire: 1 })`  
b) `db.employes.find().sort({ salaire: -1 })`  
c) `db.employes.find().orderBy({ salaire: "desc" })`  
d) `db.employes.find().reverse({ salaire })`

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì On utilise `sort({ salaire: -1 })` o√π `-1` signifie **d√©croissant** (du plus grand au plus petit) et `1` signifie **croissant**.
</details>

---

### ‚ùì Q8. Que fait la commande `db.employes.aggregate([{ $group: { _id: "$ville", count: { $sum: 1 } } }])` ?
a) Compte le nombre total d'employ√©s  
b) Groupe les employ√©s par ville et compte combien il y en a dans chaque ville  
c) Supprime les doublons de villes  
d) Calcule le salaire total par ville

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì Le pipeline d'agr√©gation **groupe** les documents par ville (`$group: { _id: "$ville" }`) et **compte** combien il y a d'employ√©s dans chaque ville (`count: { $sum: 1 }`).
</details>

---

### ‚ùì Q9. Quel est l'avantage principal de MongoDB Atlas ?
a) Il est 100 fois plus rapide que MongoDB local  
b) Il offre un tier gratuit (M0) et g√®re l'infrastructure pour vous  
c) Il ne n√©cessite pas de mot de passe  
d) Il convertit automatiquement MongoDB en SQL

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì MongoDB Atlas est la version **cloud manag√©e** de MongoDB. Le tier **M0 est gratuit** (512 MB), et Atlas g√®re automatiquement les **backups**, la **s√©curit√©**, et le **scaling** pour vous.
</details>

---

### ‚ùì Q10. Comment supprimer TOUS les documents d'une collection sans supprimer la collection elle-m√™me ?
a) `db.collection.remove()`  
b) `db.collection.deleteMany({})`  
c) `db.collection.drop()`  
d) `db.collection.clear()`

<details>
<summary>üí° Voir la r√©ponse</summary>
‚úÖ **R√©ponse : b** ‚Äì La commande `deleteMany({})` supprime **tous les documents** (le filtre vide `{}` correspond √† tous). La commande `drop()` supprimerait la collection enti√®re.
</details>

---

## üìä Votre score

- **10/10** : üèÜ Expert MongoDB ! Vous √™tes pr√™t pour le niveau interm√©diaire
- **7-9/10** : üåü Tr√®s bien ! Relisez les sections o√π vous avez h√©sit√©
- **5-6/10** : üí™ Bon d√©but ! Pratiquez les commandes dans Atlas
- **< 5/10** : üìö Relisez le notebook et testez les exemples

---

## ‚û°Ô∏è Prochaine √©tape

Tu ma√Ætrises maintenant MongoDB ! Passons √† une autre base NoSQL tr√®s utilis√©e en Data Engineering.

üëâ **Module suivant : `10_elasticsearch_for_data_engineers`** ‚Äî Elasticsearch pour la recherche et l'analytics

---

### üìö Ressources

- [MongoDB Atlas](https://cloud.mongodb.com/) ‚Äî Votre compte
- [MongoDB Documentation](https://docs.mongodb.com/) ‚Äî Doc officielle
- [MongoDB University](https://university.mongodb.com/) ‚Äî Cours gratuits
- [MongoDB Cheat Sheet](https://www.mongodb.com/developer/products/mongodb/cheat-sheet/)

---

üéâ **F√©licitations !** Tu ma√Ætrises maintenant les bases de MongoDB.