# TP : Retrieval Augmented Generation avec NotebookLM
## Analyse géopolitique assistée par IA


### 🎯 Objectifs pédagogiques

- Comprendre l'application pratique du RAG dans l'analyse géopolitique
- Utiliser NotebookLM pour créer un système RAG simple
- Analyser des documents géopolitiques avec l'assistance de l'IA
- Évaluer les limites et biais potentiels de ces outils

### 📚 Rappel théorique rapide

**RAG (Retrieval Augmented Generation) :** Architecture combinant :
- **Retrieval** : Recherche de documents pertinents dans une base de connaissances
- **Augmentation** : Enrichissement du contexte du LLM avec ces documents
- **Generation** : Production de réponses informées par les sources récupérées

**Avantages pour l'analyse géopolitique :**
- Accès à des sources spécialisées et récentes
- Réduction des hallucinations
- Traçabilité des sources
- Mise à jour continue des connaissances

## 🔍 Partie 1 : Découverte de NotebookLM 

### Qu'est-ce que NotebookLM ?

NotebookLM est un outil de Google qui implémente le RAG de manière accessible :
- Interface intuitive pour uploader des documents sources
- Génération automatique d'embeddings et indexation
- Interface conversationnelle avec citation des sources
- Génération de synthèses, FAQ, et guides d'étude

### 🎯 **Exercice 1.1 : Première prise en main**

1. **Connectez-vous** à [NotebookLM](https://notebooklm.google.com)
2. **Créez un nouveau notebook** nommé "Analyse Géopolitique [Votre Nom]"
3. **Explorez l'interface** : identifiez les zones pour :
   - Ajouter des sources
   - Poser des questions
   - Consulter les réponses avec citations

### 📝 **Question de réflexion 1.1**
*Notez vos premières impressions sur l'interface. Quels avantages/inconvénients percevez-vous par rapport à un moteur de recherche classique ?*

**Votre réponse :**
```
[Écrivez votre réponse ici]
```

## 📄 Partie 2 : Constitution d'une base de connaissances

### Types de sources supportées par NotebookLM
- Documents PDF
- Documents Google Docs
- Sites web (via URL)
- Fichiers texte
- Transcriptions YouTube

### 🎯 **Exercice 2.1 : Sélection et upload de sources**

**Cas d'étude :** Relations sino-américaines contemporaines

**Étape 1 :** Collectez et uploadez **4-5 sources diversifiées** :

1. **Source académique** : Article de revue spécialisée (ex: Asian Survey, International Affairs)
2. **Source institutionnelle** : Rapport d'organisation internationale (ex: SIPRI, Council on Foreign Relations)
3. **Source média** : Article de presse récent (ex: Foreign Affairs, The Diplomat)
4. **Source primaire** : Document officiel (ex: communiqué joint, discours)
5. **Source alternative** : Think tank ou analyse indépendante

**Étape 2 :** Pour chaque source uploadée :
- Vérifiez que NotebookLM a bien extrait le contenu
- Notez le titre automatiquement généré
- Observez le résumé automatique proposé

### 📝 **Exercice 2.2 : Évaluation de la qualité d'extraction**

Remplissez le tableau suivant :

| Source | Type | Extraction réussie ? | Qualité du résumé auto | Problèmes identifiés |
|--------|------|---------------------|------------------------|----------------------|
| 1 |  |  |  |  |
| 2 |  |  |  |  |
| 3 |  |  |  |  |
| 4 |  |  |  |  |
| 5 |  |  |  |  |

### 💡 **Points d'attention**
- Qualité OCR pour les PDF scannés
- Respect de la mise en forme (tableaux, graphiques)
- Gestion des langues non-anglaises
- Limitations de taille des documents

## 🤖 Partie 3 : Interrogation et analyse

### Stratégies de questionnement efficace

**Types de questions RAG optimales :**
- Questions factuelles avec demande de citations
- Comparaisons entre sources
- Synthèses thématiques
- Identification de perspectives divergentes

### 🎯 **Exercice 3.1 : Questions progressives**

Posez les questions suivantes dans NotebookLM et analysez les réponses :

#### **Niveau 1 : Questions factuelles**
1. "Quels sont les principaux points de friction actuels entre la Chine et les États-Unis selon mes sources ?"
2. "Quelle est la position officielle chinoise sur Taiwan d'après les documents ?"

#### **Niveau 2 : Questions analytiques**
3. "Compare les analyses des différentes sources sur l'impact économique de la guerre commerciale"
4. "Identifie les divergences d'interprétation entre les sources occidentales et non-occidentales"

#### **Niveau 3 : Questions synthétiques**
5. "Génère une synthèse des scénarios d'évolution possibles des relations sino-américaines selon mes sources"

### 📝 **Exercice 3.2 : Évaluation critique des réponses**

Pour chaque réponse, évaluez :

| Question | Citations présentes ? | Équilibre des sources | Biais potentiels | Lacunes identifiées |
|----------|----------------------|----------------------|------------------|--------------------|
| 1 |  |  |  |  |
| 2 |  |  |  |  |
| 3 |  |  |  |  |
| 4 |  |  |  |  |
| 5 |  |  |  |  |

### 🔍 **Exercice 3.3 : Vérification des citations**

Choisissez une réponse avec citations et :
1. Cliquez sur les citations pour accéder aux passages source
2. Vérifiez la fidélité de l'interprétation
3. Identifiez d'éventuelles déformations ou simplifications

**Observations :**
```
[Vos observations sur la qualité des citations]
```

## 🎓 Partie 4 : Fonctionnalités avancées et cas d'usage (15 min)

### 🎯 **Exercice 4.1 : Génération de contenus structurés**

Testez les fonctionnalités de génération automatique :

#### **A. FAQ automatique**
- Demandez à NotebookLM de générer une FAQ sur votre corpus
- Évaluez la pertinence des questions générées

#### **B. Guide d'étude**
- Générez un guide d'étude structuré
- Analysez l'organisation thématique proposée

#### **C. Résumé exécutif**
- Demandez un résumé exécutif des enjeux sino-américains
- Évaluez l'équilibre et la complétude

### 📝 **Exercice 4.2 : Cas d'usage avancé - Brief géopolitique**

**Scenario :** Vous devez préparer un brief de 2 pages pour un décideur politique.

**Consigne :** Utilisez NotebookLM pour générer :
1. Un résumé de la situation actuelle (1 paragraphe)
2. Les 3 enjeux principaux avec citations (3 paragraphes)
3. Les risques et opportunités identifiés (1 paragraphe)
4. Les recommandations basées sur l'analyse des sources (1 paragraphe)

**Votre brief :**
```
[Rédigez votre brief ici en utilisant les outputs de NotebookLM]
```

## ⚖️ Partie 5 : Analyse critique et limites

### 🎯 **Exercice 5.1 : Identification des biais et limites**

#### **A. Biais de sélection des sources**
- Vos sources représentent-elles différentes perspectives géopolitiques ?
- Y a-t-il une surreprésentation de certains points de vue ?

#### **B. Biais algorithmiques**
- NotebookLM privilégie-t-il certaines sources dans ses réponses ?
- Les synthèses reflètent-elles la diversité des opinions ?

#### **C. Limitations techniques**
- Quels types d'informations sont mal gérés (graphiques, nuances, ironie) ?
- Comment l'outil gère-t-il les contradictions entre sources ?

### 📝 **Réflexion critique finale**

**Question 1 :** Quels sont les risques de l'utilisation du RAG en analyse géopolitique ?
```
[Votre réponse]
```

**Question 2 :** Comment intégrer ces outils dans une méthodologie rigoureuse d'analyse géopolitique ?
```
[Votre réponse]
```

**Question 3 :** Quelles compétences restent irremplaçables pour l'analyste géopolitique ?
```
[Votre réponse]
```

## 🔄 Conclusions et perspectives

### Ce que vous avez appris
- Le RAG comme outil d'augmentation (et non de remplacement) de l'analyse
- L'importance de la curation des sources en amont
- La nécessité de la vérification et du recoupement
- Les enjeux éthiques et méthodologiques de l'IA en géopolitique

### Bonnes pratiques à retenir
1. **Diversifier les sources** : perspectives géographiques, temporelles, idéologiques
2. **Vérifier systématiquement** les citations et interprétations
3. **Maintenir l'esprit critique** : l'IA amplifie les biais existants
4. **Utiliser comme point de départ** : l'analyse humaine reste centrale
5. **Documenter la méthodologie** : traçabilité et reproductibilité
