# 🚀 Formation IA : Créer un Chatbot RAG
## Retrieval-Augmented Generation pour l'analyse de documents PDF

---

### 🎯 **Objectifs de la formation**

À la fin de cette formation, vous saurez :
- ✅ Configurer un environnement IA sur Google Colab
- ✅ Installer et utiliser Ollama pour faire tourner des modèles localement
- ✅ Créer un système RAG (Retrieval-Augmented Generation)
- ✅ Développer une interface web avec Streamlit
- ✅ Analyser et questionner des documents PDF avec l'IA

### 📚 **Qu'est-ce que le RAG ?**

Le **RAG (Retrieval-Augmented Generation)** est une technique qui combine :
- 🔍 **Recherche** : Trouve les informations pertinentes dans vos documents
- 🤖 **Génération** : Utilise un modèle IA pour formuler des réponses basées sur ces informations

C'est comme avoir un assistant qui lit vos documents et répond à vos questions de manière intelligente !

---

### ⏱️ **Durée estimée** : 2-3 heures
### 💻 **Plateforme** : Google Colab (gratuit)
### 🧠 **Niveau** : Débutant à intermédiaire

---

## 🔗 Section 1 : Connexion à Google Drive

### 📘 Description pédagogique (non technique)
**Cette cellule permet de connecter Google Drive à l'environnement de travail.** Cela permet d'utiliser des fichiers (ex : jeux de données, documents, modèles) qui sont stockés dans votre Google Drive directement dans le Notebook.

### 💡 Pourquoi on fait ça ?
Cela évite de devoir uploader manuellement des fichiers à chaque fois et permet de sauvegarder facilement notre travail.

### 🛠️ Instructions :
1. Exécutez la cellule ci-dessous
2. Cliquez sur le lien qui apparaît
3. Connectez-vous à votre compte Google
4. Copiez le code d'autorisation
5. Collez-le dans la zone de texte qui apparaît

In [None]:
from google.colab import drive
drive.mount("/content/gdrive")
print("✅ Google Drive connecté avec succès !")

## 📁 Section 2 : Configuration de l'environnement de travail

### 📘 Description pédagogique (non technique)
**Cette cellule permet de changer le dossier de travail du notebook pour aller dans le dossier principal de votre Google Drive** (Mon Drive).
Cela facilite l'accès direct aux fichiers sans avoir à écrire un chemin complet à chaque fois.

### 💡 Pourquoi on fait ça ?
En changeant de dossier, on peut lire et enregistrer des fichiers (ex : jeux de données, résultats, images…) comme si on était déjà dans Google Drive, ce qui simplifie beaucoup les manipulations.

In [None]:
%cd gdrive/MyDrive
print("📂 Répertoire de travail changé vers Google Drive")
!pwd

## 🌐 Section 3 : Téléchargement des fichiers nécessaires depuis GitHub

### 📘 Description pédagogique (non technique)
Cette cellule permet de copier un dossier contenant des fichiers depuis GitHub vers l'environnement de travail du notebook.

### 💡 Pourquoi on fait ça ?
GitHub est une plateforme utilisée pour stocker, partager du code ou des fichiers de projet. Ici, on télécharge les ressources nécessaires à la formation pour pouvoir les utiliser facilement dans les cellules suivantes.

### 📦 Ce qu'on télécharge :
- Le code de l'application Streamlit
- Les fichiers de configuration
- Les modèles et outils nécessaires

In [None]:
!git clone https://github.com/antoinecstl/FormationEYAI.git
print("✅ Fichiers de formation téléchargés depuis GitHub")

### 📂 Déplacement vers le dossier de formation

### 📘 Description pédagogique (non technique)
Cette cellule permet de se déplacer dans le dossier FormationEYAI que vous venez de télécharger depuis GitHub.

### 💡 Pourquoi on fait ça ?
En se plaçant dans ce dossier, on pourra accéder plus facilement aux fichiers utiles pour la suite de la formation.

In [None]:
%cd FormationEYAI
print("📁 Maintenant dans le dossier FormationEYAI")
!ls -la

## 📦 Section 4 : Installation des dépendances Python

### 📘 Description pédagogique (non technique)
**Cette cellule permet d'installer automatiquement tous les outils nécessaires à la formation à partir d'un fichier spécial appelé requirements.txt.**
Ce fichier contient la liste des modules Python dont on aura besoin pour que le code fonctionne.

### 💡 Pourquoi on fait ça ?
Plutôt que d'installer chaque outil un par un, ce fichier centralise tout, ce qui fait gagner du temps et évite les erreurs d'oubli ou d'incompatibilité.

### 🔧 Modules qui seront installés :
- **Streamlit** : Pour créer l'interface web
- **Ollama** : Pour interagir avec les modèles IA
- **FAISS** : Pour la recherche vectorielle rapide
- **LangChain** : Pour le traitement de texte avancé
- **PyPDF2** : Pour lire les fichiers PDF
- **NumPy & scikit-learn** : Pour les calculs mathématiques

In [None]:
%pip install -r requirements.txt
print("✅ Toutes les dépendances sont installées !")

## 🤖 Section 5 : Installation et lancement d'Ollama

### 📘 Description pédagogique (non technique)
Cette cellule télécharge et installe Ollama, un outil qui permet de faire tourner des modèles d'intelligence artificielle (comme des LLMs) localement sur la machine, sans avoir besoin d'une connexion à un service cloud.

### 💡 Pourquoi on fait ça ?
Cela permet de tester des modèles d'IA de manière autonome, sans dépendre de services externes. C'est particulièrement utile pour des raisons de confidentialité, de coût ou de performance locale.

### 🔒 Avantages d'Ollama :
- **Gratuit** : Pas de coûts d'API
- **Privé** : Vos données restent locales
- **Rapide** : Pas de latence réseau
- **Flexible** : Plusieurs modèles disponibles

In [None]:
!curl -fsSL https://ollama.com/install.sh | sh
print("✅ Ollama installé avec succès !")

### 🚀 Démarrage du serveur Ollama

### 📘 Description pédagogique (non technique)
Cette cellule sert à lancer le serveur Ollama, c'est-à-dire à démarrer l'outil qui fera fonctionner un modèle d'IA localement.

### 💡 Pourquoi on fait ça ?
Pour interagir avec un modèle d'intelligence artificielle installé localement, il faut d'abord démarrer un service qui « écoute » et attend nos demandes.

In [None]:
import subprocess
import time

# Démarrage du serveur Ollama en arrière-plan
sub = subprocess.Popen("ollama serve", shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
print("🚀 Serveur Ollama démarré !")
print("⏳ Attente de 5 secondes pour que le serveur soit prêt...")
time.sleep(5)
print("✅ Serveur Ollama opérationnel !")

## 🧠 Section 6 : Téléchargement des modèles d'IA

### 📘 Description pédagogique (non technique)
Ces deux commandes permettent de télécharger des modèles d'intelligence artificielle (IA) que l'on utilisera ensuite dans le projet.

### 🤖 Modèles téléchargés :

1. **llama3.2** : un modèle de langage (LLM), capable de répondre à des questions, générer du texte, résumer, etc.

2. **nomic-embed-text** : un modèle qui transforme des textes en « vecteurs », une forme que les machines peuvent comprendre pour faire des recherches sémantiques ou des comparaisons de sens.

### 💡 Pourquoi on fait ça ?
Les LLM sont pré-entraînés. Pour pouvoir les utiliser, il faut d'abord les télécharger sur votre machine, un peu comme si vous installiez une application.

Sans cela, le système ne saura pas quel modèle utiliser, ni comment répondre aux questions ou traiter les textes.

### ⚠️ Note importante :
Le téléchargement peut prendre plusieurs minutes selon votre connexion internet.

In [None]:
print("📥 Téléchargement du modèle de langage llama3.2...")
!ollama pull llama3.2
print("✅ Modèle llama3.2 téléchargé !")

print("\n📥 Téléchargement du modèle d'embedding nomic-embed-text...")
!ollama pull nomic-embed-text
print("✅ Modèle nomic-embed-text téléchargé !")

print("\n🎉 Tous les modèles sont prêts à être utilisés !")

## 🖥️ Section 7 : Création de l'interface utilisateur avec Streamlit

### 📘 Description pédagogique (non technique)
Nous allons maintenant créer le fichier `app.py` qui contient tout le code de notre application RAG PDF Chat. Cette application permettra :

### 🎯 Fonctionnalités de l'application :
- 📄 **Upload de PDF** : Déposer des documents PDF
- 🔍 **Indexation intelligente** : Analyser et découper les documents
- 💬 **Chat interactif** : Poser des questions sur vos documents
- 🎨 **Interface moderne** : Design professionnel avec Streamlit
- 📊 **Affichage des sources** : Voir d'où viennent les réponses

### 🧠 Comment ça marche ?
1. **Extraction** : Le texte est extrait des PDF
2. **Découpage** : Le texte est divisé en chunks intelligents
3. **Vectorisation** : Chaque chunk devient un vecteur mathématique
4. **Indexation** : Les vecteurs sont stockés dans une base de données rapide
5. **Recherche** : Quand vous posez une question, on trouve les chunks pertinents
6. **Génération** : Le modèle IA formule une réponse basée sur ces chunks

In [None]:
# Création du fichier app.py avec le code complet de l'application RAG
app_code = '''
from __future__ import annotations

import os
import tempfile
from typing import Any, Dict, List, Optional, Tuple

import faiss  # type: ignore
import numpy as np
import streamlit as st
from PyPDF2 import PdfReader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from sklearn.metrics.pairwise import cosine_similarity

import ollama  # pip install ollama-python

# --------------------- UI & style -----------------------------------------
st.set_page_config(page_title="🤖 RAG PDF Chat", page_icon="🤖", layout="wide")

st.markdown(
    """
<style>
html, body {
    font-family: 'Helvetica Neue', sans-serif;
    background-color: #f4f7fa;
}
.sidebar .sidebar-content {
    background-color: #ffffff;
}
.chat-container {
    max-width: 1200px;
    margin: auto;
    padding: 1rem;
}
.user-msg {
    background: #007bff;
    color: white;
    border-radius: 20px 20px 0px 20px;
    padding: 1rem;
    margin: 0.5rem 0;
    align-self: flex-end;
    max-width: 100%;
    word-wrap: break-word;
}
.bot-msg {
    background: #e9ecef;
    color: #212529;
    border-radius: 20px 20px 20px 0px;
    padding: 1rem;
    margin: 0.5rem 0;
    align-self: flex-start;
    max-width: 100%;
    word-wrap: break-word;
}
.chat-area {
    display: flex;
    flex-direction: column;
}
</style>
""",
    unsafe_allow_html=True,
)

# --------------------- Config ---------------------------------------------
MODEL_NAME = "llama3.2:3b"
EMBEDDING_MODEL = "nomic-embed-text:latest"
DOC_TOP_K = 3
CHUNK_TOP_K = 5
CANDIDATES_K = 20
NEIGHBORS = 1
LAMBDA_DIVERSITY = 0.3
SIM_THRESHOLD = 0.25
TEMPERATURE = 0.2
MAX_TOKENS = 2048

# --------------------- Helpers LLM ----------------------------------------

def _call_llm(messages: List[Dict[str, str]], *, temperature: float = 0.1, max_tokens: int = 2048, stream: bool = False):
    return ollama.chat(
        model=MODEL_NAME,
        messages=messages,
        stream=stream,
        options={"temperature": temperature, "num_predict": max_tokens},
    )


def embed_texts(texts: List[str]) -> np.ndarray:
    return np.array([ollama.embeddings(model=EMBEDDING_MODEL, prompt=t)["embedding"] for t in texts], dtype="float32")

# --------------------- PDF utils -----------------------------------------

def clean_text(text: str) -> str:
    import re
    text = re.sub(r"\n{2,}", "\n\n", text)
    text = re.sub(r"(\w+)-\n(\w+)", r"\1\2", text)
    text = re.sub(r"\s{2,}", " ", text)
    return text.strip()


def extract_pdf_text(path: str) -> str:
    return clean_text("\n".join(page.extract_text() or "" for page in PdfReader(path).pages))

# --------------------- Chunking & résumé ----------------------------------

def auto_chunk_size(tokens: int) -> int:
    return 1024 if tokens < 8000 else 768 if tokens < 20000 else 512


def chunk_document(text: str) -> List[str]:
    size = auto_chunk_size(len(text.split()))
    splitter = RecursiveCharacterTextSplitter(
        separators=["\n\n", "\n", ". "],
        chunk_size=size,
        chunk_overlap=int(size*0.25),
        length_function=len,
    )
    return [c for c in splitter.split_text(text) if len(c) > 100]


def make_summary(text: str) -> str:
    messages = [
        {"role": "system", "content": "Vous êtes un expert en synthèse documentaire. Résumez le texte suivant en trois parties : (1) Contexte, (2) Points clés, (3) Conclusions. Répondez en français."},
        {"role": "user", "content": text[:120000]}
    ]
    return _call_llm(messages)["message"]["content"].strip()

# --------------------- Index hiérarchique ---------------------------------
class RagIndex:
    def __init__(self):
        self.doc_index: Optional[faiss.IndexFlatIP] = None
        self.chunk_index: Optional[faiss.Index] = None
        self.doc_meta: List[Dict[str, Any]] = []
        self.chunk_meta: List[Dict[str, Any]] = []
        self.chunk_emb: Optional[np.ndarray] = None

    def build(self, uploaded_files: List[st.runtime.uploaded_file_manager.UploadedFile]):
        doc_embs, chunk_embs_list = [], []
        for doc_id, uf in enumerate(uploaded_files):
            with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as tmp:
                tmp.write(uf.getbuffer())
                path = tmp.name
            full_text = extract_pdf_text(path)
            os.unlink(path)

            summary = make_summary(full_text)
            self.doc_meta.append({"filename": uf.name, "summary": summary})
            doc_embs.append(embed_texts([summary])[0])

            chunks = chunk_document(full_text)
            chunk_embs = embed_texts(chunks)
            chunk_embs_list.append(chunk_embs)
            for i, txt in enumerate(chunks):
                self.chunk_meta.append({"doc_id": doc_id, "text": txt, "chunk_id": i})

        self.doc_index = faiss.IndexFlatIP(len(doc_embs[0]))
        self.doc_index.add(np.vstack(doc_embs).astype("float32"))

        self.chunk_emb = np.vstack(chunk_embs_list).astype("float32")
        self.chunk_index = faiss.IndexHNSWFlat(self.chunk_emb.shape[1], 32)
        self.chunk_index.add(self.chunk_emb)

    def _is_global(self, query: str, thr: float = 0.78) -> bool:
        examples = [
            "De quoi parle ce document ?",
            "Quel est le sujet principal ?",
            "Fais un résumé du document",
        ]
        emb_q = embed_texts([query])[0]
        emb_ex = embed_texts(examples)
        sims = emb_ex @ emb_q / (np.linalg.norm(emb_ex, axis=1) * np.linalg.norm(emb_q) + 1e-6)
        return float(np.max(sims)) >= thr

    def _mmr(self, q: np.ndarray, cand: np.ndarray, k: int) -> List[int]:
        selected, rest = [], list(range(len(cand)))
        while len(selected) < min(k, len(rest)):
            best, best_score = None, -1e9
            for idx in rest:
                sim_q = float(q @ cand[idx] / (np.linalg.norm(q) * np.linalg.norm(cand[idx]) + 1e-6))
                sim_s = max(cosine_similarity(cand[idx][None, :], cand[selected])[0]) if selected else 0.
                score = LAMBDA_DIVERSITY*sim_q - (1-LAMBDA_DIVERSITY)*sim_s
                if score > best_score:
                    best, best_score = idx, score
            selected.append(best)
            rest.remove(best)
        return selected

    def retrieve(self, query: str) -> Tuple[List[str], List[int], Optional[str]]:
        q_emb = embed_texts([query])[0]
        _, I_doc = self.doc_index.search(q_emb[None, :], DOC_TOP_K)
        allowed = set(I_doc[0])

        mask = [i for i, m in enumerate(self.chunk_meta) if m["doc_id"] in allowed]
        sub_emb = self.chunk_emb[mask]
        sub_idx = faiss.IndexFlatIP(sub_emb.shape[1])
        sub_idx.add(sub_emb)
        D, I = sub_idx.search(q_emb[None, :], min(CANDIDATES_K, len(mask)))
        pool = [mask[idx] for idx in I[0]]
        pool = [idx for idx, d in zip(pool, D[0]) if 1-d <= SIM_THRESHOLD] or [mask[I[0][0]]]

        cand_emb = self.chunk_emb[pool]
        selected = [pool[i] for i in self._mmr(q_emb, cand_emb, CHUNK_TOP_K)]
        expanded = {j for idx in selected for j in range(idx-NEIGHBORS, idx+NEIGHBORS+1)}
        final = [i for i in expanded if 0 <= i < len(self.chunk_meta)][:CHUNK_TOP_K]

        contexts = [self.chunk_meta[i]["text"] for i in final]
        summary = self.doc_meta[int(I_doc[0][0])]["summary"] if self._is_global(query) else None
        return contexts, final, summary

# ---------------- Prompt builder -----------------------------------------
def build_prompt(question: str, contexts: List[str], summary: Optional[str], history: List[Dict[str, str]] = None):
    ctx_block = "\n\n".join(f"[{i+1}] {c}" for i, c in enumerate(contexts))
    if summary:
        ctx_block = f"[Résumé] {summary}\n\n" + ctx_block
    
    system = (
        "Vous êtes un assistant expert. Utilisez uniquement les informations suivantes pour répondre en français. "
        "Citez vos sources avec les balises [n]. Si l'information n'est pas trouvée, informez-en l'utilisateur."
    )
    
    messages = [{"role": "system", "content": system}]
    
    if history and len(history) > 0:
        previous_messages = history[:-1] if history[-1]["role"] == "user" else history
        messages.extend(previous_messages)
    
    current_user_content = f"CONTEXTE(S):\n{ctx_block}\n\nQUESTION: {question}\n\nRéponse:"
    messages.append({"role": "user", "content": current_user_content})
    
    return messages

# ---------------- Etat Streamlit ----------------------------------------
if "messages" not in st.session_state:
    st.session_state.messages = []
if "rag" not in st.session_state:
    st.session_state.rag = None
if "processing" not in st.session_state:
    st.session_state.processing = False

# ---------------- Sidebar upload ----------------------------------------
with st.sidebar:
    st.header("📚 Documents")
    files = st.file_uploader("Déposez vos PDF", type=["pdf"], accept_multiple_files=True)
    if st.button("🔄 Réinitialiser"):
        st.session_state.clear()
        st.rerun()

# ---------------- Index construction ------------------------------------
if files and st.session_state.rag is None:
    with st.spinner("📄 Indexation en cours…"):
        rag = RagIndex()
        rag.build(files)
        st.session_state.rag = rag
    st.success(f"{len(files)} document(s) indexé(s) ! Posez vos questions.")

# ---------------- Chat display -----------------------------------------
st.markdown("<div class='chat-container'>", unsafe_allow_html=True)
if not st.session_state.messages:
    if st.session_state.rag is not None:
        st.markdown(
            """
            <div class="bot-msg">
            👋 Bonjour ! Je suis votre assistant IA documentaire.
            <br>Posez-moi une question sur le contenu de vos documents.
            </div>
            """,
            unsafe_allow_html=True
        )
    else:
        st.markdown(
            """
            <div class="bot-msg">
            👋 Bienvenue dans RAG PDF Chat !
            <br>Commencez par télécharger un ou plusieurs documents PDF dans le panneau latéral.
            </div>
            """,
            unsafe_allow_html=True
        )
else:
    st.markdown("<div class='chat-area'>", unsafe_allow_html=True)
    for msg in st.session_state.messages:
        css = "user-msg" if msg["role"] == "user" else "bot-msg"
        st.markdown(f'<div class="{css}">{msg["content"]}</div>', unsafe_allow_html=True)
    st.markdown("</div>", unsafe_allow_html=True)
st.markdown("</div>", unsafe_allow_html=True)

# ---------------- Chat input -------------------------------------------
query = st.chat_input("Votre question…", disabled=st.session_state.processing or st.session_state.rag is None)

if query:
    st.session_state.messages.append({"role": "user", "content": query})
    st.markdown(f'<div class="user-msg">{query}</div>', unsafe_allow_html=True)
    st.session_state.processing = True

    rag: RagIndex = st.session_state.rag  # type: ignore
    contexts, indices, summary = rag.retrieve(query)
    
    prompt = build_prompt(query, contexts, summary, st.session_state.messages)

    placeholder = st.empty()
    collected_parts: List[str] = []

    for chunk in _call_llm(prompt, temperature=TEMPERATURE, max_tokens=MAX_TOKENS, stream=True):
        token = chunk["message"]["content"]
        collected_parts.append(token)
        placeholder.markdown(f'<div class="bot-msg">{"".join(collected_parts)}</div>', unsafe_allow_html=True)

    full_answer = "".join(collected_parts)
    st.session_state.messages.append({"role": "assistant", "content": full_answer})
    st.session_state.processing = False

    with st.expander("🔍 Contextes"):
        for i, ctx in enumerate(contexts):
            st.text_area(f"[{i+1}]", ctx, height=120)
'''

# Écriture du fichier app.py
with open('app.py', 'w', encoding='utf-8') as f:
    f.write(app_code)

print("✅ Fichier app.py créé avec succès !")
print("📁 L'application RAG PDF Chat est maintenant prête.")

## 🧪 Section 8 : Test des composants principaux

### 📘 Description pédagogique (non technique)
Avant de lancer l'application complète, nous allons tester que tous les composants fonctionnent correctement :

### 🔍 Tests à effectuer :
1. **Connexion Ollama** : Vérifier que le serveur répond
2. **Modèles disponibles** : Lister les modèles téléchargés
3. **Test simple** : Générer une réponse de test
4. **Test d'embedding** : Transformer du texte en vecteurs

In [None]:
import ollama
import time

print("🔍 Test de la connexion Ollama...")
try:
    # Test de connexion
    models = ollama.list()
    print("✅ Connexion Ollama réussie !")
    print(f"📋 Modèles disponibles : {len(models['models'])}")
    
    for model in models['models']:
        print(f"  🤖 {model['name']}")
        
except Exception as e:
    print(f"❌ Erreur de connexion : {e}")
    print("⏳ Attente de 10 secondes supplémentaires...")
    time.sleep(10)

print("\n🧪 Test de génération de texte...")
try:
    response = ollama.chat(
        model='llama3.2',
        messages=[{
            'role': 'user',
            'content': 'Bonjour, peux-tu me dire en une phrase ce que tu peux faire ?'
        }]
    )
    print("✅ Test de génération réussi !")
    print(f"🤖 Réponse : {response['message']['content']}")
except Exception as e:
    print(f"❌ Erreur de génération : {e}")

print("\n🔢 Test d'embedding...")
try:
    embedding = ollama.embeddings(
        model='nomic-embed-text',
        prompt='Ceci est un test d\'embedding'
    )
    print("✅ Test d'embedding réussi !")
    print(f"📊 Dimension du vecteur : {len(embedding['embedding'])}")
except Exception as e:
    print(f"❌ Erreur d'embedding : {e}")

print("\n🎉 Tous les tests sont terminés !")

## 🚀 Section 9 : Lancement de l'application RAG PDF Chat

### 📘 Description pédagogique (non technique)
Cette section permet de lancer une interface web (une mini-application) et de la rendre accessible depuis Internet grâce à un outil appelé LocalTunnel.

### 🔧 Voici ce que chaque ligne fait :

**`!npm install localtunnel`**
- Installe l'outil LocalTunnel, qui va permettre de partager l'application Streamlit via un lien web.

**`import urllib + print(...)`**
- Affiche l'adresse IP publique de votre environnement pour référence (souvent inutile côté utilisateur, mais utile pour des logs ou du debug).

**`!streamlit run app.py &>/content/logs.txt &`**
- Lance l'application Streamlit (app.py) en arrière-plan. C'est cette application qui permet d'interagir avec le modèle IA via une interface utilisateur.

**`npx localtunnel --port 8501`**
- Crée un lien temporaire et public vers l'application, utilisable depuis n'importe quel navigateur.

### 💡 Pourquoi on fait ça ?
On crée ici une interface simple et accessible (dans un navigateur) pour interagir avec le modèle IA, sans écrire de code.
Et comme Colab ou certains environnements locaux n'ont pas d'adresse web fixe, LocalTunnel sert de pont entre votre application et le reste du monde.

### 🌐 Instructions importantes :
1. **Cliquez sur le lien** qui apparaîtra après l'exécution
2. **Entrez le mot de passe** qui s'affichera dans les logs
3. **Profitez de votre application** RAG PDF Chat !

### ⚠️ Attention :
- Le lien LocalTunnel est temporaire et change à chaque exécution
- L'application reste active tant que la cellule tourne
- Pour arrêter, utilisez le bouton stop ou redémarrez le runtime

In [None]:
!npm install localtunnel

import urllib
print("🔑 Password/Endpoint IP for localtunnel is:", urllib.request.urlopen('https://ipv4.icanhazip.com').read().decode('utf8').strip("\n"))
print("\n🚀 Lancement de l'application RAG PDF Chat...")
print("📱 L'interface sera disponible via le lien LocalTunnel qui va apparaître.")
print("⏳ Patientez quelques secondes...")

!streamlit run app.py &>/content/logs.txt & npx localtunnel --port 8501

## 🎓 Guide d'utilisation et conclusion

### 🎯 **Félicitations !** 

Vous avez maintenant une application RAG complètement fonctionnelle ! 🎉

---

### 📖 **Guide d'utilisation de votre application :**

#### 1. **📄 Upload de documents**
- Cliquez sur "Browse files" dans la sidebar
- Sélectionnez un ou plusieurs fichiers PDF
- L'application va automatiquement les analyser et les indexer

#### 2. **💬 Interaction avec l'IA**
- Tapez votre question dans la zone de chat
- L'IA va chercher les informations pertinentes dans vos documents
- Elle formulera une réponse basée uniquement sur le contenu de vos PDF

#### 3. **🔍 Vérification des sources**
- Cliquez sur "🔍 Contextes" pour voir les extraits utilisés
- Chaque réponse est sourcée et vérifiable

---

### 🎨 **Exemples de questions à poser :**

- "De quoi parle ce document ?"
- "Quels sont les points clés ?"
- "Peux-tu résumer les conclusions ?"
- "Que dit le document sur [sujet spécifique] ?"
- "Quelles sont les recommandations ?"

---

### 🛠️ **Ce que vous avez appris :**

✅ **Configuration d'un environnement IA** sur Google Colab  
✅ **Installation et utilisation d'Ollama** pour les modèles locaux  
✅ **Création d'un système RAG** avec indexation vectorielle  
✅ **Développement d'une interface web** avec Streamlit  
✅ **Traitement et analyse de documents PDF** avec l'IA  
✅ **Deployment avec LocalTunnel** pour partager votre application  

---

### 🚀 **Pour aller plus loin :**

- **Personnaliser l'interface** : Modifier les couleurs et le style
- **Ajouter d'autres formats** : Word, PowerPoint, etc.
- **Améliorer les prompts** : Personnaliser les réponses
- **Optimiser les performances** : Ajuster les paramètres RAG
- **Déployer en production** : Utiliser des services cloud

---

### 📚 **Ressources pour continuer :**

- [Documentation Ollama](https://ollama.ai/)
- [Documentation Streamlit](https://docs.streamlit.io/)
- [Guide FAISS](https://github.com/facebookresearch/faiss)
- [LangChain Documentation](https://docs.langchain.com/)

---

### 🤝 **Merci d'avoir suivi cette formation !**

Vous maîtrisez maintenant les bases du RAG et pouvez créer vos propres applications d'IA documentaire. N'hésitez pas à expérimenter et à adapter le code à vos besoins spécifiques !

---

**💡 Tip :** Sauvegardez ce notebook dans votre Google Drive pour pouvoir le réutiliser facilement !