# üöÄ Formation IA : Cr√©er un Chatbot RAG
## Retrieval-Augmented Generation pour l'analyse de documents PDF

---

### üéØ **Objectifs de la formation**

√Ä la fin de cette formation, vous saurez :
- ‚úÖ Configurer un environnement IA sur Google Colab
- ‚úÖ Installer et utiliser Ollama pour faire tourner des mod√®les localement
- ‚úÖ Cr√©er un syst√®me RAG (Retrieval-Augmented Generation)
- ‚úÖ D√©velopper une interface web avec Streamlit
- ‚úÖ Analyser et questionner des documents PDF avec l'IA

### üìö **Qu'est-ce que le RAG ?**

Le **RAG (Retrieval-Augmented Generation)** est une technique qui combine :
- üîç **Recherche** : Trouve les informations pertinentes dans vos documents
- ü§ñ **G√©n√©ration** : Utilise un mod√®le IA pour formuler des r√©ponses bas√©es sur ces informations

C'est comme avoir un assistant qui lit vos documents et r√©pond √† vos questions de mani√®re intelligente !

---

## üîó Section 1 : Connexion √† Google Drive

### üìò Description p√©dagogique (non technique)
**Cette cellule permet de connecter Google Drive √† l'environnement de travail.** Cela permet d'utiliser des fichiers (ex : jeux de donn√©es, documents, mod√®les) qui sont stock√©s dans votre Google Drive directement dans le Notebook.

### üí° Pourquoi on fait √ßa ?
Cela √©vite de devoir uploader manuellement des fichiers √† chaque fois et permet de sauvegarder facilement notre travail.

### üõ†Ô∏è Instructions :
1. Ex√©cutez la cellule ci-dessous
2. Cliquez sur le lien qui appara√Æt
3. Connectez-vous √† votre compte Google
4. Copiez le code d'autorisation
5. Collez-le dans la zone de texte qui appara√Æt

In [1]:
from google.colab import drive
drive.mount("/content/gdrive")
print("‚úÖ Google Drive connect√© avec succ√®s !")

ModuleNotFoundError: No module named 'google.colab'

## üìÅ Section 2 : Configuration de l'environnement de travail

### üìò Description p√©dagogique (non technique)
**Cette cellule permet de changer le dossier de travail du notebook pour aller dans le dossier principal de votre Google Drive** (Mon Drive).
Cela facilite l'acc√®s direct aux fichiers sans avoir √† √©crire un chemin complet √† chaque fois.

### üí° Pourquoi on fait √ßa ?
En changeant de dossier, on peut lire et enregistrer des fichiers (ex : jeux de donn√©es, r√©sultats, images‚Ä¶) comme si on √©tait d√©j√† dans Google Drive, ce qui simplifie beaucoup les manipulations.

In [None]:
%cd gdrive/MyDrive
print("üìÇ R√©pertoire de travail chang√© vers Google Drive")
!pwd

## üåê Section 3 : T√©l√©chargement des fichiers n√©cessaires depuis GitHub

### üìò Description p√©dagogique (non technique)
Cette cellule permet de copier un dossier contenant des fichiers depuis GitHub vers l'environnement de travail du notebook.

### üí° Pourquoi on fait √ßa ?
GitHub est une plateforme utilis√©e pour stocker, partager du code ou des fichiers de projet. Ici, on t√©l√©charge les ressources n√©cessaires √† la formation pour pouvoir les utiliser facilement dans les cellules suivantes.

### üì¶ Ce qu'on t√©l√©charge :
- Le code de l'application Streamlit
- Les fichiers de configuration
- Les mod√®les et outils n√©cessaires

In [None]:
!git clone https://github.com/antoinecstl/FormationEYAI.git
print("‚úÖ Fichiers de formation t√©l√©charg√©s depuis GitHub")

### üìÇ D√©placement vers le dossier de formation

### üìò Description p√©dagogique (non technique)
Cette cellule permet de se d√©placer dans le dossier FormationEYAI que vous venez de t√©l√©charger depuis GitHub.

### üí° Pourquoi on fait √ßa ?
En se pla√ßant dans ce dossier, on pourra acc√©der plus facilement aux fichiers utiles pour la suite de la formation.

In [None]:
%cd FormationEYAI
print("üìÅ Maintenant dans le dossier FormationEYAI")
!ls -la

## üì¶ Section 4 : Installation des d√©pendances Python

### üìò Description p√©dagogique (non technique)
**Cette cellule permet d'installer automatiquement tous les outils n√©cessaires √† la formation √† partir d'un fichier sp√©cial appel√© requirements.txt.**
Ce fichier contient la liste des modules Python dont on aura besoin pour que le code fonctionne.

### üí° Pourquoi on fait √ßa ?
Plut√¥t que d'installer chaque outil un par un, ce fichier centralise tout, ce qui fait gagner du temps et √©vite les erreurs d'oubli ou d'incompatibilit√©.

### üîß Modules qui seront install√©s :
- **Streamlit** : Pour cr√©er l'interface web
- **Ollama** : Pour interagir avec les mod√®les IA
- **FAISS** : Pour la recherche vectorielle rapide
- **LangChain** : Pour le traitement de texte avanc√©
- **PyPDF2** : Pour lire les fichiers PDF
- **NumPy & scikit-learn** : Pour les calculs math√©matiques

In [None]:
%pip install -r requirements.txt
print("‚úÖ Toutes les d√©pendances sont install√©es !")

## ü§ñ Section 5 : Installation et lancement d'Ollama

### üìò Description p√©dagogique (non technique)
Cette cellule t√©l√©charge et installe Ollama, un outil qui permet de faire tourner des mod√®les d'intelligence artificielle (comme des LLMs) localement sur la machine, sans avoir besoin d'une connexion √† un service cloud.

### üí° Pourquoi on fait √ßa ?
Cela permet de tester des mod√®les d'IA de mani√®re autonome, sans d√©pendre de services externes. C'est particuli√®rement utile pour des raisons de confidentialit√©, de co√ªt ou de performance locale.

### üîí Avantages d'Ollama :
- **Gratuit** : Pas de co√ªts d'API
- **Priv√©** : Vos donn√©es restent locales
- **Rapide** : Pas de latence r√©seau
- **Flexible** : Plusieurs mod√®les disponibles

In [None]:
!curl -fsSL https://ollama.com/install.sh | sh
print("‚úÖ Ollama install√© avec succ√®s !")

### üöÄ D√©marrage du serveur Ollama

### üìò Description p√©dagogique (non technique)
Cette cellule sert √† lancer le serveur Ollama, c'est-√†-dire √† d√©marrer l'outil qui fera fonctionner un mod√®le d'IA localement.

### üí° Pourquoi on fait √ßa ?
Pour interagir avec un mod√®le d'intelligence artificielle install√© localement, il faut d'abord d√©marrer un service qui ¬´ √©coute ¬ª et attend nos demandes.

In [None]:
import subprocess
import time

# D√©marrage du serveur Ollama en arri√®re-plan
sub = subprocess.Popen("ollama serve", shell=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
print("üöÄ Serveur Ollama d√©marr√© !")
print("‚è≥ Attente de 5 secondes pour que le serveur soit pr√™t...")
time.sleep(5)
print("‚úÖ Serveur Ollama op√©rationnel !")

## üß† Section 6 : T√©l√©chargement des mod√®les d'IA

### üìò Description p√©dagogique (non technique)
Ces deux commandes permettent de t√©l√©charger des mod√®les d'intelligence artificielle (IA) que l'on utilisera ensuite dans le projet.

### ü§ñ Mod√®les t√©l√©charg√©s :

1. **llama3.2** : un mod√®le de langage (LLM), capable de r√©pondre √† des questions, g√©n√©rer du texte, r√©sumer, etc.

2. **nomic-embed-text** : un mod√®le qui transforme des textes en ¬´ vecteurs ¬ª, une forme que les machines peuvent comprendre pour faire des recherches s√©mantiques ou des comparaisons de sens.

### üí° Pourquoi on fait √ßa ?
Les LLM sont pr√©-entra√Æn√©s. Pour pouvoir les utiliser, il faut d'abord les t√©l√©charger sur votre machine, un peu comme si vous installiez une application.

Sans cela, le syst√®me ne saura pas quel mod√®le utiliser, ni comment r√©pondre aux questions ou traiter les textes.

### ‚ö†Ô∏è Note importante :
Le t√©l√©chargement peut prendre plusieurs minutes selon votre connexion internet.

In [None]:
print("üì• T√©l√©chargement du mod√®le de langage llama3.2...")
!ollama pull llama3.2
print("‚úÖ Mod√®le llama3.2 t√©l√©charg√© !")

print("\nüì• T√©l√©chargement du mod√®le d'embedding nomic-embed-text...")
!ollama pull nomic-embed-text
print("‚úÖ Mod√®le nomic-embed-text t√©l√©charg√© !")

print("\nüéâ Tous les mod√®les sont pr√™ts √† √™tre utilis√©s !")

## üñ•Ô∏è Section 7 : Cr√©ation de l'interface utilisateur avec Streamlit

### üìò Description p√©dagogique (non technique)
Nous allons maintenant cr√©er le fichier `app.py` qui contient tout le code de notre application RAG PDF Chat. Cette application permettra :

### üéØ Fonctionnalit√©s de l'application :
- üìÑ **Upload de PDF** : D√©poser des documents PDF
- üîç **Indexation intelligente** : Analyser et d√©couper les documents
- üí¨ **Chat interactif** : Poser des questions sur vos documents
- üé® **Interface moderne** : Design professionnel avec Streamlit
- üìä **Affichage des sources** : Voir d'o√π viennent les r√©ponses

### üß† Comment √ßa marche ?
1. **Extraction** : Le texte est extrait des PDF
2. **D√©coupage** : Le texte est divis√© en chunks intelligents
3. **Vectorisation** : Chaque chunk devient un vecteur math√©matique
4. **Indexation** : Les vecteurs sont stock√©s dans une base de donn√©es rapide
5. **Recherche** : Quand vous posez une question, on trouve les chunks pertinents
6. **G√©n√©ration** : Le mod√®le IA formule une r√©ponse bas√©e sur ces chunks

In [None]:
# Cr√©ation du fichier app.py avec le code complet de l'application RAG
app_code = '''
from __future__ import annotations

import os
import tempfile
from typing import Any, Dict, List, Optional, Tuple

import faiss  # type: ignore
import numpy as np
import streamlit as st
from PyPDF2 import PdfReader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from sklearn.metrics.pairwise import cosine_similarity

import ollama  # pip install ollama-python

# --------------------- UI & style -----------------------------------------
st.set_page_config(page_title="ü§ñ RAG PDF Chat", page_icon="ü§ñ", layout="wide")

st.markdown(
    """
<style>
html, body {
    font-family: 'Helvetica Neue', sans-serif;
    background-color: #f4f7fa;
}
.sidebar .sidebar-content {
    background-color: #ffffff;
}
.chat-container {
    max-width: 1200px;
    margin: auto;
    padding: 1rem;
}
.user-msg {
    background: #007bff;
    color: white;
    border-radius: 20px 20px 0px 20px;
    padding: 1rem;
    margin: 0.5rem 0;
    align-self: flex-end;
    max-width: 100%;
    word-wrap: break-word;
}
.bot-msg {
    background: #e9ecef;
    color: #212529;
    border-radius: 20px 20px 20px 0px;
    padding: 1rem;
    margin: 0.5rem 0;
    align-self: flex-start;
    max-width: 100%;
    word-wrap: break-word;
}
.chat-area {
    display: flex;
    flex-direction: column;
}
</style>
""",
    unsafe_allow_html=True,
)

# --------------------- Config ---------------------------------------------
MODEL_NAME = "llama3.2:3b"
EMBEDDING_MODEL = "nomic-embed-text:latest"
DOC_TOP_K = 3
CHUNK_TOP_K = 5
CANDIDATES_K = 20
NEIGHBORS = 1
LAMBDA_DIVERSITY = 0.3
SIM_THRESHOLD = 0.25
TEMPERATURE = 0.2
MAX_TOKENS = 2048

# --------------------- Helpers LLM ----------------------------------------

def _call_llm(messages: List[Dict[str, str]], *, temperature: float = 0.1, max_tokens: int = 2048, stream: bool = False):
    return ollama.chat(
        model=MODEL_NAME,
        messages=messages,
        stream=stream,
        options={"temperature": temperature, "num_predict": max_tokens},
    )


def embed_texts(texts: List[str]) -> np.ndarray:
    return np.array([ollama.embeddings(model=EMBEDDING_MODEL, prompt=t)["embedding"] for t in texts], dtype="float32")

# --------------------- PDF utils -----------------------------------------

def clean_text(text: str) -> str:
    import re
    text = re.sub(r"\n{2,}", "\n\n", text)
    text = re.sub(r"(\w+)-\n(\w+)", r"\1\2", text)
    text = re.sub(r"\s{2,}", " ", text)
    return text.strip()


def extract_pdf_text(path: str) -> str:
    return clean_text("\n".join(page.extract_text() or "" for page in PdfReader(path).pages))

# --------------------- Chunking & r√©sum√© ----------------------------------

def auto_chunk_size(tokens: int) -> int:
    return 1024 if tokens < 8000 else 768 if tokens < 20000 else 512


def chunk_document(text: str) -> List[str]:
    size = auto_chunk_size(len(text.split()))
    splitter = RecursiveCharacterTextSplitter(
        separators=["\n\n", "\n", ". "],
        chunk_size=size,
        chunk_overlap=int(size*0.25),
        length_function=len,
    )
    return [c for c in splitter.split_text(text) if len(c) > 100]


def make_summary(text: str) -> str:
    messages = [
        {"role": "system", "content": "Vous √™tes un expert en synth√®se documentaire. R√©sumez le texte suivant en trois parties : (1) Contexte, (2) Points cl√©s, (3) Conclusions. R√©pondez en fran√ßais."},
        {"role": "user", "content": text[:120000]}
    ]
    return _call_llm(messages)["message"]["content"].strip()

# --------------------- Index hi√©rarchique ---------------------------------
class RagIndex:
    def __init__(self):
        self.doc_index: Optional[faiss.IndexFlatIP] = None
        self.chunk_index: Optional[faiss.Index] = None
        self.doc_meta: List[Dict[str, Any]] = []
        self.chunk_meta: List[Dict[str, Any]] = []
        self.chunk_emb: Optional[np.ndarray] = None

    def build(self, uploaded_files: List[st.runtime.uploaded_file_manager.UploadedFile]):
        doc_embs, chunk_embs_list = [], []
        for doc_id, uf in enumerate(uploaded_files):
            with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as tmp:
                tmp.write(uf.getbuffer())
                path = tmp.name
            full_text = extract_pdf_text(path)
            os.unlink(path)

            summary = make_summary(full_text)
            self.doc_meta.append({"filename": uf.name, "summary": summary})
            doc_embs.append(embed_texts([summary])[0])

            chunks = chunk_document(full_text)
            chunk_embs = embed_texts(chunks)
            chunk_embs_list.append(chunk_embs)
            for i, txt in enumerate(chunks):
                self.chunk_meta.append({"doc_id": doc_id, "text": txt, "chunk_id": i})

        self.doc_index = faiss.IndexFlatIP(len(doc_embs[0]))
        self.doc_index.add(np.vstack(doc_embs).astype("float32"))

        self.chunk_emb = np.vstack(chunk_embs_list).astype("float32")
        self.chunk_index = faiss.IndexHNSWFlat(self.chunk_emb.shape[1], 32)
        self.chunk_index.add(self.chunk_emb)

    def _is_global(self, query: str, thr: float = 0.78) -> bool:
        examples = [
            "De quoi parle ce document ?",
            "Quel est le sujet principal ?",
            "Fais un r√©sum√© du document",
        ]
        emb_q = embed_texts([query])[0]
        emb_ex = embed_texts(examples)
        sims = emb_ex @ emb_q / (np.linalg.norm(emb_ex, axis=1) * np.linalg.norm(emb_q) + 1e-6)
        return float(np.max(sims)) >= thr

    def _mmr(self, q: np.ndarray, cand: np.ndarray, k: int) -> List[int]:
        selected, rest = [], list(range(len(cand)))
        while len(selected) < min(k, len(rest)):
            best, best_score = None, -1e9
            for idx in rest:
                sim_q = float(q @ cand[idx] / (np.linalg.norm(q) * np.linalg.norm(cand[idx]) + 1e-6))
                sim_s = max(cosine_similarity(cand[idx][None, :], cand[selected])[0]) if selected else 0.
                score = LAMBDA_DIVERSITY*sim_q - (1-LAMBDA_DIVERSITY)*sim_s
                if score > best_score:
                    best, best_score = idx, score
            selected.append(best)
            rest.remove(best)
        return selected

    def retrieve(self, query: str) -> Tuple[List[str], List[int], Optional[str]]:
        q_emb = embed_texts([query])[0]
        _, I_doc = self.doc_index.search(q_emb[None, :], DOC_TOP_K)
        allowed = set(I_doc[0])

        mask = [i for i, m in enumerate(self.chunk_meta) if m["doc_id"] in allowed]
        sub_emb = self.chunk_emb[mask]
        sub_idx = faiss.IndexFlatIP(sub_emb.shape[1])
        sub_idx.add(sub_emb)
        D, I = sub_idx.search(q_emb[None, :], min(CANDIDATES_K, len(mask)))
        pool = [mask[idx] for idx in I[0]]
        pool = [idx for idx, d in zip(pool, D[0]) if 1-d <= SIM_THRESHOLD] or [mask[I[0][0]]]

        cand_emb = self.chunk_emb[pool]
        selected = [pool[i] for i in self._mmr(q_emb, cand_emb, CHUNK_TOP_K)]
        expanded = {j for idx in selected for j in range(idx-NEIGHBORS, idx+NEIGHBORS+1)}
        final = [i for i in expanded if 0 <= i < len(self.chunk_meta)][:CHUNK_TOP_K]

        contexts = [self.chunk_meta[i]["text"] for i in final]
        summary = self.doc_meta[int(I_doc[0][0])]["summary"] if self._is_global(query) else None
        return contexts, final, summary

# ---------------- Prompt builder -----------------------------------------
def build_prompt(question: str, contexts: List[str], summary: Optional[str], history: List[Dict[str, str]] = None):
    ctx_block = "\n\n".join(f"[{i+1}] {c}" for i, c in enumerate(contexts))
    if summary:
        ctx_block = f"[R√©sum√©] {summary}\n\n" + ctx_block
    
    system = (
        "Vous √™tes un assistant expert. Utilisez uniquement les informations suivantes pour r√©pondre en fran√ßais. "
        "Citez vos sources avec les balises [n]. Si l'information n'est pas trouv√©e, informez-en l'utilisateur."
    )
    
    messages = [{"role": "system", "content": system}]
    
    if history and len(history) > 0:
        previous_messages = history[:-1] if history[-1]["role"] == "user" else history
        messages.extend(previous_messages)
    
    current_user_content = f"CONTEXTE(S):\n{ctx_block}\n\nQUESTION: {question}\n\nR√©ponse:"
    messages.append({"role": "user", "content": current_user_content})
    
    return messages

# ---------------- Etat Streamlit ----------------------------------------
if "messages" not in st.session_state:
    st.session_state.messages = []
if "rag" not in st.session_state:
    st.session_state.rag = None
if "processing" not in st.session_state:
    st.session_state.processing = False

# ---------------- Sidebar upload ----------------------------------------
with st.sidebar:
    st.header("üìö Documents")
    files = st.file_uploader("D√©posez vos PDF", type=["pdf"], accept_multiple_files=True)
    if st.button("üîÑ R√©initialiser"):
        st.session_state.clear()
        st.rerun()

# ---------------- Index construction ------------------------------------
if files and st.session_state.rag is None:
    with st.spinner("üìÑ Indexation en cours‚Ä¶"):
        rag = RagIndex()
        rag.build(files)
        st.session_state.rag = rag
    st.success(f"{len(files)} document(s) index√©(s) ! Posez vos questions.")

# ---------------- Chat display -----------------------------------------
st.markdown("<div class='chat-container'>", unsafe_allow_html=True)
if not st.session_state.messages:
    if st.session_state.rag is not None:
        st.markdown(
            """
            <div class="bot-msg">
            üëã Bonjour ! Je suis votre assistant IA documentaire.
            <br>Posez-moi une question sur le contenu de vos documents.
            </div>
            """,
            unsafe_allow_html=True
        )
    else:
        st.markdown(
            """
            <div class="bot-msg">
            üëã Bienvenue dans RAG PDF Chat !
            <br>Commencez par t√©l√©charger un ou plusieurs documents PDF dans le panneau lat√©ral.
            </div>
            """,
            unsafe_allow_html=True
        )
else:
    st.markdown("<div class='chat-area'>", unsafe_allow_html=True)
    for msg in st.session_state.messages:
        css = "user-msg" if msg["role"] == "user" else "bot-msg"
        st.markdown(f'<div class="{css}">{msg["content"]}</div>', unsafe_allow_html=True)
    st.markdown("</div>", unsafe_allow_html=True)
st.markdown("</div>", unsafe_allow_html=True)

# ---------------- Chat input -------------------------------------------
query = st.chat_input("Votre question‚Ä¶", disabled=st.session_state.processing or st.session_state.rag is None)

if query:
    st.session_state.messages.append({"role": "user", "content": query})
    st.markdown(f'<div class="user-msg">{query}</div>', unsafe_allow_html=True)
    st.session_state.processing = True

    rag: RagIndex = st.session_state.rag  # type: ignore
    contexts, indices, summary = rag.retrieve(query)
    
    prompt = build_prompt(query, contexts, summary, st.session_state.messages)

    placeholder = st.empty()
    collected_parts: List[str] = []

    for chunk in _call_llm(prompt, temperature=TEMPERATURE, max_tokens=MAX_TOKENS, stream=True):
        token = chunk["message"]["content"]
        collected_parts.append(token)
        placeholder.markdown(f'<div class="bot-msg">{"".join(collected_parts)}</div>', unsafe_allow_html=True)

    full_answer = "".join(collected_parts)
    st.session_state.messages.append({"role": "assistant", "content": full_answer})
    st.session_state.processing = False

    with st.expander("üîç Contextes"):
        for i, ctx in enumerate(contexts):
            st.text_area(f"[{i+1}]", ctx, height=120)
'''

# √âcriture du fichier app.py
with open('app.py', 'w', encoding='utf-8') as f:
    f.write(app_code)

print("‚úÖ Fichier app.py cr√©√© avec succ√®s !")
print("üìÅ L'application RAG PDF Chat est maintenant pr√™te.")

## üß™ Section 8 : Test des composants principaux

### üìò Description p√©dagogique (non technique)
Avant de lancer l'application compl√®te, nous allons tester que tous les composants fonctionnent correctement :

### üîç Tests √† effectuer :
1. **Connexion Ollama** : V√©rifier que le serveur r√©pond
2. **Mod√®les disponibles** : Lister les mod√®les t√©l√©charg√©s
3. **Test simple** : G√©n√©rer une r√©ponse de test
4. **Test d'embedding** : Transformer du texte en vecteurs

In [None]:
import ollama
import time

print("üîç Test de la connexion Ollama...")
try:
    # Test de connexion
    models = ollama.list()
    print("‚úÖ Connexion Ollama r√©ussie !")
    print(f"üìã Mod√®les disponibles : {len(models['models'])}")
    
    for model in models['models']:
        print(f"  ü§ñ {model['name']}")
        
except Exception as e:
    print(f"‚ùå Erreur de connexion : {e}")
    print("‚è≥ Attente de 10 secondes suppl√©mentaires...")
    time.sleep(10)

print("\nüß™ Test de g√©n√©ration de texte...")
try:
    response = ollama.chat(
        model='llama3.2',
        messages=[{
            'role': 'user',
            'content': 'Bonjour, peux-tu me dire en une phrase ce que tu peux faire ?'
        }]
    )
    print("‚úÖ Test de g√©n√©ration r√©ussi !")
    print(f"ü§ñ R√©ponse : {response['message']['content']}")
except Exception as e:
    print(f"‚ùå Erreur de g√©n√©ration : {e}")

print("\nüî¢ Test d'embedding...")
try:
    embedding = ollama.embeddings(
        model='nomic-embed-text',
        prompt='Ceci est un test d\'embedding'
    )
    print("‚úÖ Test d'embedding r√©ussi !")
    print(f"üìä Dimension du vecteur : {len(embedding['embedding'])}")
except Exception as e:
    print(f"‚ùå Erreur d'embedding : {e}")

print("\nüéâ Tous les tests sont termin√©s !")

## üöÄ Section 9 : Lancement de l'application RAG PDF Chat

### üìò Description p√©dagogique (non technique)
Cette section permet de lancer une interface web (une mini-application) et de la rendre accessible depuis Internet gr√¢ce √† un outil appel√© LocalTunnel.

### üîß Voici ce que chaque ligne fait :

**`!npm install localtunnel`**
- Installe l'outil LocalTunnel, qui va permettre de partager l'application Streamlit via un lien web.

**`import urllib + print(...)`**
- Affiche l'adresse IP publique de votre environnement pour r√©f√©rence (souvent inutile c√¥t√© utilisateur, mais utile pour des logs ou du debug).

**`!streamlit run app.py &>/content/logs.txt &`**
- Lance l'application Streamlit (app.py) en arri√®re-plan. C'est cette application qui permet d'interagir avec le mod√®le IA via une interface utilisateur.

**`npx localtunnel --port 8501`**
- Cr√©e un lien temporaire et public vers l'application, utilisable depuis n'importe quel navigateur.

### üí° Pourquoi on fait √ßa ?
On cr√©e ici une interface simple et accessible (dans un navigateur) pour interagir avec le mod√®le IA, sans √©crire de code.
Et comme Colab ou certains environnements locaux n'ont pas d'adresse web fixe, LocalTunnel sert de pont entre votre application et le reste du monde.

### üåê Instructions importantes :
1. **Cliquez sur le lien** qui appara√Ætra apr√®s l'ex√©cution
2. **Entrez le mot de passe** qui s'affichera dans les logs
3. **Profitez de votre application** RAG PDF Chat !

### ‚ö†Ô∏è Attention :
- Le lien LocalTunnel est temporaire et change √† chaque ex√©cution
- L'application reste active tant que la cellule tourne
- Pour arr√™ter, utilisez le bouton stop ou red√©marrez le runtime

In [None]:
!npm install localtunnel

import urllib
print("üîë Password/Endpoint IP for localtunnel is:", urllib.request.urlopen('https://ipv4.icanhazip.com').read().decode('utf8').strip("\n"))
print("\nüöÄ Lancement de l'application RAG PDF Chat...")
print("üì± L'interface sera disponible via le lien LocalTunnel qui va appara√Ætre.")
print("‚è≥ Patientez quelques secondes...")

!streamlit run app.py &>/content/logs.txt & npx localtunnel --port 8501

## üéì Guide d'utilisation et conclusion

### üéØ **F√©licitations !** 

Vous avez maintenant une application RAG compl√®tement fonctionnelle ! üéâ

---

### üìñ **Guide d'utilisation de votre application :**

#### 1. **üìÑ Upload de documents**
- Cliquez sur "Browse files" dans la sidebar
- S√©lectionnez un ou plusieurs fichiers PDF
- L'application va automatiquement les analyser et les indexer

#### 2. **üí¨ Interaction avec l'IA**
- Tapez votre question dans la zone de chat
- L'IA va chercher les informations pertinentes dans vos documents
- Elle formulera une r√©ponse bas√©e uniquement sur le contenu de vos PDF

#### 3. **üîç V√©rification des sources**
- Cliquez sur "üîç Contextes" pour voir les extraits utilis√©s
- Chaque r√©ponse est sourc√©e et v√©rifiable

---

### üé® **Exemples de questions √† poser :**

- "De quoi parle ce document ?"
- "Quels sont les points cl√©s ?"
- "Peux-tu r√©sumer les conclusions ?"
- "Que dit le document sur [sujet sp√©cifique] ?"
- "Quelles sont les recommandations ?"

---

### üõ†Ô∏è **Ce que vous avez appris :**

‚úÖ **Configuration d'un environnement IA** sur Google Colab  
‚úÖ **Installation et utilisation d'Ollama** pour les mod√®les locaux  
‚úÖ **Cr√©ation d'un syst√®me RAG** avec indexation vectorielle  
‚úÖ **D√©veloppement d'une interface web** avec Streamlit  
‚úÖ **Traitement et analyse de documents PDF** avec l'IA  
‚úÖ **Deployment avec LocalTunnel** pour partager votre application  

---

### üöÄ **Pour aller plus loin :**

- **Personnaliser l'interface** : Modifier les couleurs et le style
- **Ajouter d'autres formats** : Word, PowerPoint, etc.
- **Am√©liorer les prompts** : Personnaliser les r√©ponses
- **Optimiser les performances** : Ajuster les param√®tres RAG
- **D√©ployer en production** : Utiliser des services cloud

---

### üìö **Ressources pour continuer :**

- [Documentation Ollama](https://ollama.ai/)
- [Documentation Streamlit](https://docs.streamlit.io/)
- [Guide FAISS](https://github.com/facebookresearch/faiss)
- [LangChain Documentation](https://docs.langchain.com/)

---

### ü§ù **Merci d'avoir suivi cette formation !**

Vous ma√Ætrisez maintenant les bases du RAG et pouvez cr√©er vos propres applications d'IA documentaire. N'h√©sitez pas √† exp√©rimenter et √† adapter le code √† vos besoins sp√©cifiques !

---

**üí° Tip :** Sauvegardez ce notebook dans votre Google Drive pour pouvoir le r√©utiliser facilement !