# 🧬 Assistant Médical RAG — Guide d’installation et d’exécution

Ce guide explique comment **installer, configurer et exécuter** ton assistant biomédical RAG localement.  
Le système combine **LangChain**, **Qdrant** et **BioMistral-7B** pour permettre des recherches intelligentes dans des documents PDF médicaux — même **hors connexion**.

---

## ⚙️ 1. Installation des dépendances

Crée d’abord un environnement virtuel et installe les bibliothèques nécessaires :

```bash
python -m venv venv
source venv/bin/activate   # sous Linux / Mac
# .\venv\Scripts\activate  # sous Windows
pip install -r requirements.txt
```

---

## 🧩 2. Configuration et démarrage de Qdrant

**Qdrant** est la base vectorielle qui stocke les embeddings de tes documents.

Télécharge et démarre le conteneur Docker :

```bash
docker pull qdrant/qdrant
docker run -p 6333:6333 --name qdrant --rm qdrant/qdrant
```

📍 Interface Web : [http://localhost:6333/dashboard](http://localhost:6333/dashboard)

> Par défaut, l’application se connecte à **[http://localhost:6333](http://localhost:6333)**

---

## 📚 3. Création de la base de données vectorielle

Place tes fichiers **PDF** dans le dossier `data/`, puis exécute :

```bash
python create_vector_db.py
```

Ce script :

* Extrait le texte des PDF  
* Découpe le contenu en *chunks*  
* Crée les embeddings via **PubMedBERT**  
* Stocke les vecteurs dans **Qdrant**

💡 Tu peux aussi exécuter le notebook `create_vector_db.ipynb` pour voir chaque étape pas à pas.

---

## 🚀 4. Lancement de l’application FastAPI

Démarre le serveur de l’assistant :

```bash
uvicorn app:app --reload
```

Ouvre ensuite ton navigateur à l’adresse :  
👉 **[http://127.0.0.1:8000](http://127.0.0.1:8000)**

Depuis l’interface web, tu peux :

* **Uploader** de nouveaux fichiers PDF  
* **Supprimer** la base actuelle  
* **Poser des questions** sur le contenu  
* Voir les **sources citées** pour chaque réponse

---

## 🧠 5. Schéma de fonctionnement du système

```
PDF → Extraction → Découpage → Embeddings (PubMedBERT)
      ↓
   Qdrant (base vectorielle)
      ↓
Récupération du contexte → BioMistral-7B (LlamaCpp)
      ↓
Réponse + Source
```

---

## 💡 Conseils utiles

* Pour ajuster le prompt ou le nombre de passages (`k`), modifie `settings.py`.  
* Pour changer de modèle `.gguf`, mets à jour la variable `LLM_PATH`.  
* Après le téléchargement initial des modèles, le système peut fonctionner **hors-ligne**.  
* Tu peux évaluer les performances de ton RAG avec des outils comme **RAGAS** ou **LangSmith**.  
* Vérifie que **Qdrant** tourne bien sur le port `6333` avant de lancer l’app.

---

## ✅ Résumé rapide des commandes

```bash
# 1. Installer les dépendances
pip install -r requirements.txt

# 2. Lancer Qdrant
docker run -p 6333:6333 --rm qdrant/qdrant

# 3. Créer la base vectorielle
python create_vector_db.py

# 4. Lancer l’application FastAPI
uvicorn app:app --reload
```

---

## 🧾 Licence et attribution

Projet open-source à usage académique  
© 2025 **Ahmed Aboutaib** — INSEA / ICube (CNRS)

---
