Skip to content

dallel5-git/revision-assistant

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🤖 Assistant Documentaire Intelligent (RAG)

Une application web interactive construite avec Streamlit et LangChain qui permet de discuter avec des documents PDF en utilisant une architecture de génération augmentée par récupération (RAG).

🌟 Fonctionnalités

  • Chargement de PDF : Extraction de texte intelligente via PyPDFLoader.
  • Traitement de texte : Découpage optimisé avec RecursiveCharacterTextSplitter.
  • Embeddings de pointe : Utilisation des modèles HuggingFace pour transformer le texte en vecteurs.
  • Base de données vectorielle : Stockage local rapide avec FAISS.
  • LLM Local : Intégration avec Ollama (ChatOllama) pour une confidentialité totale des données.

🛠️ Installation

  1. Cloner le projet :

    git clone [https://github.com/ton-pseudo/nom-du-repo.git](https://github.com/ton-pseudo/nom-du-repo.git)
    cd nom-du-repo
  2. Créer un environnement virtuel :

    python -m venv .venv
    source .venv/bin/activate  # Sur Windows: .venv\Scripts\activate
  3. Installer les dépendances :

    pip install -r requirements.txt
  4. Configuration locale : Assurez-vous qu'Ollama est installé et qu'un modèle (ex: llama3 ou mistral) est en cours d'exécution.J'ai utilisé gemma:2b qui est un modèle léger.

🚀 Utilisation

Lancez l'application avec la commande suivante :

streamlit run app.py
-------------------------------------------- Architecture Technique -------------------------------------------
L'application suit le flux suivant :

Ingestion : Lecture du PDF.

Splitting : Découpage en segments cohérents.

Embedding : Vectorisation via sentence-transformers.

Retrieval : Recherche de contexte pertinent dans FAISS.

Generation : Réponse générée par le LLM via LangChain.

About

A lightweight AI tool to chat with your PDF study materials. Privacy-focused RAG system using local LLMs for instant document insights.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages