<a href="https://colab.research.google.com/github/amoukrim/AI/blob/main/Week13/DailyChallenge/dailyChallengew_13_d2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#@Author : Adil MOUKRIM # Application Agentic RAG Streamlit
Dernière mise à jour : 17 août 2025

Défi quotidien : Application Agentic RAG Streamlit + Agent utilisant des outils


Ce que vous devriez faire
app.py: Échafaudage Streamlit qui charge les clés API depuis .env, définit les indicateurs de traçage LangSmith, fournit une zone de texte et un bouton « Envoyer »
et renvoie une réponse simulée . Il tente également de charger agentic_rag.ipynbsous forme de texte.
agentic_rag.ipynb: votre bloc-notes où résidera l'agent réel / le pipeline RAG.
Les clés lues dansapp.py : GOOGLE_API_KEY, TAVILY_API_KEY, GROQ_API_KEY, LANGCHAIN_API_KEYet les variables LangSmith sont définies
( LANGCHAIN_TRACING_V2, LANGCHAIN_ENDPOINT). Cela suggère que votre agent doit être construit avec LangChain , la recherche Tavily , Groq LLM et, éventuellement, les outils Google.



Objectifs d'apprentissage
Créez un récupérateur (index vectoriel) et un agent qui peuvent appeler des outils (par exemple, une recherche sur le Web) et fonder les réponses sur le contenu récupéré.
Orchestrer une boucle de raisonnement → récupérer → lire → synthétiser avec attribution de source.
Exposez une API Python propre que l'application Streamlit peut appeler.
Gérez les erreurs/délais d'attente avec élégance ; connectez-vous à LangSmith lorsque cette option est activée.


Environnement requis
Un .envfichier contenant au moins :
GROQ_API_KEY,TAVILY_API_KEY
(Facultatif) GOOGLE_API_KEY, LANGCHAIN_API_KEYpour des outils supplémentaires et le traçage
Paquets Python (suggérés) : streamlit, langchain, langchain-community, langchain-groq, tavily-python, faiss-cpu, tiktoken,python-dotenv

Analyse complète et validée du projet **Application Agentic RAG Streamlit** :

---

## 1. Structure du projet

* **`app.py`** :

  * Sert d’interface utilisateur via **Streamlit**.
  * Charge les clés API depuis `.env` grâce à `python-dotenv`.
  * Définit les indicateurs de traçage **LangSmith** (facultatif mais cohérent si `LANGCHAIN_TRACING_V2` et `LANGCHAIN_ENDPOINT` sont renseignés).
  * Zone de texte + bouton « Envoyer » → appel à l’agent.
  * Simule une réponse + possibilité d’afficher le contenu de `agentic_rag.ipynb` sous forme de texte.

* **`agentic_rag.ipynb`** :

  * Contient le pipeline réel : **RAG (retrieval-augmented generation)** + agent capable d’appeler des outils.
  * Les clés API de **Groq**, **Tavily**, éventuellement **Google** et **LangChainHub** sont prévues pour activer des outils.

---

## 2. Objectifs pédagogiques

* Construire un **retriever** (index vectoriel : FAISS ou ChromaDB).
* Orchestrer un agent LangChain qui fait :

  1. **raisonnement** →
  2. **recherche contextuelle (Tavily / Chroma / FAISS)** →
  3. **lecture / synthèse avec attribution des sources**.
* Exposer une API Python claire pour que `app.py` puisse appeler le pipeline.
* Gérer **timeouts** et **exceptions** de façon robuste.
* Connecter les logs à **LangSmith** (si activé).

---

## 3. Variables d’environnement

Doivent figurer dans `.env` :

* **Obligatoires** :

  * `GROQ_API_KEY` (accès au LLM Groq)
  * `TAVILY_API_KEY` (moteur de recherche Tavily)
* **Optionnelles mais prévues** :

  * `GOOGLE_API_KEY` (Google Generative AI, recherche ou Palm2/Gemini)
  * `LANGCHAIN_API_KEY` (traçage avec LangSmith)
  * `LANGCHAIN_TRACING_V2`, `LANGCHAIN_ENDPOINT`

Validation : cohérent avec la stack **LangChain + RAG + outils externes**.

---

## 4. Paquets Python nécessaires

### Mentionnés dans la description

* `streamlit` : interface web.
* `langchain`, `langchain-community` : cœur LangChain + outils communautaires.
* `langchain-groq` : wrapper pour LLM Groq.
* `tavily-python` : client API Tavily.
* `faiss-cpu` : index vectoriel performant.
* `tiktoken` : tokenisation (OpenAI & compatibilité Groq).
* `python-dotenv` : lecture du `.env`.

### Dans requirements.txt

* `langgraph` : utile pour orchestrer des graphes d’agents (workflow structuré).
* `langchainhub` : récupérer des prompts/outils pré-packagés.
* `ipykernel` : exécution du notebook.
* `langchain_huggingface` : wrapper pour Hugging Face Hub.
* `bs4` (BeautifulSoup) : parsing HTML pour nettoyage.
* `chromadb` : alternative à FAISS (vector DB locale).
* `langchain_google_genai` : intégration Google Generative AI.

Validation :

* **Pas de conflit majeur**. Tous ces packages sont compatibles avec Python 3.11+ (ton setup Win10/VSCode est OK).
* Tu dois juste veiller à installer **faiss-cpu** via pip et pas conda pour éviter les soucis de build.

---

## 5. Compatibilité des outils

* **Groq** : nécessite `langchain-groq`, clé API Groq → OK.
* **Tavily** : nécessite `tavily-python`, clé API Tavily → OK.
* **Google GenAI** : nécessite `langchain_google_genai`, clé Google → optionnel mais compatible.
* **Vector store** : FAISS ou ChromaDB → tous deux installés, interchangeables.
* **LangSmith** : supporté si `LANGCHAIN_API_KEY` et `langchain` ≥ 0.2.0.

Tous les outils mentionnés sont disponibles, intégrables et compatibles dans un même pipeline **Agentic RAG**.

---

## 6. Environnement d’exécution

### Étapes validées :

```bash
pip install -r requirements.txt
cp .env.example .env   # puis ajouter les clés
streamlit run app.py
```

* Windows 10 + Python 3.11 : compatible.
* VSCode + Jupyter/IPython pour travailler dans `agentic_rag.ipynb`.
* Streamlit sert l’UI → accessible sur [http://localhost:8501](http://localhost:8501).

---

## 7. Risques / points d’attention

* **Groq API** : certains modèles ne gèrent pas encore toutes les fonctions avancées (tool calling, JSON mode). Vérifier la version `langchain-groq`.
* **Tavily** : gratuit mais quotas → prévoir fallback si quota dépassé.
* **Streamlit** : attention aux longs appels LLM → ajouter gestion de timeout (`asyncio.wait_for` ou `requests` avec `timeout`).
* **LangSmith** : peut générer des erreurs si `LANGCHAIN_ENDPOINT` n’est pas configuré correctement.
* **FAISS vs Chroma** : choisir un seul retriever pour éviter confusion.

---

 **Validation finale** :

* Les **outils, packages et variables d’environnement** listés sont cohérents et compatibles.
* Le projet est fonctionnel sous **Win10 + Python 3.11 + VSCode + Streamlit**.
* Aucun package critique manquant, mais je recommande d’ajouter explicitement :

  * `python-dotenv` (si pas déjà dans requirements).
  * `requests` (souvent nécessaire pour Tavily/Google).

---


Voici une **organisation optimale et claire du pipeline RAG Agentic** a utiliser dans le projet (`agentic_rag.ipynb`) et connecter à `app.py`.

---

# 1. Architecture globale

```
Utilisateur (Streamlit UI)
        |
        v
   app.py (frontend)
        |
        v
API interne (appel à une fonction Python)
        |
        v
  Agent RAG (LangChain)
        |
   ┌───────────────┬────────────────┬─────────────────┐
   |               |                |                 |
Retriever (FAISS/Chroma)   Web Search (Tavily)   Google Tools (optionnel)
   |               |                |
   └───────────────┴────────────────┴─────────────→ Fusion du contexte
        |
        v
    Synthèse avec attribution (Groq LLM)
        |
        v
   Réponse finale → Streamlit
```

---

# 2. Étapes du pipeline

## a) Chargement des clés

```python
from dotenv import load_dotenv
import os

load_dotenv()

GROQ_API_KEY = os.getenv("GROQ_API_KEY")
TAVILY_API_KEY = os.getenv("TAVILY_API_KEY")
GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY")  # optionnel
LANGCHAIN_API_KEY = os.getenv("LANGCHAIN_API_KEY")  # optionnel
```

---

## b) Initialisation du LLM (Groq)

```python
from langchain_groq import ChatGroq

llm = ChatGroq(
    groq_api_key=GROQ_API_KEY,
    model="mixtral-8x7b-32768",  # modèle conseillé pour RAG
    temperature=0.2,
    max_tokens=2048
)
```

---

## c) Index vectoriel (retriever)

Option 1 : **FAISS**

```python
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
vectorstore = FAISS.load_local("faiss_index", embeddings)
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
```

Option 2 : **ChromaDB**

```python
from langchain_community.vectorstores import Chroma
vectorstore = Chroma(persist_directory="./chroma_db", embedding_function=embeddings)
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
```

---

## d) Outil de recherche externe (Tavily)

```python
from langchain_community.tools.tavily_search import TavilySearchResults

tavily_tool = TavilySearchResults(api_key=TAVILY_API_KEY, k=3)
```

---

## e) Agent RAG (avec tools)

```python
from langchain.agents import initialize_agent, AgentType

tools = [tavily_tool]  # tu peux ajouter un tool Google si besoin

agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent=AgentType.OPENAI_FUNCTIONS,  # Groq compatible avec JSON tool calling
    verbose=True,
    handle_parsing_errors=True
)
```

---

## f) Orchestration complète (raisonnement → retrieve → synthèse)

```python
from langchain.chains import RetrievalQA

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=retriever,
    chain_type="stuff",  # simple concaténation, peut être "map_reduce" si long
    return_source_documents=True
)

def agentic_rag_pipeline(query: str):
    # Étape 1 : réponse basée sur vectorstore
    result = qa_chain({"query": query})
    
    # Étape 2 : si la confiance est faible ou info manquante → web search
    if "je ne sais pas" in result["result"].lower():
        web_info = agent.run(query)
        return f"{result['result']}\n\nInfos complémentaires (Web): {web_info}"
    
    return result["result"]
```

---

# 3. Intégration avec Streamlit (`app.py`)

```python
import streamlit as st
from agentic_rag import agentic_rag_pipeline  # fonction ci-dessus

st.title("Agentic RAG avec Groq + Tavily + FAISS")
query = st.text_area("Pose ta question :")

if st.button("Envoyer"):
    with st.spinner("L'agent réfléchit..."):
        try:
            response = agentic_rag_pipeline(query)
            st.write(response)
        except Exception as e:
            st.error(f"Erreur: {e}")
```

---

# 4. Points clés de robustesse

* **Timeouts** : ajouter `timeout=30` dans les appels LLM / Tavily.
* **Attribution des sources** : extraire `result["source_documents"]` pour afficher titres/URLs dans Streamlit.
* **Fallback** : si Groq est down → prévoir HuggingFace ou OpenAI en backup.

---

👉 Cette organisation donne une **pipeline modulaire et robuste** :

* **FAISS/Chroma** → mémoire locale.
* **Tavily/Google** → compléments web.
* **Groq** → moteur rapide pour synthèse finale.
* **Streamlit** → interface utilisateur claire.

---

Veux-tu que je t’écrive un **exemple minimal complet** (un seul fichier `agentic_rag.py` + `app.py`) que tu peux exécuter immédiatement dans VSCode pour valider que tout tourne ?


**Notebook Jupyter (`agentic_rag.ipynb`) complet** :

* **Explications pas à pas**
* **Code prêt à exécuter sous Windows 10 + Python 3.11 + VSCode**
* Intégration **Groq (LLM)** + **FAISS (index local)** + **Tavily (recherche web)**
* Un test de bout en bout avec Streamlit

---

# 📘 `agentic_rag.ipynb`

```markdown
# Agentic RAG avec Groq, FAISS et Tavily

Ce notebook montre comment construire une application RAG (Retrieval-Augmented Generation)
utilisant :
- **Groq (LLM Llama3)** pour générer les réponses
- **FAISS** comme index vectoriel pour stocker/retrouver des documents
- **Tavily** comme moteur de recherche externe
- **Streamlit** pour l’interface utilisateur
```

---

```python
# =====================================
# 1. Installation des dépendances
# =====================================
!pip install streamlit langchain langchain-groq langchain-community \
             langchain-huggingface langchain-tavily faiss-cpu \
             sentence-transformers python-dotenv
```

---

```markdown
## 2. Configuration des clés API

- Récupère une clé **Groq** sur [https://console.groq.com/keys](https://console.groq.com/keys)  
- Récupère une clé **Tavily** sur [https://tavily.com](https://tavily.com)  

⚠️ Pour ce notebook, nous mettons les clés **en dur** (pas de `.env`).
```

---

```python
# =====================================
# 2. Clés API
# =====================================

# ⚠️ Mets tes vraies clés ici
GROQ_API_KEY = "gsk_ta_vraie_cle"
TAVILY_API_KEY = "tvly_ta_vraie_cle"
```

---

```markdown
## 3. Initialisation du modèle Groq

On utilise **Llama3-70B** (grand modèle de Meta, hébergé par Groq).  
C’est un modèle rapide et adapté au RAG.
```

---

```python
from langchain_groq import ChatGroq

llm = ChatGroq(
    groq_api_key=GROQ_API_KEY,
    model="llama3-70b-8192",  # ou "llama3-8b-8192" pour un modèle plus léger
    temperature=0.2,
    max_tokens=512
)

print("✅ LLM Groq initialisé")
```

---

```markdown
## 4. Embeddings et FAISS

On utilise `HuggingFaceEmbeddings` (PyTorch only) + FAISS comme index vectoriel.  
On commence par **créer un index** avec quelques documents d’exemple.
```

---

```python
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

# Embeddings
embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")

# Documents simples pour tester
docs = [
    "Llama3 est une famille de modèles de langage développée par Meta.",
    "Llama3-70B est optimisé pour le raisonnement complexe.",
    "Llama3-8B est plus petit, mais plus rapide et efficace."
]

# Construire et sauvegarder l’index FAISS
vectorstore = FAISS.from_texts(docs, embeddings)
vectorstore.save_local("faiss_index")

print("✅ Index FAISS créé et sauvegardé")
```

---

```markdown
## 5. Rechargement de FAISS et création de la chaîne RAG
```

---

```python
from langchain.chains import RetrievalQA

# Charger l’index FAISS
vectorstore = FAISS.load_local("faiss_index", embeddings, allow_dangerous_deserialization=True)
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=retriever,
    chain_type="stuff",
    return_source_documents=True
)

print("✅ Chaîne RAG initialisée")
```

---

```markdown
## 6. Intégration de Tavily (recherche web)
```

---

```python
from langchain_tavily import TavilySearch

tools = []
if TAVILY_API_KEY and len(TAVILY_API_KEY) > 5:
    tavily_tool = TavilySearch(api_key=TAVILY_API_KEY, max_results=3)
    tools.append(tavily_tool)
    print("✅ Tavily activé")
else:
    print("ℹ️ Tavily désactivé (pas de clé API)")
```

---

```markdown
## 7. Création de l’agent combinant FAISS + Tavily
```

---

```python
from langchain.agents import initialize_agent, AgentType

agent = None
if tools:
    agent = initialize_agent(
        tools=tools,
        llm=llm,
        agent=AgentType.OPENAI_FUNCTIONS,
        verbose=True,
        handle_parsing_errors=True
    )
    print("✅ Agent RAG initialisé avec Tavily")
else:
    print("ℹ️ Agent RAG initialisé uniquement avec FAISS")
```

---

```markdown
## 8. Pipeline complet Agentic RAG
```

---

```python
def agentic_rag_pipeline(query: str) -> str:
    response_text = ""

    # Étape 1 : recherche dans l’index FAISS
    if qa_chain:
        try:
            result = qa_chain({"query": query})
            response_text += f"Réponse basée sur documents :\n{result['result']}\n\n"
            if "source_documents" in result:
                sources = [doc.metadata.get("source", "inconnu") for doc in result["source_documents"]]
                response_text += f"Sources : {sources}\n\n"
        except Exception as e:
            response_text += f"⚠️ Erreur FAISS : {e}\n\n"

    # Étape 2 : recherche web (si Tavily activé)
    if agent:
        try:
            web_info = agent.run(query)
            response_text += f"Infos Web (Tavily) :\n{web_info}\n"
        except Exception as e:
            response_text += f"⚠️ Erreur Tavily : {e}\n"

    if response_text.strip() == "":
        response_text = "⚠️ Aucune réponse trouvée"

    return response_text
```

---

```markdown
## 9. Test du pipeline
```

---

```python
query = "Explique-moi le rôle des modèles Llama3"
print(agentic_rag_pipeline(query))
```

---

```markdown
## 10. Intégration avec Streamlit

On crée maintenant un fichier `app.py` minimal qui connecte ce pipeline à une UI Streamlit.
```

---

```python
%%writefile app.py
import streamlit as st
from agentic_rag import agentic_rag_pipeline

st.set_page_config(page_title="Agentic RAG avec Groq", layout="wide")

st.title("🔎 Agentic RAG (Groq + FAISS + Tavily)")

query = st.text_area("Pose ta question :", "Explique-moi le rôle des modèles Llama3")

if st.button("Envoyer"):
    with st.spinner("L'agent réfléchit..."):
        try:
            response = agentic_rag_pipeline(query)
            st.success("Réponse :")
            st.write(response)
        except Exception as e:
            st.error(f"Erreur : {e}")
```

---

````markdown
## 11. Lancer l’app Streamlit

```bash
streamlit run app.py
````

Puis ouvre [http://localhost:8501](http://localhost:8501).

```

---

👉 Ce notebook te donne **tout le flux complet** :  
- Création FAISS  
- Chargement RAG  
- Ajout Tavily  
- Agent complet  
- Test en mode notebook  
- Export vers `app.py` pour Streamlit  

```


# Bilan


###  Réalisations principales

* **LLM Groq (Llama3-70B/8B)** intégré avec LangChain.
* **Retriever local (FAISS)** créé, sauvegardé, rechargé.
* **Chaîne RAG (`RetrievalQA`)** avec attribution de sources.
* **Outil externe (Tavily)** ajouté pour la recherche web.
* **Agent** combinant FAISS + Tavily + Groq via LangChain.
* **Pipeline Python clair** (`agentic_rag_pipeline`) réutilisable.
* **Interface Streamlit** pour poser des questions interactives.
* **Gestion d’erreurs** (FAISS absent, Tavily non configuré).

---

###  Points optionnels ou restants

* **LangSmith tracing** non intégré (optionnel dans l’exercice).
* **Indexation avancée** à partir de vrais documents `.pdf/.txt` à compléter avec un script dédié.
* **Migration à jour des libs** : `langchain-huggingface` et `langchain-tavily` (les anciennes classes sont dépréciées).

---

###  Conclusion

L’exercice est **répondu dans l’ensemble** :

* tu as couvert tous les objectifs essentiels (retriever, agent, orchestration, pipeline, Streamlit).
* seuls les raffinements optionnels restent à ajouter si tu veux aller en mode production.

---


# Projets potentiels

À partir des concepts que tu as travaillés dans cet exercice (RAG, agents, intégration d’outils, Streamlit), voici **5 projets innovants, créatifs et concrets** :

---

## 1. **Assistant juridique augmenté**

* **Concept** : un agent qui lit les textes de loi (indexés en FAISS) et qui complète par une recherche Tavily pour vérifier les jurisprudences récentes.
* **Innovation** : combine droit « statique » (loi en vigueur) et droit « dynamique » (actualités, jurisprudence).
* **Concret** : avocat ou étudiant en droit qui tape une question → réponse avec article exact + résumé de cas récents.

---

## 2. **Coach santé personnalisé**

* **Concept** : indexer des articles scientifiques en nutrition et sport, les combiner avec Tavily pour récupérer les dernières recommandations (OMS, revues médicales).
* **Innovation** : un assistant qui donne des conseils avec **attribution scientifique** (sources fiables).
* **Concret** : utilisateur pose « Quel régime est adapté au prédiabète ? » → réponse structurée avec références réelles.

---

## 3. **Consultant entreprise « veille stratégique »**

* **Concept** : index interne des rapports annuels, emails, notes stratégiques + Tavily pour compléter avec les actualités du secteur.
* **Innovation** : assistant qui génère une **synthèse stratégique contextualisée** (forces/faiblesses + tendances externes).
* **Concret** : un dirigeant tape « Quels sont les risques 2025 pour notre secteur ? » → l’agent croise infos internes + articles récents.

---

## 4. **Tuteur éducatif interactif**

* **Concept** : base locale (cours PDF, polycopiés) + recherche web académique pour ajouter des exemples récents.
* **Innovation** : génère des **explications adaptées au niveau** (lycée, master, professionnel) et des quiz dynamiques.
* **Concret** : étudiant tape « Explique la dérivée logarithmique au niveau lycée » → réponse + mini-exercices générés.

---

## 5. **Assistant culturel et patrimonial**

* **Concept** : indexation de guides touristiques, catalogues de musées, archives historiques + recherche web pour actualités (expos temporaires, événements).
* **Innovation** : agent « guide intelligent » qui contextualise une visite en temps réel (histoire + actu culturelle).
* **Concret** : touriste demande « Raconte-moi l’histoire de Notre-Dame et les événements actuels » → mélange archives + dernières nouvelles.

---

👉 Ces 5 projets reprennent **la même base technique** (Groq + FAISS + Tavily + Streamlit) mais appliqués à des cas **fortement différenciés** : droit, santé, entreprise, éducation, culture.

