# üöÅ Application RAG pour Drones Agricoles - CORRIG√âE

Application Streamlit compl√®te avec RAG (Retrieval-Augmented Generation)

**‚úÖ Sans API externe - 100% local**

**‚úÖ D√©tection des questions hors sujet**

## üì¶ Installation des d√©pendances

In [None]:
!pip install -q streamlit sentence-transformers transformers torch numpy accelerate pyngrok

[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m10.2/10.2 MB[0m [31m37.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m6.9/6.9 MB[0m [31m62.3 MB/s[0m eta [36m0:00:00[0m
[?25h

## üìù Cr√©ation de l'application Streamlit

In [None]:
%%writefile app.py
import streamlit as st
import numpy as np
import torch
from sentence_transformers import SentenceTransformer
from transformers import AutoTokenizer, AutoModelForCausalLM

# Configuration de la page
st.set_page_config(
    page_title="RAG - Drones Agricoles",
    page_icon="üöÅ",
    layout="wide"
)

# Donn√©es exemples sur les drones agricoles
DOCUMENT_CHUNKS = [
    """Les drones agricoles sont des v√©hicules a√©riens sans pilote utilis√©s dans l'agriculture de pr√©cision.
    Ils permettent de surveiller les cultures, d'analyser la sant√© des plantes et d'optimiser l'utilisation
    des ressources comme l'eau et les engrais. Les drones modernes sont √©quip√©s de cam√©ras multispectrales
    et de capteurs avanc√©s.""",

    """L'application de pesticides par drone offre plusieurs avantages : pr√©cision accrue, r√©duction de
    l'exposition humaine aux produits chimiques, et meilleure couverture des zones difficiles d'acc√®s.
    Les drones peuvent pulv√©riser de mani√®re cibl√©e, r√©duisant ainsi l'utilisation de pesticides de 30 √† 50%.""",

    """Les capteurs multispectraux mont√©s sur les drones capturent des images dans diff√©rentes longueurs d'onde,
    permettant d'√©valuer la sant√© des cultures. L'indice NDVI (Normalized Difference Vegetation Index) est
    couramment utilis√© pour d√©tecter le stress hydrique et les maladies des plantes avant qu'elles ne soient
    visibles √† l'≈ìil nu.""",

    """Le co√ªt d'un drone agricole professionnel varie entre 5 000‚Ç¨ et 50 000‚Ç¨ selon les fonctionnalit√©s.
    Les mod√®les d'entr√©e de gamme conviennent √† la surveillance basique, tandis que les mod√®les haut de gamme
    offrent des capacit√©s de cartographie 3D, d'analyse thermique et de pulv√©risation autonome.""",

    """L'autonomie des drones agricoles varie g√©n√©ralement entre 20 et 45 minutes de vol. Les batteries au
    lithium-polym√®re sont les plus courantes. Pour couvrir de grandes surfaces, les op√©rateurs utilisent
    plusieurs batteries ou des stations de recharge automatiques.""",

    """La r√©glementation sur l'utilisation des drones agricoles varie selon les pays. En g√©n√©ral, un permis
    de pilotage est requis pour les op√©rations commerciales. Les drones doivent respecter des hauteurs de vol
    maximales (souvent 120m) et des distances minimales avec les zones habit√©es.""",

    """L'intelligence artificielle et le machine learning transforment l'agriculture par drone. Les algorithmes
    peuvent d√©tecter automatiquement les mauvaises herbes, compter les plantes, estimer les rendements et
    identifier les zones n√©cessitant une attention particuli√®re.""",

    """Les drones agricoles peuvent √©galement √™tre utilis√©s pour la pollinisation assist√©e, le comptage du
    b√©tail, la surveillance des cl√¥tures et des infrastructures agricoles. Certains mod√®les sp√©cialis√©s
    peuvent m√™me planter des graines dans des zones difficiles d'acc√®s."""
]

# Seuil de similarit√© minimum (IMPORTANT pour d√©tecter les questions hors sujet)
SIMILARITY_THRESHOLD = 0.3  # Ajustable : plus √©lev√© = plus strict

# Cache pour les mod√®les
@st.cache_resource
def load_embedding_model():
    """Charge le mod√®le d'embeddings"""
    with st.spinner("Chargement du mod√®le d'embeddings..."):
        model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')
    return model

@st.cache_resource
def load_llm_model():
    """Charge le mod√®le de langage"""
    with st.spinner("Chargement du mod√®le de langage (cela peut prendre quelques minutes)..."):
        model_name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
        tokenizer = AutoTokenizer.from_pretrained(model_name)
        model = AutoModelForCausalLM.from_pretrained(
            model_name,
            torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32,
            device_map="auto" if torch.cuda.is_available() else None
        )
    return tokenizer, model

@st.cache_data
def generate_document_embeddings(_embedding_model):
    """G√©n√®re les embeddings des documents"""
    embeddings = _embedding_model.encode(DOCUMENT_CHUNKS)
    return embeddings

def find_similar_chunks(query_embedding, document_embeddings, k=3):
    """Trouve les k chunks les plus similaires"""
    query_norm = query_embedding / np.linalg.norm(query_embedding)
    docs_norm = document_embeddings / np.linalg.norm(document_embeddings, axis=1, keepdims=True)
    similarities = np.dot(docs_norm, query_norm)
    top_k_indices = np.argsort(similarities)[::-1][:k]
    return top_k_indices, similarities[top_k_indices]

def is_question_relevant(max_similarity, threshold=SIMILARITY_THRESHOLD):
    """V√©rifie si la question est pertinente par rapport au document"""
    return max_similarity >= threshold

def generate_rag_response(user_query, embedding_model, document_embeddings, tokenizer, model, k=3, similarity_threshold=SIMILARITY_THRESHOLD):
    """G√©n√®re une r√©ponse RAG avec v√©rification de pertinence"""
    query_embedding = embedding_model.encode(user_query)
    top_k_indices, similarities = find_similar_chunks(query_embedding, document_embeddings, k=k)

    # V√©rifier si la question est pertinente
    max_similarity = similarities[0]

    if not is_question_relevant(max_similarity, similarity_threshold):
        return (
            "‚ùå D√©sol√©, votre question ne semble pas √™tre li√©e aux drones agricoles. "
            "Je ne peux r√©pondre qu'aux questions concernant les drones agricoles, "
            "leurs capteurs, leur utilisation, leur co√ªt, leur r√©glementation, etc.",
            [],
            similarities,
            False  # Indique que la question n'est pas pertinente
        )

    retrieved_context = [DOCUMENT_CHUNKS[i] for i in top_k_indices]
    context_string = "\n\n".join(retrieved_context)

    prompt = f"""Utilisez UNIQUEMENT les informations suivantes pour r√©pondre √† la question de l'utilisateur.
Si vous ne trouvez pas la r√©ponse dans le contexte fourni, dites clairement "Je ne trouve pas cette information dans ma base de connaissances sur les drones agricoles".
Ne r√©pondez PAS avec vos connaissances g√©n√©rales. Utilisez SEULEMENT le contexte fourni.
R√©pondez en fran√ßais de mani√®re claire et concise.

Contexte:
{context_string}

Question de l'utilisateur: {user_query}

R√©ponse:"""

    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=2048)
    if torch.cuda.is_available():
        inputs = inputs.to(model.device)

    with torch.no_grad():
        generated_tokens = model.generate(
            **inputs,
            max_new_tokens=200,
            temperature=0.7,
            top_k=50,
            top_p=0.95,
            do_sample=True
        )

    response = tokenizer.decode(
        generated_tokens[0][inputs['input_ids'].shape[1]:],
        skip_special_tokens=True
    )

    return response, retrieved_context, similarities, True  # True = question pertinente

# Interface Streamlit
def main():
    st.title("üöÅ Interface RAG pour Drones Agricoles")
    st.markdown("### Posez vos questions sur les drones agricoles")

    with st.sidebar:
        st.header("‚ÑπÔ∏è √Ä propos")
        st.write("Application RAG locale pour les drones agricoles")

        st.header("üîß Configuration")
        k_chunks = st.slider("Nombre de chunks", 1, 5, 3)

        st.markdown("---")
        st.subheader("üéØ Seuil de pertinence")
        similarity_threshold = st.slider(
            "Seuil minimum de similarit√©",
            min_value=0.0,
            max_value=0.6,
            value=0.3,
            step=0.05,
            help="Questions avec similarit√© < seuil seront rejet√©es. Plus √©lev√© = plus strict."
        )

        if similarity_threshold < 0.2:
            st.warning("‚ö†Ô∏è Seuil bas : acceptera presque toutes les questions")
        elif similarity_threshold > 0.4:
            st.info("‚úÖ Seuil √©lev√© : rejettera les questions peu pertinentes")

        st.header("üìä Base de connaissances")
        st.info(f"**{len(DOCUMENT_CHUNKS)}** documents")

        st.header("ü§ñ Mod√®les")
        st.write("**Embeddings:** all-MiniLM-L6-v2")
        st.write("**LLM:** TinyLlama-1.1B")

    try:
        embedding_model = load_embedding_model()
        tokenizer, llm_model = load_llm_model()
        document_embeddings = generate_document_embeddings(embedding_model)
        st.success("‚úÖ Mod√®les charg√©s avec succ√®s!")
    except Exception as e:
        st.error(f"‚ùå Erreur: {str(e)}")
        return

    st.markdown("---")
    user_query = st.text_input(
        "‚ùì Votre question:",
        placeholder="Ex: Comment fonctionnent les capteurs multispectraux ?"
    )

    st.markdown("**üí° Exemples:**")
    col1, col2, col3 = st.columns(3)

    with col1:
        if st.button("Co√ªt d'un drone"):
            user_query = "Quel est le co√ªt d'un drone agricole ?"

    with col2:
        if st.button("D√©tection stress"):
            user_query = "Comment d√©tecter le stress hydrique ?"

    with col3:
        if st.button("Autonomie"):
            user_query = "Quelle est l'autonomie des drones ?"

    # Section pour tester les questions hors sujet
    with st.expander("üß™ Tester des questions hors sujet"):
        st.write("Cliquez pour tester la d√©tection des questions non pertinentes:")
        col1, col2, col3 = st.columns(3)
        with col1:
            if st.button("Question cuisine üç≥"):
                user_query = "Comment faire une omelette ?"
        with col2:
            if st.button("Question sport ‚öΩ"):
                user_query = "Qui a gagn√© la coupe du monde ?"
        with col3:
            if st.button("Question m√©t√©o üå§Ô∏è"):
                user_query = "Quel temps fait-il aujourd'hui ?"

    if st.button("üîç Obtenir une R√©ponse", type="primary"):
        if user_query:
            with st.spinner("ü§î G√©n√©ration de la r√©ponse..."):
                try:
                    response, retrieved_context, similarities, is_relevant = generate_rag_response(
                        user_query, embedding_model, document_embeddings,
                        tokenizer, llm_model, k=k_chunks, similarity_threshold=similarity_threshold
                    )

                    st.markdown("---")

                    # Afficher un indicateur de pertinence
                    if is_relevant:
                        st.success(f"‚úÖ Question pertinente (similarit√© max: {similarities[0]:.3f})")
                    else:
                        st.error(f"‚ùå Question hors sujet (similarit√© max: {similarities[0]:.3f})")

                    st.subheader("üí¨ R√©ponse:")
                    st.markdown(f"**{response}**")

                    if is_relevant and len(retrieved_context) > 0:
                        st.markdown("---")
                        st.subheader("üìö Contexte R√©cup√©r√©:")

                        for i, (chunk, similarity) in enumerate(zip(retrieved_context, similarities)):
                            # Code couleur selon la similarit√©
                            if similarity >= 0.5:
                                icon = "üü¢"
                            elif similarity >= 0.3:
                                icon = "üü°"
                            else:
                                icon = "üî¥"

                            with st.expander(f"{icon} Chunk {i+1} (Similarit√©: {similarity:.3f})", expanded=(i==0)):
                                st.info(chunk)
                except Exception as e:
                    st.error(f"‚ùå Erreur: {str(e)}")
        else:
            st.warning("‚ö†Ô∏è Veuillez saisir une question.")

    st.markdown("---")
    st.markdown(
        "<div style='text-align: center; color: gray;'><small>Application RAG locale - Sans API - D√©tection questions hors sujet</small></div>",
        unsafe_allow_html=True
    )

if __name__ == "__main__":
    main()

Writing app.py


## üîó Configuration de ngrok

**‚ö†Ô∏è IMPORTANT:** Remplacez `VOTRE_TOKEN_ICI` par votre token ngrok

Obtenez votre token sur: https://dashboard.ngrok.com/get-started/your-authtoken

In [None]:
# ‚ö†Ô∏è MODIFIEZ CETTE LIGNE avec votre token ngrok
NGROK_TOKEN = "VOTRE_TOKEN_ICI"

!ngrok config add-authtoken {NGROK_TOKEN}

Authtoken saved to configuration file: /root/.config/ngrok/ngrok.yml


## üöÄ Lancement de l'application

In [None]:
from pyngrok import ngrok
import time

print("üöÄ Lancement de l'application...\n")

# Arr√™ter les tunnels existants
ngrok.kill()

# Cr√©er un nouveau tunnel
public_url = ngrok.connect(8501, "http")
print(f"‚úÖ Application accessible ici: {public_url}")
print("‚è≥ Attendez quelques secondes que Streamlit d√©marre...\n")

# Lancer Streamlit en arri√®re-plan
!streamlit run app.py &>/dev/null &

# Attendre le d√©marrage
time.sleep(5)

print("üéâ C'est pr√™t! Cliquez sur le lien ci-dessus.")
print("üí° Pour arr√™ter: Runtime > Interrupt execution")

üöÄ Lancement de l'application...

‚úÖ Application accessible ici: NgrokTunnel: "https://katerine-previsional-rick.ngrok-free.dev" -> "http://localhost:8501"
‚è≥ Attendez quelques secondes que Streamlit d√©marre...

üéâ C'est pr√™t! Cliquez sur le lien ci-dessus.
üí° Pour arr√™ter: Runtime > Interrupt execution


## ‚úÖ CORRECTIONS APPORT√âES

### üéØ D√©tection des questions hors sujet

1. **Seuil de similarit√©** : Ajout d'un seuil minimum (0.3 par d√©faut)
   - Questions avec similarit√© < 0.3 ‚Üí Rejet√©es
   - Questions avec similarit√© ‚â• 0.3 ‚Üí Accept√©es

2. **Fonction `is_question_relevant()`** : V√©rifie la pertinence

3. **Message de refus** : Si hors sujet, message clair expliquant la limitation

4. **Slider de configuration** : Ajustez le seuil selon vos besoins
   - Plus bas (0.1-0.2) : Accepte plus de questions
   - Plus √©lev√© (0.4-0.6) : Plus strict, rejette plus facilement

5. **Indicateurs visuels** :
   - üü¢ Haute similarit√© (‚â• 0.5)
   - üü° Similarit√© moyenne (0.3-0.5)
   - üî¥ Faible similarit√© (< 0.3)

6. **Section de test** : Boutons pour tester des questions hors sujet

### üìä Exemples de comportement

**Questions ACCEPT√âES** (similarit√© √©lev√©e):
- "Quel est le co√ªt d'un drone agricole ?" ‚Üí ‚úÖ Similarit√© ~0.7
- "Comment fonctionne le NDVI ?" ‚Üí ‚úÖ Similarit√© ~0.6

**Questions REJET√âES** (similarit√© faible):
- "Comment faire une omelette ?" ‚Üí ‚ùå Similarit√© ~0.1
- "Qui a gagn√© la coupe du monde ?" ‚Üí ‚ùå Similarit√© ~0.05

### üîß Ajustements recommand√©s

- **Seuil 0.2** : Tr√®s permissif, accepte presque tout
- **Seuil 0.3** : √âquilibr√© (recommand√©)
- **Seuil 0.4** : Strict, rejette les questions vaguement li√©es
- **Seuil 0.5** : Tr√®s strict, accepte uniquement les questions tr√®s pertinentes

Testez diff√©rents seuils pour trouver le bon √©quilibre pour votre cas d'usage!