<a href="https://colab.research.google.com/github/crystalloide/RAG/blob/main/LAB42_Mono_vs_Multi_Agent_Interactions.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# LAB42 : Mono Agent versus Multi Agent Interactions

**Objectif:** Exp√©rimenter comment plusieurs agents l√©gers coordonnent (ou entrent en conflit) par rapport √† un agent unique accomplissant la m√™me t√¢che.

**Dur√©e estim√©e:** 15‚Äì20 minutes

**Livrable:** Un notebook qui ex√©cute la m√™me t√¢che en modes (A) single-agent et (B) multi-agent et compare les r√©sultats.

---

## Architecture

- **Blackboard** (m√©moire partag√©e)
- **R√¥les** sp√©cialis√©s (Researcher, Planner, Critic)
- **Protocole** de messages structur√©
- **Comparaison** single-agent vs multi-agent

## 1) Setup :

Installation des d√©pendances n√©cessaires

In [26]:
# Installation des packages
!pip install -q openai python-dotenv

### Configuration de la cl√© API OpenAI

‚ö†Ô∏è **Important:** Remplacez `your_api_key_here` par une cl√© API OpenAI valide.

Dans Google Colab, vous pouvez aussi utiliser les **Secrets** :
1. Cliquez sur l'ic√¥ne üîë dans la barre lat√©rale gauche
2. Ajoutez un secret nomm√© `OPENAI_API_KEY`
3. D√©commentez la m√©thode alternative ci-dessous

In [27]:
import os
from google.colab import userdata

# R√©cup√©rer la cl√© API depuis les secrets Colab
# Pour ajouter : cliquez sur üîë dans le panneau de gauche
try:
    openai_api_key = userdata.get('OPENAI_API_KEY')
    os.environ['OPENAI_API_KEY'] = openai_api_key
    print("‚úì Cl√© API OpenAI charg√©e depuis les secrets Colab")
except:
    print("‚ö† Secrets Colab non configur√©s. Veuillez ajouter OPENAI_API_KEY.")
    print("Instructions : Cliquez sur üîë dans le panneau gauche > Ajouter un nouveau secret")

‚úì Cl√© API OpenAI charg√©e depuis les secrets Colab


## 2) D√©finition d'une interface minimale pour agent :

Chaque agent poss√®de :
- **role** : son r√¥le sp√©cifique
- **prompt** : instructions syst√®me
- **act(state)** : m√©thode retournant un message et des mises √† jour optionnelles du blackboard

In [28]:
import os
import uuid
import time
from dataclasses import dataclass, field
from typing import Dict, Any, List
from openai import OpenAI

# Initialisation du client OpenAI
llm = OpenAI(api_key=os.environ.get('OPENAI_API_KEY'))

def chat(system: str, user: str, temp: float = 0) -> str:
    """
    Fonction helper pour appeler l'API OpenAI.

    Args:
        system: Prompt syst√®me d√©finissant le r√¥le
        user: Message utilisateur avec le contexte
        temp: Temp√©rature (0 = d√©terministe, >0 = cr√©atif)

    Returns:
        R√©ponse du mod√®le
    """
    r = llm.chat.completions.create(
        model="gpt-4o-mini",
        temperature=temp,
        messages=[
            {"role": "system", "content": system},
            {"role": "user", "content": user}
        ]
    )
    return r.choices[0].message.content.strip()

@dataclass
class Message:
    """Message √©chang√© entre agents."""
    sender: str
    content: str
    ts: float = field(default_factory=time.time)

@dataclass
class Blackboard:
    """
    Blackboard (tableau noir) : m√©moire partag√©e entre agents.
    - data: dictionnaire de donn√©es structur√©es
    - log: historique des messages
    """
    data: Dict[str, Any] = field(default_factory=dict)
    log: List[Message] = field(default_factory=list)

    def write(self, msg: Message):
        """Ajoute un message au log."""
        self.log.append(msg)

    def update(self, **kwargs):
        """Met √† jour les donn√©es du blackboard."""
        self.data.update(kwargs)

print("‚úì Structures de base d√©finies (Message, Blackboard, fonction chat)")

‚úì Structures de base d√©finies (Message, Blackboard, fonction chat)


## 3) Cr√©ation des prompts d√©finissant les r√¥les de chaque agent :  

D√©finition des prompts pour chaque r√¥le sp√©cialis√© :
- **Researcher** : collecte des faits et sources
- **Planner** : propose un plan structur√©
- **Critic** : identifie les lacunes et am√©liore
- **Single Agent** : combine tous les r√¥les

In [29]:
ROLE_RESEARCHER = (
    "Role: Researcher. Read the task & propose 3 concise facts or sources "
    "to inform a solution. Output as bullet points. No final answer."
)

ROLE_PLANNER = (
    "Role: Planner. Read the latest facts and propose an ordered plan with 3‚Äì5 steps. "
    "State assumptions and risks briefly."
)

ROLE_CRITIC = (
    "Role: Critic. Review the plan for gaps, conflicts, or missing data. "
    "Return 2‚Äì3 actionable improvements. No final answer."
)

ROLE_SINGLE = (
    "You are a single agent acting as Researcher, Planner, and Critic at once. "
    "Given the task, produce facts, a plan, then self-critique with improvements."
)

print("‚úì Prompts de r√¥les d√©finis")
print(f"  - Researcher: {len(ROLE_RESEARCHER)} caract√®res")
print(f"  - Planner: {len(ROLE_PLANNER)} caract√®res")
print(f"  - Critic: {len(ROLE_CRITIC)} caract√®res")
print(f"  - Single: {len(ROLE_SINGLE)} caract√®res")

‚úì Prompts de r√¥les d√©finis
  - Researcher: 132 caract√®res
  - Planner: 117 caract√®res
  - Critic: 120 caract√®res
  - Single: 150 caract√®res


## 4) D√©finition des classes des agents :

Classe `BaseAgent` impl√©mentant le comportement de base d'un agent :
- Lecture du contexte (task + blackboard + historique)
- Appel au LLM avec son prompt de r√¥le
- Retour d'un message structur√©

In [30]:
class BaseAgent:
    """
    Agent de base avec un r√¥le et un nom.
    """
    def __init__(self, name: str, role: str):
        self.name = name
        self.role = role

    def act(self, task: str, bb: Blackboard) -> Message:
        """
        Ex√©cute une action bas√©e sur le task et l'√©tat du blackboard.

        Args:
            task: T√¢che √† accomplir
            bb: Blackboard contenant l'√©tat partag√©

        Returns:
            Message contenant la r√©ponse de l'agent
        """
        # Construction du contexte
        context = (
            f"Task:\n{task}\n\nBlackboard:\n{bb.data}\n\n"
            f"Conversation so far:\n" +
            "\n".join([
                f"- {m.sender}: {m.content[:200]}"
                for m in bb.log[-6:]  # Garde les 6 derniers messages
            ])
        )

        # Appel au LLM
        out = chat(system=self.role, user=context)

        return Message(sender=self.name, content=out)

# Instanciation des agents sp√©cialis√©s
researcher = BaseAgent("Researcher", ROLE_RESEARCHER)
planner    = BaseAgent("Planner", ROLE_PLANNER)
critic     = BaseAgent("Critic", ROLE_CRITIC)
single     = BaseAgent("Solo", ROLE_SINGLE)

print("‚úì Agents instanci√©s :")
print(f"  - {researcher.name}")
print(f"  - {planner.name}")
print(f"  - {critic.name}")
print(f"  - {single.name} (single-agent)")

‚úì Agents instanci√©s :
  - Researcher
  - Planner
  - Critic
  - Solo (single-agent)


## 5) Boucle d'int√©ractions multi-agents:

**Protocole:** Researcher ‚Üí Planner ‚Üí Critic ‚Üí Planner (r√©vision)

Apr√®s chaque tour :
1. √âcriture dans `blackboard.log`
2. Stockage de l'√©tat compact
3. R√©sum√© des messages r√©cents pour le contexte

In [31]:
def summarize_last(msgs: List[Message], role: str) -> str:
    """
    R√©sume les derniers messages pour un r√¥le sp√©cifique.
    Utilise le LLM pour condenser l'information.

    Args:
        msgs: Liste des messages
        role: R√¥le pour lequel on r√©sume

    Returns:
        R√©sum√© condens√©
    """
    if not msgs:
        return ""

    joined = "\n".join([m.content for m in msgs[-2:]])
    return chat(system=f"Summarize for {role}.", user=joined)

def multi_agent_run(task: str, rounds: int = 1) -> Blackboard:
    """
    Ex√©cute le workflow multi-agent.

    Args:
        task: T√¢che √† accomplir
        rounds: Nombre d'it√©rations du cycle complet

    Returns:
        Blackboard final avec tous les r√©sultats
    """
    bb = Blackboard(data={
        "task": task,
        "facts": [],
        "plan": "",
        "critique": ""
    })

    for r in range(rounds):
        print(f"\nüîÑ Round {r+1}/{rounds}")

        # 1) Researcher collecte des faits
        print("  üìö Researcher: collecte des faits...")
        m1 = researcher.act(task, bb)
        bb.write(m1)
        bb.update(facts=bb.data.get("facts", []) + [m1.content])

        # 2) Planner propose un plan initial
        print("  üìã Planner: cr√©ation du plan...")
        ctx = summarize_last(bb.log, "Planner")
        m2 = planner.act(task + "\n\nContext:\n" + ctx, bb)
        bb.write(m2)
        bb.update(plan=m2.content)

        # 3) Critic review le plan
        print("  üîç Critic: analyse et critique...")
        ctx = summarize_last(bb.log, "Critic")
        m3 = critic.act(task + "\n\nContext:\n" + ctx, bb)
        bb.write(m3)
        bb.update(critique=m3.content)

        # 4) Planner r√©vise le plan selon la critique
        print("  ‚úèÔ∏è  Planner: r√©vision du plan...")
        ctx = summarize_last(bb.log, "Planner")
        m4 = planner.act(
            task + "\n\nRevise plan per critique:\n" + ctx, bb
        )
        bb.write(m4)
        bb.update(plan=m4.content, round=r+1)

    print("\n‚úì Multi-agent workflow termin√©")
    return bb

print("‚úì Fonction multi_agent_run d√©finie")

‚úì Fonction multi_agent_run d√©finie


## 6) Traitement mono/single-agent :

L'agent unique combine tous les r√¥les en une seule invocation.

In [32]:
def single_agent_run(task: str) -> Blackboard:
    """
    Ex√©cute la t√¢che avec un seul agent g√©n√©raliste.

    Args:
        task: T√¢che √† accomplir

    Returns:
        Blackboard avec le r√©sultat final
    """
    bb = Blackboard(data={"task": task})

    print("\nü§ñ Single-agent: traitement...")
    m = single.act(task, bb)
    bb.write(m)
    bb.update(final=m.content)

    print("‚úì Single-agent termin√©")
    return bb

print("‚úì Fonction single_agent_run d√©finie")

‚úì Fonction single_agent_run d√©finie


## 7) Lancement des deux modes dans la m√™me t√¢che de test :

T√¢che de test : conception d'une s√©quence d'emails B2B pour un outil d'IA ciblant les responsables d'analytique dans la sant√©.

In [33]:
# D√©finition de la t√¢che
# TASK = (
#     "Design a 3-email outreach sequence for a B2B AI tool targeting "
#     "healthcare analytics leaders. Include subject lines and a clear CTA each."
# )

TASK = (
    "Con√ßois une s√©quence de 3 e-mails pour un outil IA de B2B ciblant les responsables de l'analyse des donn√©es du secteur de la sant√©."
    "Inclus des objets et des appels √† l'action clairs dans chaque e-mail."
)

print("="*70)
print("T√ÇCHE √Ä ACCOMPLIR")
print("="*70)
print(TASK)
print("="*70)

T√ÇCHE √Ä ACCOMPLIR
Con√ßois une s√©quence de 3 e-mails pour un outil IA de B2B ciblant les responsables de l'analyse des donn√©es du secteur de la sant√©.Inclus des objets et des appels √† l'action clairs dans chaque e-mail.


In [34]:
# Ex√©cution du mode MULTI-AGENT
print("\n" + "="*70)
print("EX√âCUTION MODE MULTI-AGENT")
print("="*70)

bb_multi = multi_agent_run(TASK, rounds=1)


EX√âCUTION MODE MULTI-AGENT

üîÑ Round 1/1
  üìö Researcher: collecte des faits...
  üìã Planner: cr√©ation du plan...
  üîç Critic: analyse et critique...
  ‚úèÔ∏è  Planner: r√©vision du plan...

‚úì Multi-agent workflow termin√©


In [35]:
# Ex√©cution du mode SINGLE-AGENT
print("\n" + "="*70)
print("EX√âCUTION MODE SINGLE-AGENT")
print("="*70)

bb_single = single_agent_run(TASK)


EX√âCUTION MODE SINGLE-AGENT

ü§ñ Single-agent: traitement...
‚úì Single-agent termin√©


### Affichage des r√©sultats

In [36]:
print("\n" + "="*70)
print("R√âSULTATS MULTI-AGENT")
print("="*70)

print("\nüìä FAITS COLLECT√âS (Researcher):")
print("-" * 70)
for i, fact in enumerate(bb_multi.data.get("facts", []), 1):
    print(f"\nFact {i}:\n{fact}")

print("\n" + "="*70)
print("üìã PLAN FINAL (Planner):")
print("="*70)
print(bb_multi.data.get("plan", ""))

print("\n" + "="*70)
print("üîç CRITIQUE (Critic):")
print("="*70)
print(bb_multi.data.get("critique", ""))


R√âSULTATS MULTI-AGENT

üìä FAITS COLLECT√âS (Researcher):
----------------------------------------------------------------------

Fact 1:
- **Croissance du march√© de l'IA dans la sant√©** : Selon un rapport de MarketsandMarkets, le march√© de l'IA dans le secteur de la sant√© devrait atteindre 36,1 milliards de dollars d'ici 2025, ce qui souligne l'importance croissante de l'IA pour les responsables de l'analyse des donn√©es.

- **Am√©lioration des r√©sultats cliniques** : Une √©tude publi√©e dans le Journal of Medical Internet Research a montr√© que l'utilisation d'outils d'IA pour l'analyse des donn√©es peut am√©liorer les r√©sultats cliniques de 30%, ce qui est un argument fort pour les responsables de l'analyse des donn√©es.

- **Cas d'utilisation r√©ussis** : Des entreprises comme IBM Watson Health et Google Health ont d√©montr√© des cas d'utilisation r√©ussis de l'IA pour l'analyse des donn√©es de sant√©, ce qui peut servir d'inspiration pour les responsables de l'analyse des

In [37]:
print("\n" + "="*70)
print("R√âSULTATS SINGLE-AGENT")
print("="*70)
print(bb_single.data.get("final", ""))


R√âSULTATS SINGLE-AGENT
### Facts:
1. **Cible**: Responsables de l'analyse des donn√©es dans le secteur de la sant√©.
2. **Outil**: Outil d'intelligence artificielle (IA) B2B.
3. **Objectif**: Pr√©senter l'outil, d√©montrer sa valeur ajout√©e, et inciter √† l'action (essai, d√©mo, etc.).

### Plan:
**E-mail 1: Introduction √† l'outil IA**
- **Objet**: Transformez vos donn√©es de sant√© en insights exploitables
- **Contenu**: Pr√©sentation de l'outil IA, ses fonctionnalit√©s principales, et comment il peut aider √† am√©liorer l'analyse des donn√©es dans le secteur de la sant√©.
- **Appel √† l'action**: "D√©couvrez comment notre outil peut transformer votre analyse des donn√©es. R√©servez une d√©mo gratuite d√®s aujourd'hui !"

**E-mail 2: √âtude de cas et t√©moignages**
- **Objet**: Comment [Nom d'une entreprise] a optimis√© son analyse des donn√©es de sant√©
- **Contenu**: Pr√©sentation d'une √©tude de cas d'une entreprise ayant utilis√© l'outil avec succ√®s, incluant des statistiques

## 8) Comparaison des 2 approches :

Crit√®res d'√©valuation :
- **Exhaustivit√©** : Le plan inclut-il les "pain" points, propositiosn de valeurs, CTAs ?
- **Qualit√©** : Clart√©, ton, s√©quen√ßage
- **Diversit√©** : Les id√©es sont-elles moins r√©p√©titives en mode multi-agent ?
- **Apport de l'it√©ration** : La critique a-t-elle mat√©riellement am√©lior√© le plan ?

In [38]:
# √âvaluation automatique par le LLM
comparison_prompt = f"""
Compare two outputs for the same task.

[Multi-agent Plan]
{bb_multi.data.get('plan', '')}

[Single-agent Output]
{bb_single.data.get('final', '')}

Score each (1‚Äì5) on Coverage, Quality, Diversity, and provide a 3-sentence verdict.
"""

print("\n" + "="*70)
print("√âVALUATION AUTOMATIQUE")
print("="*70)

evaluation = chat("You are a fair evaluator and give the results in french.", comparison_prompt)
print(evaluation)


√âVALUATION AUTOMATIQUE
### √âvaluation des Sorties

#### [Multi-agent Plan]
- **Couverture : 5**
  Le plan couvre de mani√®re exhaustive les √©tapes n√©cessaires pour engager les destinataires, avec des e-mails bien structur√©s et des appels √† l'action clairs.

- **Qualit√© : 5**
  La qualit√© du contenu est √©lev√©e, avec des messages clairs et convaincants qui mettent en avant les avantages de l'outil d'IA.

- **Diversit√© : 4**
  Bien que le plan pr√©sente une bonne vari√©t√© d'approches (introduction, cas d'utilisation, offre sp√©ciale), il pourrait b√©n√©ficier d'une plus grande diversit√© dans les types de contenu (par exemple, vid√©os ou infographies).

#### [Single-agent Output]
- **Couverture : 4**
  Le plan aborde les points essentiels, mais il manque des d√©tails sur les cas d'utilisation et les t√©moignages, ce qui pourrait renforcer l'impact.

- **Qualit√© : 4**
  La qualit√© est bonne, mais le contenu pourrait √™tre am√©lior√© par des √©l√©ments visuels et une personna

### Statistiques de conversation

In [39]:
print("\n" + "="*70)
print("STATISTIQUES")
print("="*70)

print(f"\nüìä Multi-agent:")
print(f"  - Nombre de messages √©chang√©s: {len(bb_multi.log)}")
print(f"  - Agents impliqu√©s: {len(set(m.sender for m in bb_multi.log))}")
print(f"  - Rounds compl√©t√©s: {bb_multi.data.get('round', 0)}")

print(f"\nü§ñ Single-agent:")
print(f"  - Nombre de messages: {len(bb_single.log)}")
print(f"  - Agents impliqu√©s: {len(set(m.sender for m in bb_single.log))}")

print(f"\nüìù Longueur des sorties:")
multi_length = len(bb_multi.data.get('plan', ''))
single_length = len(bb_single.data.get('final', ''))
print(f"  - Multi-agent plan: {multi_length} caract√®res")
print(f"  - Single-agent output: {single_length} caract√®res")
print(f"  - Diff√©rence: {abs(multi_length - single_length)} caract√®res")


STATISTIQUES

üìä Multi-agent:
  - Nombre de messages √©chang√©s: 4
  - Agents impliqu√©s: 3
  - Rounds compl√©t√©s: 1

ü§ñ Single-agent:
  - Nombre de messages: 1
  - Agents impliqu√©s: 1

üìù Longueur des sorties:
  - Multi-agent plan: 3735 caract√®res
  - Single-agent output: 2608 caract√®res
  - Diff√©rence: 1127 caract√®res


## 9) Exp√©rimentations & extensions (optionnel)

### Id√©es d'extensions

1. **Coordinateur** : Ajouter un agent Coordinator qui assigne les sous-t√¢ches et arr√™te les boucles sur convergence
2. **M√©moire de r√¥le** : Chaque agent garde ses propres notes √† travers les ex√©cutions
3. **√âchecs de communication** : Simuler la perte d'un message et observer la robustesse
4. **Seconde t√¢che** : Tester avec "Create a 5-step incident response checklist for an LLM outage"
5. **Tracking co√ªt/latence** : Mesurer le trade-off entre single et multi-agent

In [40]:
# Exemple d'extension 1: Seconde t√¢che
# TASK_2 = "Create a 5-step incident response checklist for an LLM outage."
TASK_2 = "Cr√©ez une liste de contr√¥le en 5 √©tapes pour la r√©ponse aux incidents en cas de panne de LLM."

print("\n" + "="*70)
print("EXP√âRIMENTATION: T√ÇCHE ALTERNATIVE")
print("="*70)
print(f"T√¢che: {TASK_2}")
print("\nD√©commentez les lignes ci-dessous pour ex√©cuter:")
print("="*70)

# D√©commentez pour ex√©cuter:
# bb_multi_2 = multi_agent_run(TASK_2, rounds=1)
# bb_single_2 = single_agent_run(TASK_2)
# print("\nMulti-agent plan:")
# print(bb_multi_2.data.get("plan", ""))
# print("\nSingle-agent output:")
# print(bb_single_2.data.get("final", ""))


EXP√âRIMENTATION: T√ÇCHE ALTERNATIVE
T√¢che: Cr√©ez une liste de contr√¥le en 5 √©tapes pour la r√©ponse aux incidents en cas de panne de LLM.

D√©commentez les lignes ci-dessous pour ex√©cuter:


In [41]:
# Exemple d'extension 2: Tracking de co√ªt et latence
import time

def timed_run(func, *args, **kwargs):
    """Mesure le temps d'ex√©cution d'une fonction."""
    start = time.time()
    result = func(*args, **kwargs)
    elapsed = time.time() - start
    return result, elapsed

print("\n" + "="*70)
print("EXP√âRIMENTATION: MESURE DE PERFORMANCE")
print("="*70)
print("D√©commentez pour ex√©cuter des benchmarks:")
print("="*70)

# D√©commentez pour benchmarker:
# bb_multi_timed, time_multi = timed_run(multi_agent_run, TASK, rounds=1)
# bb_single_timed, time_single = timed_run(single_agent_run, TASK)
#
# print(f"\n‚è±Ô∏è  Temps d'ex√©cution:")
# print(f"  - Multi-agent: {time_multi:.2f}s")
# print(f"  - Single-agent: {time_single:.2f}s")
# print(f"  - Overhead multi-agent: {time_multi - time_single:.2f}s ({((time_multi/time_single - 1) * 100):.1f}%)")
#
# # Estimation du co√ªt (bas√© sur gpt-4o-mini pricing)
# # Input: $0.150 / 1M tokens, Output: $0.600 / 1M tokens
# print(f"\nüí∞ Nombre d'appels LLM:")
# print(f"  - Multi-agent: ~{len(bb_multi_timed.log)} appels")
# print(f"  - Single-agent: ~{len(bb_single_timed.log)} appel(s)")


EXP√âRIMENTATION: MESURE DE PERFORMANCE
D√©commentez pour ex√©cuter des benchmarks:


## Conclusion

### Observations attendues

**Mode Multi-Agent:**
- ‚úÖ Sp√©cialisation des r√¥les (recherche, planification, critique)
- ‚úÖ It√©ration et am√©lioration progressive
- ‚úÖ Diversit√© des perspectives
- ‚ö†Ô∏è Plus d'appels LLM (co√ªt et latence)
- ‚ö†Ô∏è Coordination n√©cessaire

**Mode Single-Agent:**
- ‚úÖ Rapidit√© (1 seul appel LLM)
- ‚úÖ Coh√©rence interne
- ‚úÖ Simplicit√©
- ‚ö†Ô∏è Moins de profondeur dans l'analyse
- ‚ö†Ô∏è Pas d'it√©ration critique

### Quand utiliser chaque approche ?

**Multi-Agent:**
- T√¢ches complexes n√©cessitant expertise multiple
- Besoin d'it√©ration et de critique
- Probl√®mes b√©n√©ficiant de perspectives diverses
- Workflows longs o√π le co√ªt est justifi√©

**Single-Agent:**
- T√¢ches simples et bien d√©finies
- Contraintes de temps/co√ªt strictes
- Besoin de r√©ponse rapide
- Probl√®mes ne n√©cessitant pas de sp√©cialisation

---

### üìö Ressources additionnelles

- [LangGraph Documentation](https://python.langchain.com/docs/langgraph)
- [OpenAI API Reference](https://platform.openai.com/docs/api-reference)
- [Multi-Agent Systems Papers](https://arxiv.org/list/cs.MA/recent)