<a href="https://colab.research.google.com/github/crystalloide/RAG/blob/main/LAB42_Single_vs_Multi_Agent_version_am%C3%A9lior%C3%A9e.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# LAB42 : Mono Agent versus Multi Agent Interactions

**Objectif:** Exp√©rimenter comment plusieurs agents l√©gers coordonnent (ou entrent en conflit) par rapport √† un agent unique accomplissant la m√™me t√¢che.

**Dur√©e estim√©e:** 15‚Äì20 minutes

**Livrable:** Un notebook qui ex√©cute la m√™me t√¢che en modes (A) single-agent et (B) multi-agent et compare les r√©sultats.

---

## Architecture

- **Blackboard** (m√©moire partag√©e)
- **R√¥les** sp√©cialis√©s (Researcher, Planner, Critic)
- **Protocole** de messages structur√©
- **Comparaison** single-agent vs multi-agent
---

## ‚ö†Ô∏è Am√©liorations de cette version

‚úÖ **Support multi-rounds fonctionnel** : Le Researcher collecte des faits compl√©mentaires √† chaque round

‚úÖ **Contexte enrichi** : Prise en compte de l'historique des plans et critiques

‚úÖ **Logs d√©taill√©s** : Statistiques apr√®s chaque round

‚úÖ **Incr√©mentalit√©** : Chaque round am√©liore le pr√©c√©dent au lieu de r√©p√©ter

---

## 1) Setup :

Installation des d√©pendances n√©cessaires.

In [14]:
# Installation des packages
!pip install -q openai python-dotenv

### Configuration de la cl√© API OpenAI

‚ö†Ô∏è **Important:** Remplacez `your_api_key_here` par votre vraie cl√© API OpenAI.

Dans Google Colab, vous pouvez aussi utiliser les **Secrets** :
1. Cliquez sur l'ic√¥ne üîë dans la barre lat√©rale gauche
2. Ajoutez un secret nomm√© `OPENAI_API_KEY`
3. D√©commentez la m√©thode alternative ci-dessous

In [15]:
import os
from google.colab import userdata

# R√©cup√©rer la cl√© API depuis les secrets Colab
# Pour ajouter : cliquez sur üîë dans le panneau de gauche
try:
    openai_api_key = userdata.get('OPENAI_API_KEY')
    os.environ['OPENAI_API_KEY'] = openai_api_key
    print("‚úì Cl√© API OpenAI charg√©e depuis les secrets Colab")
except:
    print("‚ö† Secrets Colab non configur√©s. Veuillez ajouter OPENAI_API_KEY.")
    print("Instructions : Cliquez sur üîë dans le panneau gauche > Ajouter un nouveau secret")

‚úì Cl√© API OpenAI charg√©e depuis les secrets Colab


## 2) D√©finition d'une interface minimale pour agent :

Chaque agent poss√®de :
- **role** : son r√¥le sp√©cifique
- **prompt** : instructions syst√®me
- **act(state)** : m√©thode retournant un message et des mises √† jour optionnelles du blackboard

In [16]:
import os
import uuid
import time
from dataclasses import dataclass, field
from typing import Dict, Any, List
from openai import OpenAI

# Initialisation du client OpenAI
llm = OpenAI(api_key=os.environ.get('OPENAI_API_KEY'))

def chat(system: str, user: str, temp: float = 0) -> str:
    """
    Fonction helper pour appeler l'API OpenAI.

    Args:
        system: Prompt syst√®me d√©finissant le r√¥le
        user: Message utilisateur avec le contexte
        temp: Temp√©rature (0 = d√©terministe, >0 = cr√©atif)

    Returns:
        R√©ponse du mod√®le
    """
    r = llm.chat.completions.create(
        model="gpt-4o-mini",
        temperature=temp,
        messages=[
            {"role": "system", "content": system},
            {"role": "user", "content": user}
        ]
    )
    return r.choices[0].message.content.strip()

@dataclass
class Message:
    """Message √©chang√© entre agents."""
    sender: str
    content: str
    ts: float = field(default_factory=time.time)

@dataclass
class Blackboard:
    """
    Blackboard (tableau noir) : m√©moire partag√©e entre agents.
    - data: dictionnaire de donn√©es structur√©es
    - log: historique des messages
    """
    data: Dict[str, Any] = field(default_factory=dict)
    log: List[Message] = field(default_factory=list)

    def write(self, msg: Message):
        """Ajoute un message au log."""
        self.log.append(msg)

    def update(self, **kwargs):
        """Met √† jour les donn√©es du blackboard."""
        self.data.update(kwargs)

print("‚úì Structures de base d√©finies (Message, Blackboard, fonction chat)")

‚úì Structures de base d√©finies (Message, Blackboard, fonction chat)


## 3) Cr√©ation des prompts pour chaque r√¥le :

D√©finition des prompts pour chaque r√¥le sp√©cialis√© :
- **Researcher** : collecte des faits et sources
- **Planner** : propose un plan structur√©
- **Critic** : identifie les lacunes et am√©liore
- **Single Agent** : combine tous les r√¥les

In [17]:
ROLE_RESEARCHER = (
    "Role: Researcher. Read the task & propose 3 concise facts or sources "
    "to inform a solution. Output as bullet points. No final answer."
)

ROLE_PLANNER = (
    "Role: Planner. Read the latest facts and propose an ordered plan with 3‚Äì5 steps. "
    "State assumptions and risks briefly."
)

ROLE_CRITIC = (
    "Role: Critic. Review the plan for gaps, conflicts, or missing data. "
    "Return 2‚Äì3 actionable improvements. No final answer."
)

ROLE_SINGLE = (
    "You are a single agent acting as Researcher, Planner, and Critic at once. "
    "Given the task, produce facts, a plan, then self-critique with improvements."
)

print("‚úì Prompts de r√¥les d√©finis")
print(f"  - Researcher: {len(ROLE_RESEARCHER)} caract√®res")
print(f"  - Planner: {len(ROLE_PLANNER)} caract√®res")
print(f"  - Critic: {len(ROLE_CRITIC)} caract√®res")
print(f"  - Single: {len(ROLE_SINGLE)} caract√®res")

‚úì Prompts de r√¥les d√©finis
  - Researcher: 132 caract√®res
  - Planner: 117 caract√®res
  - Critic: 120 caract√®res
  - Single: 150 caract√®res


## 4) D√©finition de la classe pour les agents :

Classe `BaseAgent` impl√©mentant le comportement de base d'un agent :
- Lecture du contexte (task + blackboard + historique)
- Appel au LLM avec son prompt de r√¥le
- Retour d'un message structur√©

In [18]:
class BaseAgent:
    """
    Agent de base avec un r√¥le et un nom.
    """
    def __init__(self, name: str, role: str):
        self.name = name
        self.role = role

    def act(self, task: str, bb: Blackboard) -> Message:
        """
        Ex√©cute une action bas√©e sur le task et l'√©tat du blackboard.

        Args:
            task: T√¢che √† accomplir
            bb: Blackboard contenant l'√©tat partag√©

        Returns:
            Message contenant la r√©ponse de l'agent
        """
        # Construction du contexte
        context = (
            f"Task:\n{task}\n\nBlackboard:\n{bb.data}\n\n"
            f"Conversation so far:\n" +
            "\n".join([
                f"- {m.sender}: {m.content[:200]}"
                for m in bb.log[-6:]  # Garde les 6 derniers messages
            ])
        )

        # Appel au LLM
        out = chat(system=self.role, user=context)

        return Message(sender=self.name, content=out)

# Instanciation des agents sp√©cialis√©s
researcher = BaseAgent("Researcher", ROLE_RESEARCHER)
planner    = BaseAgent("Planner", ROLE_PLANNER)
critic     = BaseAgent("Critic", ROLE_CRITIC)
single     = BaseAgent("Solo", ROLE_SINGLE)

print("‚úì Agents instanci√©s :")
print(f"  - {researcher.name}")
print(f"  - {planner.name}")
print(f"  - {critic.name}")
print(f"  - {single.name} (single-agent)")

‚úì Agents instanci√©s :
  - Researcher
  - Planner
  - Critic
  - Solo (single-agent)


## 5) Turn-based multi-agent loop : ‚ú® Version am√©lior√©e ‚ú®

**Protocole:** Researcher ‚Üí Planner ‚Üí Critic ‚Üí Planner (r√©vision)

### üÜï Am√©liorations cl√©s

1. **Awareness multi-rounds** : Le Researcher sait qu'il doit fournir des faits **compl√©mentaires** aux rounds suivants
2. **Contexte enrichi** : Prise en compte de l'historique (4 derniers messages au lieu de 2)
3. **Historique des plans** : Stockage de toutes les versions pour tra√ßabilit√©
4. **Statistiques d√©taill√©es** : Affichage apr√®s chaque round
5. **Mode verbose** : Possibilit√© de d√©sactiver les logs pour benchmark

In [19]:
def summarize_last(msgs: List[Message], role: str) -> str:
    """
    R√©sume les derniers messages pour un r√¥le sp√©cifique.
    Utilise le LLM pour condenser l'information.

    Args:
        msgs: Liste des messages
        role: R√¥le pour lequel on r√©sume

    Returns:
        R√©sum√© condens√©
    """
    if not msgs:
        return ""

    # Prendre plus de contexte pour les rounds suivants (4 au lieu de 2)
    joined = "\n".join([m.content for m in msgs[-4:]])
    return chat(system=f"Summarize key points for {role}.", user=joined)

def multi_agent_run(task: str, rounds: int = 1, verbose: bool = True) -> Blackboard:
    """
    Ex√©cute le workflow multi-agent avec support de multiples rounds.

    Args:
        task: T√¢che √† accomplir
        rounds: Nombre d'it√©rations du cycle complet
        verbose: Afficher les logs d√©taill√©s

    Returns:
        Blackboard final avec tous les r√©sultats
    """
    bb = Blackboard(data={
        "task": task,
        "facts": [],        # Liste de tous les faits collect√©s
        "plans": [],        # Historique des plans (pour tra√ßabilit√©)
        "critiques": [],    # Historique des critiques
        "plan": "",         # Plan actuel (le plus r√©cent)
        "critique": ""      # Critique actuelle
    })

    for r in range(rounds):
        if verbose:
            print(f"\n{'='*70}")
            print(f"üîÑ ROUND {r+1}/{rounds}")
            print('='*70)

        # 1) Researcher collecte des faits (avec awareness des rounds pr√©c√©dents)
        if verbose:
            print("  üìö Researcher: collecte des faits...")

        researcher_context = task
        if r > 0:
            # Apr√®s le 1er round, demander des faits compl√©mentaires
            researcher_context += (
                f"\n\nPrevious facts collected:\n" +
                "\n".join([f"- {f[:100]}..." for f in bb.data["facts"][-3:]]) +
                "\n\nProvide NEW complementary facts or deeper insights."
            )

        m1 = researcher.act(researcher_context, bb)
        bb.write(m1)
        bb.data["facts"].append(m1.content)

        if verbose:
            print(f"    ‚úì {len(m1.content)} caract√®res collect√©s")

        # 2) Planner propose un plan
        if verbose:
            print("  üìã Planner: cr√©ation du plan...")

        ctx = summarize_last(bb.log, "Planner")
        planner_prompt = task + "\n\nContext:\n" + ctx

        if r > 0:
            # Mentionner le plan pr√©c√©dent pour am√©lioration incr√©mentale
            planner_prompt += (
                f"\n\nPrevious plan (Round {r}):\n{bb.data['plans'][-1][:200]}..."
                "\n\nRefine and improve based on new facts."
            )

        m2 = planner.act(planner_prompt, bb)
        bb.write(m2)
        bb.data["plan"] = m2.content
        bb.data["plans"].append(m2.content)

        if verbose:
            print(f"    ‚úì Plan v{r+1} g√©n√©r√© ({len(m2.content)} caract√®res)")

        # 3) Critic review le plan
        if verbose:
            print("  üîç Critic: analyse et critique...")

        ctx = summarize_last(bb.log, "Critic")
        m3 = critic.act(task + "\n\nContext:\n" + ctx, bb)
        bb.write(m3)
        bb.data["critique"] = m3.content
        bb.data["critiques"].append(m3.content)

        if verbose:
            print(f"    ‚úì Critique g√©n√©r√©e ({len(m3.content)} caract√®res)")

        # 4) Planner r√©vise le plan selon la critique
        if verbose:
            print("  ‚úèÔ∏è  Planner: r√©vision du plan...")

        ctx = summarize_last(bb.log, "Planner")
        m4 = planner.act(
            task + "\n\nRevise plan per critique:\n" + ctx, bb
        )
        bb.write(m4)
        bb.data["plan"] = m4.content  # Plan r√©vis√© devient le plan actuel

        if verbose:
            print(f"    ‚úì Plan r√©vis√© ({len(m4.content)} caract√®res)")

        bb.update(round=r+1)

        # Afficher un r√©sum√© du round
        if verbose:
            print(f"\n  üìä Round {r+1} termin√©:")
            print(f"    - Total messages: {len(bb.log)}")
            print(f"    - Total faits: {len(bb.data['facts'])}")
            print(f"    - Plans g√©n√©r√©s: {len(bb.data['plans'])}")

    if verbose:
        print("\n" + "="*70)
        print("‚úÖ Multi-agent workflow termin√©")
        print("="*70)
        print(f"üìà Statistiques finales:")
        print(f"  - {rounds} round(s) compl√©t√©(s)")
        print(f"  - {len(bb.log)} messages √©chang√©s")
        print(f"  - {len(bb.data['facts'])} faits collect√©s")
        print(f"  - {len(bb.data['plans'])} versions de plan")

    return bb

print("‚úì Fonction multi_agent_run AM√âLIOR√âE d√©finie")

‚úì Fonction multi_agent_run AM√âLIOR√âE d√©finie


## 6) Gestion en mode Mono/single-agent  :

L'agent unique combine tous les r√¥les en une seule invocation.

In [20]:
def single_agent_run(task: str) -> Blackboard:
    bb = Blackboard(data={"task": task})
    print("\nü§ñ Single-agent: traitement...")
    m = single.act(task, bb)
    bb.write(m)
    bb.update(final=m.content)
    print("‚úì Single-agent termin√©")
    return bb

print("‚úì Fonction single_agent_run d√©finie")

‚úì Fonction single_agent_run d√©finie


## 7) Test avec 1 round puis 2 rounds

### Test avec 1 round

In [21]:
TASK = (
    "Design a 3-email outreach sequence for a B2B AI tool targeting "
    "healthcare analytics leaders. Include subject lines and a clear CTA each."
)

print("="*70)
print("T√ÇCHE √Ä ACCOMPLIR")
print("="*70)
print(TASK)
print("="*70)

T√ÇCHE √Ä ACCOMPLIR
Design a 3-email outreach sequence for a B2B AI tool targeting healthcare analytics leaders. Include subject lines and a clear CTA each.


In [22]:
# Test avec 1 ROUND
bb_multi_1 = multi_agent_run(TASK, rounds=1)


üîÑ ROUND 1/1
  üìö Researcher: collecte des faits...
    ‚úì 793 caract√®res collect√©s
  üìã Planner: cr√©ation du plan...
    ‚úì Plan v1 g√©n√©r√© (2351 caract√®res)
  üîç Critic: analyse et critique...
    ‚úì Critique g√©n√©r√©e (1093 caract√®res)
  ‚úèÔ∏è  Planner: r√©vision du plan...
    ‚úì Plan r√©vis√© (3704 caract√®res)

  üìä Round 1 termin√©:
    - Total messages: 4
    - Total faits: 1
    - Plans g√©n√©r√©s: 1

‚úÖ Multi-agent workflow termin√©
üìà Statistiques finales:
  - 1 round(s) compl√©t√©(s)
  - 4 messages √©chang√©s
  - 1 faits collect√©s
  - 1 versions de plan


### Test avec 2 rounds (pour voir l'am√©lioration incr√©mentale)

In [23]:
# Test avec 2 ROUNDS
bb_multi_2 = multi_agent_run(TASK, rounds=2)


üîÑ ROUND 1/2
  üìö Researcher: collecte des faits...
    ‚úì 741 caract√®res collect√©s
  üìã Planner: cr√©ation du plan...
    ‚úì Plan v1 g√©n√©r√© (2502 caract√®res)
  üîç Critic: analyse et critique...
    ‚úì Critique g√©n√©r√©e (1365 caract√®res)
  ‚úèÔ∏è  Planner: r√©vision du plan...
    ‚úì Plan r√©vis√© (3410 caract√®res)

  üìä Round 1 termin√©:
    - Total messages: 4
    - Total faits: 1
    - Plans g√©n√©r√©s: 1

üîÑ ROUND 2/2
  üìö Researcher: collecte des faits...
    ‚úì 753 caract√®res collect√©s
  üìã Planner: cr√©ation du plan...
    ‚úì Plan v2 g√©n√©r√© (3502 caract√®res)
  üîç Critic: analyse et critique...
    ‚úì Critique g√©n√©r√©e (1459 caract√®res)
  ‚úèÔ∏è  Planner: r√©vision du plan...
    ‚úì Plan r√©vis√© (3439 caract√®res)

  üìä Round 2 termin√©:
    - Total messages: 8
    - Total faits: 2
    - Plans g√©n√©r√©s: 2

‚úÖ Multi-agent workflow termin√©
üìà Statistiques finales:
  - 2 round(s) compl√©t√©(s)
  - 8 messages √©chang√©s
  - 2 fai

In [24]:
# Single-agent pour comparaison
bb_single = single_agent_run(TASK)


ü§ñ Single-agent: traitement...
‚úì Single-agent termin√©


## 8) Comparaison des r√©sultats

In [25]:
print("\n" + "="*70)
print("COMPARAISON: 1 ROUND vs 2 ROUNDS vs SINGLE-AGENT")
print("="*70)

print("\nüìä MULTI-AGENT 1 ROUND:")
print(f"  - Messages: {len(bb_multi_1.log)}")
print(f"  - Faits: {len(bb_multi_1.data['facts'])}")
print(f"  - Plans: {len(bb_multi_1.data['plans'])}")

print("\nüìä MULTI-AGENT 2 ROUNDS:")
print(f"  - Messages: {len(bb_multi_2.log)}")
print(f"  - Faits: {len(bb_multi_2.data['facts'])}")
print(f"  - Plans: {len(bb_multi_2.data['plans'])}")

print("\nüìä SINGLE-AGENT:")
print(f"  - Messages: {len(bb_single.log)}")

print("\n" + "="*70)
print("PLAN FINAL (2 rounds):")
print("="*70)
print(bb_multi_2.data.get('plan', ''))


COMPARAISON: 1 ROUND vs 2 ROUNDS vs SINGLE-AGENT

üìä MULTI-AGENT 1 ROUND:
  - Messages: 4
  - Faits: 1
  - Plans: 1

üìä MULTI-AGENT 2 ROUNDS:
  - Messages: 8
  - Faits: 2
  - Plans: 2

üìä SINGLE-AGENT:
  - Messages: 1

PLAN FINAL (2 rounds):
### Ordered Plan for Email Outreach Sequence for B2B AI Tool Targeting Healthcare Analytics Leaders

1. **Email 1: Introduction to AI Benefits in Healthcare**
   - **Subject Line**: Unlock 30% Improvement in Patient Outcomes with AI
   - **Body**: 
     Hi [Recipient's Name],
     
     As a leader in healthcare analytics, you know that enhancing patient care and operational efficiency is paramount. According to McKinsey, organizations leveraging AI for analytics can improve outcomes by up to 30%. Our AI tool is specifically designed to address challenges like data integration and predictive analytics, which many healthcare organizations face today.
     
     **CTA**: Schedule a 15-minute call to explore how our solution can transform your 

In [26]:
# √âvolution des faits entre rounds
print("\n" + "="*70)
print("√âVOLUTION DES FAITS (2 rounds)")
print("="*70)

for i, fact in enumerate(bb_multi_2.data['facts'], 1):
    round_num = (i + 3) // 4  # 4 messages par round
    print(f"\n[Round {round_num}] Fait {i}:")
    print(fact[:300] + "..." if len(fact) > 300 else fact)


√âVOLUTION DES FAITS (2 rounds)

[Round 1] Fait 1:
- **Fact 1**: According to a report by McKinsey, healthcare organizations that leverage AI for analytics can improve patient outcomes and operational efficiency by up to 30%. This highlights the potential value of AI tools in healthcare analytics.

- **Fact 2**: A survey by Deloitte found that 83% o...

[Round 1] Fait 2:
- **Fact 4**: A study by Accenture found that AI applications in healthcare could save the industry up to $150 billion annually by 2026, indicating significant cost-saving potential that can be highlighted in outreach efforts.
  
- **Fact 5**: Research from the Journal of Medical Internet Research s...


## Conclusion

### üéØ Ce que vous avez appris

1. **Multi-rounds fonctionnent** : Chaque round am√©liore le pr√©c√©dent
2. **Awareness contextuelle** : Les agents savent o√π ils en sont dans le processus
3. **Incr√©mentalit√©** : Le Researcher apporte de nouveaux faits √† chaque round
4. **Trade-off co√ªt/qualit√©** : 2 rounds = 2x plus d'appels LLM mais meilleure qualit√©

### üî¨ Exp√©rimentations sugg√©r√©es

- Tester avec 3-4 rounds : √† quel moment observe-t-on des rendements d√©croissants ?
- Ajouter un crit√®re de convergence : arr√™ter si la critique devient positive
- Comparer les co√ªts : mesurer tokens utilis√©s par round
- Tester sur des t√¢ches plus complexes n√©cessitant vraiment plusieurs it√©rations