# üå≥ Notebook 2 : Raisonnement et Logique Avanc√©s

## Tree-of-Thoughts, Self-Consistency et Raisonnement Complexe

Dans ce notebook, nous explorons les techniques de raisonnement avanc√©es qui permettent aux LLMs de r√©soudre des probl√®mes complexes en explorant plusieurs chemins de pens√©e.

### üéØ Objectifs d'apprentissage :
- Ma√Ætriser Tree-of-Thoughts (ToT) pour l'exploration multi-chemins
- Impl√©menter Self-Consistency pour am√©liorer la fiabilit√©
- Utiliser Step-Back Prompting pour l'abstraction
- Cr√©er des syst√®mes de raisonnement robustes
- √âvaluer et s√©lectionner les meilleurs chemins de pens√©e

## üìö Configuration et Imports

In [6]:
import os
import json
import time
from typing import List, Dict, Tuple, Optional
from dataclasses import dataclass
from concurrent.futures import ThreadPoolExecutor
import numpy as np
from dotenv import load_dotenv

# Charger les variables d'environnement
load_dotenv()

# Configuration des APIs
import openai
from anthropic import Anthropic
import google.generativeai as genai

# Configuration des clients
openai.api_key = os.getenv('OPENAI_API_KEY')
anthropic = Anthropic(api_key=os.getenv('ANTHROPIC_API_KEY'))
genai.configure(api_key=os.getenv('GOOGLE_API_KEY'))

print("‚úÖ Configuration termin√©e !")

‚úÖ Configuration termin√©e !


## 1. üå≥ Tree-of-Thoughts (ToT)

### Qu'est-ce que Tree-of-Thoughts ?

Tree-of-Thoughts est une technique qui permet aux LLMs d'explorer plusieurs chemins de raisonnement en parall√®le, d'√©valuer chaque branche, et de s√©lectionner le meilleur chemin.

**Avantages :**
- üéØ Exploration exhaustive des solutions
- üìä Auto-√©valuation des chemins
- üîÑ Possibilit√© de revenir en arri√®re
- üí° D√©couverte de solutions cr√©atives

In [7]:
@dataclass
class ThoughtNode:
    """Repr√©sente un n≈ìud dans l'arbre de pens√©es"""
    content: str
    score: float
    depth: int
    parent: Optional['ThoughtNode'] = None
    children: List['ThoughtNode'] = None
    
    def __post_init__(self):
        if self.children is None:
            self.children = []

class TreeOfThoughts:
    """Impl√©mentation de Tree-of-Thoughts"""
    
    def __init__(self, model: str = "gpt-4", branches: int = 3, depth: int = 3):
        self.model = model
        self.branches = branches
        self.max_depth = depth
        self.root = None
    
    def generate_thoughts(self, prompt: str, context: str = "") -> List[str]:
        """G√©n√®re plusieurs pens√©es/approches pour un probl√®me"""
        generation_prompt = f"""
        Probl√®me : {prompt}
        {f'Contexte : {context}' if context else ''}
        
        G√©n√®re {self.branches} approches diff√©rentes pour r√©soudre ce probl√®me.
        Pour chaque approche :
        1. Donne un titre court
        2. Explique la logique en 2-3 phrases
        3. Liste les √©tapes principales
        
        Format : 
        Approche 1: [Titre]
        [Explication et √©tapes]
        ---
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": generation_prompt}],
                temperature=0.8,
                n=1
            )
            
            thoughts_text = response.choices[0].message.content
            thoughts = thoughts_text.split('---')
            return [t.strip() for t in thoughts if t.strip()]
            
        except Exception as e:
            print(f"Erreur g√©n√©ration : {e}")
            return []
    
    def evaluate_thought(self, thought: str, criteria: List[str]) -> float:
        """√âvalue une pens√©e selon des crit√®res"""
        eval_prompt = f"""
        √âvalue cette approche selon les crit√®res suivants :
        
        Approche : {thought}
        
        Crit√®res d'√©valuation :
        {chr(10).join(f'- {c}' for c in criteria)}
        
        Pour chaque crit√®re, donne une note sur 10.
        Puis calcule la moyenne pond√©r√©e.
        
        Format de r√©ponse :
        - [Crit√®re 1]: X/10 - [Justification]
        - [Crit√®re 2]: Y/10 - [Justification]
        ...
        Score final : Z/10
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": eval_prompt}],
                temperature=0.3
            )
            
            result = response.choices[0].message.content
            # Extraire le score final
            if "Score final" in result:
                score_text = result.split("Score final")[-1]
                score = float(score_text.split("/")[0].replace(":", "").strip())
                return score / 10.0
            return 0.5
            
        except Exception as e:
            print(f"Erreur √©valuation : {e}")
            return 0.5
    
    def expand_node(self, node: ThoughtNode, problem: str) -> List[ThoughtNode]:
        """Expand un n≈ìud en g√©n√©rant des sous-pens√©es"""
        if node.depth >= self.max_depth:
            return []
        
        expansion_prompt = f"""
        Probl√®me initial : {problem}
        
        Approche actuelle : {node.content}
        
        D√©veloppe cette approche en {self.branches} sous-√©tapes ou raffinements.
        Chaque sous-√©tape doit √™tre plus sp√©cifique et actionnable.
        """
        
        sub_thoughts = self.generate_thoughts(expansion_prompt)
        children = []
        
        for thought in sub_thoughts[:self.branches]:
            child = ThoughtNode(
                content=thought,
                score=0,  # Sera √©valu√© plus tard
                depth=node.depth + 1,
                parent=node
            )
            children.append(child)
            node.children.append(child)
        
        return children
    
    def solve(self, problem: str, criteria: List[str]) -> Dict:
        """R√©sout un probl√®me en utilisant Tree-of-Thoughts"""
        print(f"üå≥ D√©marrage Tree-of-Thoughts pour : {problem[:50]}...")
        
        # G√©n√©rer les pens√©es initiales
        initial_thoughts = self.generate_thoughts(problem)
        
        # Cr√©er le n≈ìud racine
        self.root = ThoughtNode(content="Root", score=0, depth=0)
        
        # Cr√©er et √©valuer les n≈ìuds de premier niveau
        for thought in initial_thoughts[:self.branches]:
            node = ThoughtNode(
                content=thought,
                score=self.evaluate_thought(thought, criteria),
                depth=1,
                parent=self.root
            )
            self.root.children.append(node)
        
        # S√©lectionner les meilleurs n≈ìuds pour expansion
        nodes_to_expand = sorted(self.root.children, key=lambda x: x.score, reverse=True)[:2]
        
        # Expansion r√©cursive
        for node in nodes_to_expand:
            if node.score > 0.7:  # Seuil de qualit√©
                children = self.expand_node(node, problem)
                for child in children:
                    child.score = self.evaluate_thought(child.content, criteria)
        
        # Trouver le meilleur chemin
        best_path = self.find_best_path()
        
        return {
            'best_path': best_path,
            'tree_stats': self.get_tree_stats(),
            'all_thoughts': self.get_all_thoughts()
        }
    
    def find_best_path(self) -> List[ThoughtNode]:
        """Trouve le meilleur chemin dans l'arbre"""
        def get_paths(node: ThoughtNode, current_path: List[ThoughtNode]) -> List[List[ThoughtNode]]:
            if not node.children:
                return [current_path + [node]]
            
            paths = []
            for child in node.children:
                paths.extend(get_paths(child, current_path + [node]))
            return paths
        
        all_paths = get_paths(self.root, [])
        
        # Calculer le score moyen de chaque chemin
        path_scores = []
        for path in all_paths:
            if len(path) > 1:  # Ignorer le root
                avg_score = np.mean([n.score for n in path[1:]])
                path_scores.append((path, avg_score))
        
        # Retourner le meilleur chemin
        if path_scores:
            best_path, _ = max(path_scores, key=lambda x: x[1])
            return best_path[1:]  # Exclure le root
        return []
    
    def get_tree_stats(self) -> Dict:
        """Obtient des statistiques sur l'arbre"""
        def count_nodes(node: ThoughtNode) -> int:
            return 1 + sum(count_nodes(child) for child in node.children)
        
        total_nodes = count_nodes(self.root) - 1  # Exclure root
        all_scores = []
        
        def collect_scores(node: ThoughtNode):
            if node != self.root:
                all_scores.append(node.score)
            for child in node.children:
                collect_scores(child)
        
        collect_scores(self.root)
        
        return {
            'total_nodes': total_nodes,
            'avg_score': np.mean(all_scores) if all_scores else 0,
            'max_score': max(all_scores) if all_scores else 0,
            'min_score': min(all_scores) if all_scores else 0
        }
    
    def get_all_thoughts(self) -> List[Dict]:
        """R√©cup√®re toutes les pens√©es avec leurs scores"""
        thoughts = []
        
        def collect_thoughts(node: ThoughtNode, path: str = ""):
            if node != self.root:
                thoughts.append({
                    'content': node.content,
                    'score': node.score,
                    'depth': node.depth,
                    'path': path
                })
            
            for i, child in enumerate(node.children):
                new_path = f"{path}/{i}" if path else str(i)
                collect_thoughts(child, new_path)
        
        collect_thoughts(self.root)
        return sorted(thoughts, key=lambda x: x['score'], reverse=True)

### üéØ Exemple pratique : R√©solution de probl√®me complexe avec ToT

In [8]:
# Probl√®me complexe √† r√©soudre
problem = """
Une startup EdTech veut augmenter son taux de r√©tention utilisateur de 40% √† 70% en 6 mois.
Contraintes : budget limit√© (50k‚Ç¨), √©quipe de 5 personnes, app mobile existante.
"""

# Crit√®res d'√©valuation
criteria = [
    "Faisabilit√© avec les contraintes donn√©es",
    "Impact potentiel sur la r√©tention",
    "Rapidit√© de mise en ≈ìuvre",
    "Co√ªt-efficacit√©",
    "Mesurabilit√© des r√©sultats"
]

# Cr√©er et ex√©cuter ToT
tot = TreeOfThoughts(model="gpt-3.5-turbo", branches=3, depth=2)
solution = tot.solve(problem, criteria)

# Afficher les r√©sultats
print("\nüåü Meilleur chemin de solution :")
for i, node in enumerate(solution['best_path']):
    print(f"\n{'  ' * i}Niveau {i+1} (Score: {node.score:.2f})")
    print(f"{'  ' * i}{node.content[:200]}...")

print(f"\nüìä Statistiques de l'arbre :")
stats = solution['tree_stats']
print(f"- N≈ìuds explor√©s : {stats['total_nodes']}")
print(f"- Score moyen : {stats['avg_score']:.2f}")
print(f"- Score max : {stats['max_score']:.2f}")

üå≥ D√©marrage Tree-of-Thoughts pour : 
Une startup EdTech veut augmenter son taux de r√©t...
Erreur g√©n√©ration : 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742


üåü Meilleur chemin de solution :

üìä Statistiques de l'arbre :
- N≈ìuds explor√©s : 0
- Score moyen : 0.00
- Score max : 0.00


## 2. üîÑ Self-Consistency

### Principe de Self-Consistency

Self-Consistency g√©n√®re plusieurs r√©ponses ind√©pendantes √† la m√™me question, puis analyse les convergences pour identifier la r√©ponse la plus fiable.

**Avantages :**
- ‚úÖ R√©duit les erreurs al√©atoires
- üéØ Augmente la fiabilit√©
- üìä Permet d'identifier l'incertitude
- üîç R√©v√®le diff√©rentes perspectives

In [9]:
class SelfConsistency:
    """Impl√©mentation de Self-Consistency pour am√©liorer la fiabilit√©"""
    
    def __init__(self, model: str = "gpt-3.5-turbo", samples: int = 5):
        self.model = model
        self.samples = samples
    
    def generate_responses(self, prompt: str, variations: bool = True) -> List[str]:
        """G√©n√®re plusieurs r√©ponses au m√™me prompt"""
        responses = []
        
        # Variations du prompt pour plus de diversit√©
        prompts = []
        if variations:
            base_variations = [
                prompt,
                f"R√©fl√©chis √©tape par √©tape : {prompt}",
                f"En consid√©rant tous les aspects : {prompt}",
                f"Analyse en profondeur : {prompt}",
                f"Donne ta meilleure r√©ponse : {prompt}"
            ]
            prompts = base_variations[:self.samples]
        else:
            prompts = [prompt] * self.samples
        
        # G√©n√©rer les r√©ponses en parall√®le
        with ThreadPoolExecutor(max_workers=3) as executor:
            futures = []
            for i, p in enumerate(prompts):
                future = executor.submit(self._generate_single, p, 0.7 + i * 0.05)
                futures.append(future)
            
            for future in futures:
                try:
                    response = future.result(timeout=30)
                    if response:
                        responses.append(response)
                except Exception as e:
                    print(f"Erreur g√©n√©ration : {e}")
        
        return responses
    
    def _generate_single(self, prompt: str, temperature: float) -> str:
        """G√©n√®re une seule r√©ponse"""
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": prompt}],
                temperature=temperature,
                max_tokens=1000
            )
            return response.choices[0].message.content
        except Exception as e:
            print(f"Erreur API : {e}")
            return ""
    
    def extract_key_elements(self, response: str) -> Dict:
        """Extrait les √©l√©ments cl√©s d'une r√©ponse"""
        extraction_prompt = f"""
        Analyse cette r√©ponse et extrais :
        1. Les points principaux (liste)
        2. Les chiffres/donn√©es mentionn√©s
        3. Les recommandations sp√©cifiques
        4. Le ton/sentiment g√©n√©ral
        
        R√©ponse √† analyser :
        {response}
        
        Format JSON requis.
        """
        
        try:
            result = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": extraction_prompt}],
                temperature=0.3
            )
            
            # Parser le JSON
            content = result.choices[0].message.content
            # Extraire le JSON m√™me s'il est entour√© de texte
            import re
            json_match = re.search(r'\{[^{}]*\}', content, re.DOTALL)
            if json_match:
                return json.loads(json_match.group())
            return {}
            
        except Exception as e:
            print(f"Erreur extraction : {e}")
            return {}
    
    def analyze_consistency(self, responses: List[str]) -> Dict:
        """Analyse la coh√©rence entre les r√©ponses"""
        if not responses:
            return {'error': 'Aucune r√©ponse √† analyser'}
        
        # Extraire les √©l√©ments cl√©s de chaque r√©ponse
        all_elements = []
        for resp in responses:
            elements = self.extract_key_elements(resp)
            if elements:
                all_elements.append(elements)
        
        # Analyser les convergences
        consistency_prompt = f"""
        Analyse la coh√©rence entre ces {len(responses)} r√©ponses :
        
        {chr(10).join([f'R√©ponse {i+1}: {r[:200]}...' for i, r in enumerate(responses)])}
        
        Identifie :
        1. Points de convergence (mentionn√©s dans 3+ r√©ponses)
        2. Points de divergence majeurs
        3. Niveau de coh√©rence global (0-100%)
        4. Recommandation synth√©tis√©e
        """
        
        try:
            analysis = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": consistency_prompt}],
                temperature=0.3
            )
            
            return {
                'analysis': analysis.choices[0].message.content,
                'num_responses': len(responses),
                'elements_extracted': len(all_elements)
            }
            
        except Exception as e:
            print(f"Erreur analyse : {e}")
            return {'error': str(e)}
    
    def get_consensus(self, prompt: str, return_all: bool = False) -> Dict:
        """Obtient un consensus via Self-Consistency"""
        print(f"üîÑ G√©n√©ration de {self.samples} r√©ponses...")
        
        # G√©n√©rer plusieurs r√©ponses
        responses = self.generate_responses(prompt)
        
        if not responses:
            return {'error': 'Aucune r√©ponse g√©n√©r√©e'}
        
        print(f"‚úÖ {len(responses)} r√©ponses g√©n√©r√©es")
        
        # Analyser la coh√©rence
        consistency = self.analyze_consistency(responses)
        
        # Cr√©er une r√©ponse consensus
        consensus_prompt = f"""
        Bas√© sur ces {len(responses)} r√©ponses diff√©rentes au m√™me probl√®me,
        cr√©e une r√©ponse consensus qui int√®gre les meilleurs √©l√©ments de chaque r√©ponse.
        
        Probl√®me original : {prompt}
        
        R√©ponses √† synth√©tiser :
        {chr(10).join([f'--- R√©ponse {i+1} ---\n{r}' for i, r in enumerate(responses)])}
        
        Cr√©e une r√©ponse finale optimale qui :
        - Int√®gre les points de convergence
        - R√©sout les contradictions
        - Offre la solution la plus compl√®te et fiable
        """
        
        try:
            consensus_response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": consensus_prompt}],
                temperature=0.3,
                max_tokens=1500
            )
            
            result = {
                'consensus': consensus_response.choices[0].message.content,
                'consistency_analysis': consistency,
                'num_responses': len(responses)
            }
            
            if return_all:
                result['all_responses'] = responses
            
            return result
            
        except Exception as e:
            print(f"Erreur consensus : {e}")
            return {'error': str(e)}

### üéØ Exemple : D√©cision critique avec Self-Consistency

In [10]:
# Question n√©cessitant une haute fiabilit√©
critical_question = """
Notre entreprise SaaS B2B (CRM pour PME) stagne √† 2M‚Ç¨ ARR depuis 6 mois.
Nous h√©sitons entre 3 strat√©gies :
1. Monter en gamme vers l'entreprise (investissement 500k‚Ç¨)
2. Expansion internationale (investissement 300k‚Ç¨)
3. Ajouter des features IA (investissement 400k‚Ç¨)

Quelle strat√©gie recommandes-tu et pourquoi ?
"""

# Utiliser Self-Consistency
sc = SelfConsistency(samples=5)
result = sc.get_consensus(critical_question, return_all=True)

# Afficher l'analyse
print("\nüìä Analyse de coh√©rence :")
print(result['consistency_analysis']['analysis'])

print("\n‚úÖ R√©ponse consensus :")
print(result['consensus'])

# Optionnel : voir toutes les r√©ponses
if 'all_responses' in result:
    print(f"\nüîç Aper√ßu des {len(result['all_responses'])} r√©ponses g√©n√©r√©es :")
    for i, resp in enumerate(result['all_responses']):
        print(f"\nR√©ponse {i+1} (extrait) : {resp[:150]}...")

üîÑ G√©n√©ration de 5 r√©ponses...
Erreur API : 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742

Erreur API : 

You tried to access openai.ChatCompletion, but this is no longer supported in openai>=1.0.0 - see the README at https://github.com/openai/openai-python for the API.

You can run `openai migrate` to automatically upgrade your codebase to use the 1.0.0 interface. 

Alternatively, you can pin your installation to the old version, e.g. `pip install openai==0.28`

A detailed migration guide is available here: https://github.com/openai/openai-python/discussions/742

Erre

KeyError: 'consistency_analysis'

## 3. üîô Step-Back Prompting

### Principe du Step-Back Prompting

Step-Back Prompting r√©sout les probl√®mes en prenant d'abord du recul pour comprendre les principes fondamentaux avant de s'attaquer au cas sp√©cifique.

**Processus :**
1. üéØ Identifier la question sp√©cifique
2. üîç Formuler une question plus g√©n√©rale
3. üìö Comprendre les principes fondamentaux
4. üîß Appliquer au cas sp√©cifique

In [None]:
class StepBackPrompting:
    """Impl√©mentation de Step-Back Prompting pour la r√©solution abstraite"""
    
    def __init__(self, model: str = "gpt-3.5-turbo"):
        self.model = model
    
    def generate_abstract_question(self, specific_question: str) -> str:
        """G√©n√®re une question plus abstraite/g√©n√©rale"""
        prompt = f"""
        Question sp√©cifique : {specific_question}
        
        Reformule cette question de mani√®re plus abstraite et g√©n√©rale.
        La question abstraite doit :
        1. Capturer l'essence du probl√®me
        2. √ätre applicable √† une classe plus large de situations
        3. Permettre d'identifier les principes fondamentaux
        
        Exemples :
        - Sp√©cifique : "Comment augmenter les ventes de mon restaurant italien ?"
        - Abstraite : "Quels sont les principes pour augmenter les revenus d'un business de service local ?"
        
        Question abstraite :
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": prompt}],
                temperature=0.7
            )
            return response.choices[0].message.content.strip()
        except Exception as e:
            print(f"Erreur : {e}")
            return ""
    
    def get_fundamental_principles(self, abstract_question: str) -> str:
        """Obtient les principes fondamentaux pour la question abstraite"""
        prompt = f"""
        Question : {abstract_question}
        
        Identifie et explique les principes fondamentaux qui s'appliquent.
        Pour chaque principe :
        1. Nom du principe
        2. Explication claire
        3. Pourquoi c'est important
        4. Exemples d'application
        
        Vise 3-5 principes fondamentaux.
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": prompt}],
                temperature=0.5,
                max_tokens=1000
            )
            return response.choices[0].message.content
        except Exception as e:
            print(f"Erreur : {e}")
            return ""
    
    def apply_to_specific(self, principles: str, specific_question: str, context: str = "") -> str:
        """Applique les principes au cas sp√©cifique"""
        prompt = f"""
        Principes fondamentaux identifi√©s :
        {principles}
        
        Question sp√©cifique √† r√©soudre :
        {specific_question}
        
        {f'Contexte additionnel : {context}' if context else ''}
        
        Applique ces principes pour cr√©er une solution sp√©cifique et actionnable.
        Structure ta r√©ponse :
        1. Rappel des principes pertinents
        2. Application concr√®te au cas
        3. Plan d'action d√©taill√©
        4. M√©triques de succ√®s
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": prompt}],
                temperature=0.6,
                max_tokens=1500
            )
            return response.choices[0].message.content
        except Exception as e:
            print(f"Erreur : {e}")
            return ""
    
    def solve_with_stepback(self, specific_question: str, context: str = "") -> Dict:
        """Pipeline complet de Step-Back Prompting"""
        print("üîô D√©marrage Step-Back Prompting...")
        
        # √âtape 1 : G√©n√©rer question abstraite
        print("1Ô∏è‚É£ G√©n√©ration de la question abstraite...")
        abstract_q = self.generate_abstract_question(specific_question)
        
        if not abstract_q:
            return {'error': 'Impossible de g√©n√©rer la question abstraite'}
        
        # √âtape 2 : Obtenir les principes
        print("2Ô∏è‚É£ Identification des principes fondamentaux...")
        principles = self.get_fundamental_principles(abstract_q)
        
        if not principles:
            return {'error': 'Impossible d\'identifier les principes'}
        
        # √âtape 3 : Appliquer au cas sp√©cifique
        print("3Ô∏è‚É£ Application au cas sp√©cifique...")
        solution = self.apply_to_specific(principles, specific_question, context)
        
        return {
            'specific_question': specific_question,
            'abstract_question': abstract_q,
            'principles': principles,
            'solution': solution
        }
    
    def compare_with_direct(self, question: str) -> Dict:
        """Compare Step-Back avec approche directe"""
        print("üî¨ Comparaison Step-Back vs Direct...")
        
        # Approche directe
        direct_prompt = f"R√©ponds directement : {question}"
        try:
            direct_response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": direct_prompt}],
                temperature=0.7
            )
            direct_answer = direct_response.choices[0].message.content
        except:
            direct_answer = "Erreur"
        
        # Approche Step-Back
        stepback_result = self.solve_with_stepback(question)
        
        return {
            'direct_approach': direct_answer,
            'stepback_approach': stepback_result
        }

### üéØ Exemple : R√©solution complexe avec Step-Back

In [None]:
# Probl√®me sp√©cifique complexe
specific_problem = """
Notre plateforme de e-learning pour d√©veloppeurs a un probl√®me :
70% des utilisateurs abandonnent apr√®s le premier cours.
Comment am√©liorer drastiquement l'engagement ?
"""

context = """
- Plateforme lanc√©e il y a 6 mois
- 5000 utilisateurs inscrits
- Cours de 2-4 heures en moyenne
- Principalement du contenu vid√©o
- Audience : d√©veloppeurs juniors √† mid-level
"""

# Utiliser Step-Back Prompting
sb = StepBackPrompting()
result = sb.solve_with_stepback(specific_problem, context)

# Afficher les r√©sultats
print("\n‚ùì Question abstraite g√©n√©r√©e :")
print(result['abstract_question'])

print("\nüìö Principes fondamentaux identifi√©s :")
print(result['principles'][:500] + "...")

print("\n‚úÖ Solution sp√©cifique :")
print(result['solution'])

### üî¨ Comparaison : Step-Back vs Approche Directe

In [None]:
# Comparer les deux approches
comparison = sb.compare_with_direct(specific_problem)

print("üîÑ APPROCHE DIRECTE :")
print(comparison['direct_approach'][:500] + "...")

print("\n\nüîô APPROCHE STEP-BACK :")
if 'solution' in comparison['stepback_approach']:
    print(comparison['stepback_approach']['solution'][:500] + "...")

print("\n\nüìä Analyse comparative :")
print("- L'approche directe donne des solutions imm√©diates mais parfois superficielles")
print("- Step-Back identifie les causes profondes et propose des solutions syst√©miques")
print("- Step-Back est plus adapt√© aux probl√®mes complexes n√©cessitant une compr√©hension profonde")

## 4. üß© Combinaison des Techniques

### Framework de Raisonnement Hybride

Combinons ToT, Self-Consistency et Step-Back pour cr√©er un syst√®me de raisonnement ultra-robuste.

In [None]:
class HybridReasoning:
    """Combine plusieurs techniques de raisonnement avanc√©es"""
    
    def __init__(self, model: str = "gpt-3.5-turbo"):
        self.model = model
        self.tot = TreeOfThoughts(model, branches=3, depth=2)
        self.sc = SelfConsistency(model, samples=3)
        self.sb = StepBackPrompting(model)
    
    def analyze_problem_complexity(self, problem: str) -> Dict:
        """Analyse la complexit√© du probl√®me pour choisir la meilleure approche"""
        analysis_prompt = f"""
        Analyse ce probl√®me et d√©termine :
        1. Niveau de complexit√© (1-10)
        2. Type de probl√®me (analytique, cr√©atif, strat√©gique, technique)
        3. Besoin de fiabilit√© (1-10)
        4. Besoin d'exploration (1-10)
        
        Probl√®me : {problem}
        
        R√©ponds en JSON.
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": analysis_prompt}],
                temperature=0.3
            )
            
            # Parser la r√©ponse
            import re
            content = response.choices[0].message.content
            # Essayer d'extraire les valeurs m√™me si ce n'est pas du JSON parfait
            
            complexity = int(re.search(r'complexit√©.*?(\d+)', content, re.I).group(1)) if re.search(r'complexit√©.*?(\d+)', content, re.I) else 5
            reliability = int(re.search(r'fiabilit√©.*?(\d+)', content, re.I).group(1)) if re.search(r'fiabilit√©.*?(\d+)', content, re.I) else 5
            exploration = int(re.search(r'exploration.*?(\d+)', content, re.I).group(1)) if re.search(r'exploration.*?(\d+)', content, re.I) else 5
            
            return {
                'complexity': complexity,
                'reliability_need': reliability,
                'exploration_need': exploration
            }
            
        except Exception as e:
            print(f"Erreur analyse : {e}")
            return {'complexity': 5, 'reliability_need': 5, 'exploration_need': 5}
    
    def select_techniques(self, analysis: Dict) -> List[str]:
        """S√©lectionne les techniques appropri√©es selon l'analyse"""
        techniques = []
        
        # Step-Back pour les probl√®mes complexes
        if analysis['complexity'] >= 7:
            techniques.append('step_back')
        
        # Self-Consistency pour la fiabilit√©
        if analysis['reliability_need'] >= 7:
            techniques.append('self_consistency')
        
        # Tree-of-Thoughts pour l'exploration
        if analysis['exploration_need'] >= 6:
            techniques.append('tree_of_thoughts')
        
        # Toujours au moins une technique
        if not techniques:
            techniques.append('self_consistency')
        
        return techniques
    
    def solve_hybrid(self, problem: str, context: str = "") -> Dict:
        """R√©sout un probl√®me en utilisant la meilleure combinaison de techniques"""
        print("üß© D√©marrage du raisonnement hybride...")
        
        # Analyser le probl√®me
        print("üìä Analyse du probl√®me...")
        analysis = self.analyze_problem_complexity(problem)
        print(f"Complexit√© : {analysis['complexity']}/10")
        print(f"Besoin fiabilit√© : {analysis['reliability_need']}/10")
        print(f"Besoin exploration : {analysis['exploration_need']}/10")
        
        # S√©lectionner les techniques
        techniques = self.select_techniques(analysis)
        print(f"\nüîß Techniques s√©lectionn√©es : {', '.join(techniques)}")
        
        results = {}
        
        # Appliquer Step-Back si n√©cessaire
        if 'step_back' in techniques:
            print("\nüîô Application Step-Back...")
            sb_result = self.sb.solve_with_stepback(problem, context)
            results['step_back'] = sb_result
            
            # Utiliser les principes pour enrichir le contexte
            if 'principles' in sb_result:
                context += f"\n\nPrincipes identifi√©s : {sb_result['principles'][:200]}"
        
        # Appliquer Tree-of-Thoughts si n√©cessaire
        if 'tree_of_thoughts' in techniques:
            print("\nüå≥ Application Tree-of-Thoughts...")
            criteria = [
                "Faisabilit√© pratique",
                "Impact potentiel",
                "Innovation de l'approche",
                "Risques et mitigation"
            ]
            tot_result = self.tot.solve(problem + "\n" + context, criteria)
            results['tree_of_thoughts'] = tot_result
        
        # Appliquer Self-Consistency si n√©cessaire
        if 'self_consistency' in techniques:
            print("\nüîÑ Application Self-Consistency...")
            
            # Cr√©er un prompt enrichi avec les r√©sultats pr√©c√©dents
            enriched_prompt = problem
            if 'step_back' in results and 'solution' in results['step_back']:
                enriched_prompt += f"\n\nConsid√®re ces insights : {results['step_back']['solution'][:300]}..."
            if 'tree_of_thoughts' in results and results['tree_of_thoughts']['best_path']:
                best_thought = results['tree_of_thoughts']['best_path'][0].content
                enriched_prompt += f"\n\nApproche prometteuse identifi√©e : {best_thought[:200]}..."
            
            sc_result = self.sc.get_consensus(enriched_prompt)
            results['self_consistency'] = sc_result
        
        # Synth√®se finale
        print("\nüéØ Synth√®se des r√©sultats...")
        final_synthesis = self.create_synthesis(problem, results, techniques)
        
        return {
            'analysis': analysis,
            'techniques_used': techniques,
            'results': results,
            'synthesis': final_synthesis
        }
    
    def create_synthesis(self, problem: str, results: Dict, techniques: List[str]) -> str:
        """Cr√©e une synth√®se finale des diff√©rentes approches"""
        synthesis_prompt = f"""
        Probl√®me original : {problem}
        
        R√©sultats des diff√©rentes techniques de raisonnement :
        
        """
        
        if 'step_back' in results and 'solution' in results['step_back']:
            synthesis_prompt += f"\n**Step-Back Analysis:**\n{results['step_back']['solution'][:400]}...\n"
        
        if 'tree_of_thoughts' in results and results['tree_of_thoughts']['best_path']:
            best_thoughts = [n.content[:200] for n in results['tree_of_thoughts']['best_path'][:2]]
            synthesis_prompt += f"\n**Tree-of-Thoughts Best Path:**\n{chr(10).join(best_thoughts)}\n"
        
        if 'self_consistency' in results and 'consensus' in results['self_consistency']:
            synthesis_prompt += f"\n**Self-Consistency Consensus:**\n{results['self_consistency']['consensus'][:400]}...\n"
        
        synthesis_prompt += """
        
        Cr√©e une synth√®se finale qui :
        1. Int√®gre les meilleures id√©es de chaque approche
        2. R√©sout les contradictions √©ventuelles
        3. Propose un plan d'action clair et prioris√©
        4. Identifie les risques et les mitigation
        5. D√©finit des m√©triques de succ√®s
        """
        
        try:
            response = openai.ChatCompletion.create(
                model=self.model,
                messages=[{"role": "user", "content": synthesis_prompt}],
                temperature=0.4,
                max_tokens=1500
            )
            return response.choices[0].message.content
        except Exception as e:
            print(f"Erreur synth√®se : {e}")
            return "Erreur lors de la cr√©ation de la synth√®se"

### üöÄ Exemple ultime : Probl√®me complexe avec raisonnement hybride

In [None]:
# Probl√®me tr√®s complexe n√©cessitant plusieurs approches
complex_problem = """
Notre entreprise FinTech (paiements B2B internationaux) fait face √† une d√©cision critique :
- Croissance ralentie (15% vs 50% l'an dernier)
- Nouveaux concurrents agressifs
- R√©glementation changeante en Europe
- Opportunit√© d'acquisition d'un concurrent plus petit (15M‚Ç¨)
- Ou investir dans l'expansion Asie (20M‚Ç¨)
- Budget total disponible : 25M‚Ç¨

Quelle strat√©gie adopter pour retrouver une croissance forte tout en minimisant les risques ?
"""

additional_context = """
- 200 employ√©s actuellement
- ARR : 30M‚Ç¨
- Pr√©sence : Europe (80%), US (20%)
- Technologie propri√©taire forte
- NPS : 45 (en baisse)
"""

# R√©soudre avec approche hybride
hybrid = HybridReasoning()
solution = hybrid.solve_hybrid(complex_problem, additional_context)

# Afficher la synth√®se finale
print("\n" + "="*50)
print("üéØ SYNTH√àSE FINALE - RECOMMANDATION STRAT√âGIQUE")
print("="*50)
print(solution['synthesis'])

# Statistiques sur l'analyse
print("\nüìä Statistiques de l'analyse :")
print(f"- Techniques utilis√©es : {', '.join(solution['techniques_used'])}")
print(f"- Complexit√© identifi√©e : {solution['analysis']['complexity']}/10")
if 'tree_of_thoughts' in solution['results']:
    stats = solution['results']['tree_of_thoughts']['tree_stats']
    print(f"- Chemins explor√©s (ToT) : {stats['total_nodes']}")
if 'self_consistency' in solution['results']:
    print(f"- R√©ponses g√©n√©r√©es (SC) : {solution['results']['self_consistency']['num_responses']}")

## 5. üìä M√©triques et √âvaluation du Raisonnement

### Framework d'√©valuation des techniques de raisonnement

In [None]:
class ReasoningEvaluator:
    """√âvalue et compare diff√©rentes techniques de raisonnement"""
    
    def __init__(self, model: str = "gpt-3.5-turbo"):
        self.model = model
        self.metrics = {
            'coherence': 'Coh√©rence logique de la r√©ponse',
            'completeness': 'Exhaustivit√© de la solution',
            'practicality': 'Applicabilit√© pratique',
            'innovation': 'Originalit√© et cr√©ativit√©',
            'clarity': 'Clart√© et structure'
        }
    
    def evaluate_response(self, response: str, problem: str) -> Dict[str, float]:
        """√âvalue une r√©ponse selon plusieurs m√©triques"""
        scores = {}
        
        for metric, description in self.metrics.items():
            eval_prompt = f"""
            Probl√®me : {problem}
            
            R√©ponse √† √©valuer : {response}
            
            √âvalue cette r√©ponse sur le crit√®re : {description}
            Donne une note de 0 √† 10 et justifie bri√®vement.
            
            Format : [Note]/10 - [Justification courte]
            """
            
            try:
                result = openai.ChatCompletion.create(
                    model=self.model,
                    messages=[{"role": "user", "content": eval_prompt}],
                    temperature=0.3
                )
                
                # Extraire la note
                content = result.choices[0].message.content
                import re
                match = re.search(r'(\d+(\.\d+)?)/10', content)
                if match:
                    scores[metric] = float(match.group(1))
                else:
                    scores[metric] = 5.0
                    
            except Exception as e:
                scores[metric] = 5.0
        
        return scores
    
    def compare_techniques(self, problem: str, responses: Dict[str, str]) -> Dict:
        """Compare plusieurs techniques sur le m√™me probl√®me"""
        results = {}
        
        for technique, response in responses.items():
            print(f"\nüìä √âvaluation de {technique}...")
            scores = self.evaluate_response(response, problem)
            results[technique] = {
                'scores': scores,
                'average': np.mean(list(scores.values()))
            }
        
        # Cr√©er un rapport comparatif
        report = self.generate_comparison_report(results)
        
        return {
            'detailed_scores': results,
            'report': report,
            'winner': max(results.items(), key=lambda x: x[1]['average'])[0]
        }
    
    def generate_comparison_report(self, results: Dict) -> str:
        """G√©n√®re un rapport de comparaison d√©taill√©"""
        report = "üìä RAPPORT COMPARATIF DES TECHNIQUES\n"
        report += "=" * 40 + "\n\n"
        
        # Scores par technique
        for technique, data in results.items():
            report += f"\n{technique.upper()}\n"
            report += f"Score moyen : {data['average']:.1f}/10\n"
            for metric, score in data['scores'].items():
                report += f"  - {metric}: {score:.1f}/10\n"
        
        # Meilleure technique par m√©trique
        report += "\n\nüèÜ MEILLEURES TECHNIQUES PAR CRIT√àRE\n"
        for metric in self.metrics.keys():
            best_technique = max(results.items(), 
                               key=lambda x: x[1]['scores'].get(metric, 0))[0]
            best_score = results[best_technique]['scores'].get(metric, 0)
            report += f"- {metric}: {best_technique} ({best_score:.1f}/10)\n"
        
        return report

### üèÅ Test comparatif final

In [None]:
# Probl√®me test pour comparaison
test_problem = """
Comment une PME de 50 personnes peut-elle impl√©menter une culture d'innovation 
sans perturber ses op√©rations quotidiennes ?
"""

# G√©n√©rer des r√©ponses avec diff√©rentes techniques
print("üß™ G√©n√©ration des r√©ponses avec diff√©rentes techniques...")

responses = {}

# 1. Approche directe
print("\n1Ô∏è‚É£ Approche directe...")
try:
    direct = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": test_problem}],
        temperature=0.7
    )
    responses['direct'] = direct.choices[0].message.content
except:
    responses['direct'] = "Erreur"

# 2. Tree-of-Thoughts
print("\n2Ô∏è‚É£ Tree-of-Thoughts...")
tot_instance = TreeOfThoughts(branches=2, depth=2)
tot_result = tot_instance.solve(test_problem, ["Faisabilit√©", "Impact", "Co√ªt"])
if tot_result['best_path']:
    responses['tree_of_thoughts'] = "\n".join([n.content for n in tot_result['best_path']])

# 3. Self-Consistency
print("\n3Ô∏è‚É£ Self-Consistency...")
sc_instance = SelfConsistency(samples=3)
sc_result = sc_instance.get_consensus(test_problem)
if 'consensus' in sc_result:
    responses['self_consistency'] = sc_result['consensus']

# 4. Step-Back
print("\n4Ô∏è‚É£ Step-Back Prompting...")
sb_instance = StepBackPrompting()
sb_result = sb_instance.solve_with_stepback(test_problem)
if 'solution' in sb_result:
    responses['step_back'] = sb_result['solution']

# √âvaluer et comparer
print("\nüî¨ √âvaluation comparative...")
evaluator = ReasoningEvaluator()
comparison = evaluator.compare_techniques(test_problem, responses)

# Afficher le rapport
print("\n" + comparison['report'])
print(f"\nüèÜ Technique gagnante : {comparison['winner'].upper()}")

## üìö R√©capitulatif et Bonnes Pratiques

### üéØ Quand utiliser chaque technique :

#### Tree-of-Thoughts (ToT)
- ‚úÖ Probl√®mes avec multiples solutions possibles
- ‚úÖ Besoin d'exploration cr√©ative
- ‚úÖ D√©cisions strat√©giques complexes
- ‚ùå √âviter pour les questions simples (overhead important)

#### Self-Consistency
- ‚úÖ Besoin de haute fiabilit√©
- ‚úÖ Questions critiques n√©cessitant validation
- ‚úÖ R√©duction du bruit et des erreurs
- ‚ùå √âviter si le temps/co√ªt est critique

#### Step-Back Prompting
- ‚úÖ Probl√®mes n√©cessitant compr√©hension profonde
- ‚úÖ Cas o√π les principes fondamentaux sont importants
- ‚úÖ Transfert de connaissances entre domaines
- ‚ùå √âviter pour les t√¢ches purement ex√©cutives

### üí° Conseils d'impl√©mentation :

1. **Commencez simple** : Testez d'abord chaque technique individuellement
2. **Mesurez l'impact** : Utilisez des m√©triques pour valider l'am√©lioration
3. **Adaptez au contexte** : Chaque domaine a ses sp√©cificit√©s
4. **Optimisez les co√ªts** : Ces techniques consomment plus de tokens
5. **Documentez** : Gardez trace des configurations qui fonctionnent

## üöÄ Exercices Pratiques

### Exercice 1 : Impl√©menter votre propre variante de ToT

Cr√©ez une version de Tree-of-Thoughts qui :
- Utilise diff√©rents mod√®les pour chaque branche
- Impl√©mente un syst√®me de vote entre branches
- Permet le backtracking si une branche √©choue

In [None]:
# Votre code ici
# Indice : Commencez par modifier la classe TreeOfThoughts
# pour supporter multiple mod√®les

### Exercice 2 : Cr√©er un benchmark de raisonnement

D√©veloppez un ensemble de probl√®mes tests pour √©valuer syst√©matiquement les diff√©rentes techniques :

In [None]:
# Cr√©ez un benchmark avec diff√©rents types de probl√®mes
benchmark_problems = [
    {
        'type': 'analytical',
        'problem': 'Comment optimiser la supply chain d\'une entreprise e-commerce ?',
        'expected_qualities': ['structured', 'data-driven', 'actionable']
    },
    # Ajoutez plus de probl√®mes...
]

# Votre code pour tester syst√©matiquement

## üéì Pour aller plus loin

### üìö Ressources recommand√©es :
- [Paper: Tree of Thoughts: Deliberate Problem Solving with Large Language Models](https://arxiv.org/abs/2305.10601)
- [Paper: Self-Consistency Improves Chain of Thought Reasoning](https://arxiv.org/abs/2203.11171)
- [Paper: Take a Step Back: Evoking Reasoning via Abstraction](https://arxiv.org/abs/2310.06117)

### üî¨ Prochaines √©tapes :
1. Exp√©rimentez avec des combinaisons personnalis√©es
2. Cr√©ez des pipelines de raisonnement pour votre domaine
3. Mesurez quantitativement les am√©liorations
4. Partagez vos d√©couvertes avec la communaut√© !

---

**Prochain notebook** : 03_Optimisation_Evaluation.ipynb - M√©triques et optimisation automatique des prompts