In [None]:
!pip install requests
!pip install PyPDF2
!pip install reportlab


Collecting PyPDF2
  Downloading pypdf2-3.0.1-py3-none-any.whl.metadata (6.8 kB)
Downloading pypdf2-3.0.1-py3-none-any.whl (232 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m232.6/232.6 kB[0m [31m4.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: PyPDF2
Successfully installed PyPDF2-3.0.1
Collecting reportlab
  Downloading reportlab-4.4.3-py3-none-any.whl.metadata (1.7 kB)
Downloading reportlab-4.4.3-py3-none-any.whl (2.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.0/2.0 MB[0m [31m23.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: reportlab
Successfully installed reportlab-4.4.3


In [None]:
import requests
import json
import PyPDF2
import io
from typing import Dict, List, Optional, Tuple
from dataclasses import dataclass
from enum import Enum
import re
from reportlab.lib.pagesizes import letter, A4
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
from reportlab.lib.units import inch
from reportlab.lib import colors
from datetime import datetime
import os

class DecisionType(Enum):
    ACCEPTE = "accepte"
    REFUSE = "refuse"

@dataclass
class RFPSection:
    name: str
    content: str
    importance: float = 1.0

@dataclass
class CdCStructure:
    sections: List[str]
    mandatory_fields: List[str]
    evaluation_criteria: Dict[str, float]

@dataclass
class RFPAnalysis:
    title: str
    budget: Optional[float]
    deadline: Optional[str]
    requirements: List[str]
    complexity_score: float
    sections: List[RFPSection]

@dataclass
class Response:
    decision: DecisionType
    content: str
    reasoning: str
    confidence: float

class RFPIntelligentAgent:
    def __init__(self, together_api_key: str):
        self.together_api_key = together_api_key
        self.api_base_url = "https://api.together.xyz/v1/chat/completions"
        self.model = "mistralai/Mixtral-8x7B-Instruct-v0.1"

        # Structure type par défaut - à adapter selon vos besoins
        self.default_cdc_structure = CdCStructure(
            sections=[
                "Contexte et objectifs",
                "Périmètre et besoins fonctionnels",
                "Contraintes techniques",
                "Livrables attendus",
                "Planning et jalons",
                "Budget et modalités",
                "Critères d'évaluation",
                "Conditions contractuelles"
            ],
            mandatory_fields=[
                "budget", "deadline", "deliverables", "technical_requirements"
            ],
            evaluation_criteria={
                "budget_adequacy": 0.3,
                "timeline_feasibility": 0.25,
                "technical_complexity": 0.2,
                "strategic_alignment": 0.15,
                "resource_availability": 0.1
            }
        )


      # jghhjhgjhgjhgjhgjhgjghjgjhgjhgjhgjhgjh

    def process_cdc_reference(self, cdc_pdf_path: str) -> CdCStructure:
        """Process the reference requirements document (Cahier des Charges)"""
        try:
            # Extract text from the CDC PDF
            cdc_text = self.extract_pdf_text(cdc_pdf_path)

            # Learn the structure from the CDC text
            cdc_structure = self.learn_cdc_structure(cdc_text)

            return cdc_structure
        except Exception as e:
            print(f"Warning: Could not process CDC reference ({str(e)}). Using default structure.")
            return self.default_cdc_structure
      #jghhjhgjhgjhgjhgjhgjghjgjhgjhgjhgjhgjh

    def extract_pdf_text(self, pdf_path: str) -> str:
        """Extrait le texte d'un fichier PDF"""
        try:
            with open(pdf_path, 'rb') as file:
                pdf_reader = PyPDF2.PdfReader(file)
                text = ""
                for page in pdf_reader.pages:
                    text += page.extract_text() + "\n"
                return text
        except Exception as e:
            raise Exception(f"Erreur lors de l'extraction du PDF: {str(e)}")

    def call_mixtral_api(self, prompt: str, max_tokens: int = 1000) -> str:
        """Appelle l'API Together AI avec Mixtral"""
        headers = {
            "Authorization": f"Bearer {self.together_api_key}",
            "Content-Type": "application/json"
        }

        data = {
            "model": self.model,
            "messages": [
                {
                    "role": "user",
                    "content": prompt
                }
            ],
            "max_tokens": max_tokens,
            "temperature": 0.7
        }

        try:
            response = requests.post(self.api_base_url, headers=headers, json=data)
            response.raise_for_status()
            return response.json()["choices"][0]["message"]["content"]
        except Exception as e:
            raise Exception(f"Erreur API Together AI: {str(e)}")

    def extract_sections_from_cdc(self, cdc_text: str) -> List[str]:
        """Extrait automatiquement les sections du CdC-R"""
        prompt = f"""
        Analyse ce Cahier des Charges de Référence et identifie TOUTES les sections principales.
        Extrait les titres de sections, sous-sections importantes, et éléments structurants.

        Texte du CdC-R (premiers 4000 caractères):
        {cdc_text[:4000]}

        Réponds uniquement avec une liste JSON des sections trouvées:
        ["Section 1", "Section 2", "Section 3", ...]

        Inclut les sections typiques comme:
        - Contexte/Présentation
        - Objectifs
        - Périmètre
        - Besoins fonctionnels
        - Contraintes techniques
        - Livrables
        - Planning
        - Budget
        - Modalités
        - Critères d'évaluation
        - Conditions contractuelles
        """

        response = self.call_mixtral_api(prompt, max_tokens=800)
        try:
            # Nettoie la réponse pour extraire le JSON
            cleaned_response = response.strip()
            if not cleaned_response.startswith('['):
                # Cherche le JSON dans la réponse
                import re
                json_match = re.search(r'\[.*\]', cleaned_response, re.DOTALL)
                if json_match:
                    cleaned_response = json_match.group()

            sections = json.loads(cleaned_response)
            return sections if isinstance(sections, list) else []
        except:
            # Fallback avec sections par défaut
            return [
                "Contexte et présentation du projet",
                "Objectifs et enjeux",
                "Périmètre et besoins fonctionnels",
                "Contraintes techniques et organisationnelles",
                "Livrables attendus",
                "Planning et jalons",
                "Budget et modalités financières",
                "Critères d'évaluation et sélection",
                "Conditions contractuelles et juridiques"
            ]
    def learn_cdc_structure(self, cdc_text: str) -> CdCStructure:
        """Analyse un CdC-R pour extraire la structure type"""

        # Extraction automatique des sections
        sections = self.extract_sections_from_cdc(cdc_text)

        prompt = f"""
        Analyse ce Cahier des Charges de Référence pour identifier:
        1. Les champs obligatoires mentionnés
        2. Les critères d'évaluation avec leurs importances relatives

        Sections identifiées: {sections}

        Texte du CdC-R:
        {cdc_text[:3000]}...

        Réponds au format JSON:
        {{
            "mandatory_fields": ["field1", "field2", ...],
            "evaluation_criteria": {{"criterion1": 0.3, "criterion2": 0.2, ...}}
        }}
        """

        response = self.call_mixtral_api(prompt)
        try:
            structure_data = json.loads(response)
            return CdCStructure(
                sections=sections,
                mandatory_fields=structure_data.get("mandatory_fields", []),
                evaluation_criteria=structure_data.get("evaluation_criteria", {})
            )
        except:
            return CdCStructure(
                sections=sections,
                mandatory_fields=["budget", "deadline", "deliverables", "technical_requirements"],
                evaluation_criteria={
                    "budget_adequacy": 0.3,
                    "timeline_feasibility": 0.25,
                    "technical_complexity": 0.2,
                    "strategic_alignment": 0.15,
                    "resource_availability": 0.1
                }
            )

    def analyze_rfp(self, rfp_text: str) -> RFPAnalysis:
        """Analyse détaillée d'un RFP"""
        prompt = f"""
        Analyse ce RFP (Request for Proposal) et extrait les informations clés:

        {rfp_text[:4000]}...

        Extrait et structure les informations suivantes au format JSON:
        {{
            "title": "titre du projet",
            "budget": montant_numérique_ou_null,
            "deadline": "date_limite_ou_null",
            "requirements": ["exigence1", "exigence2", ...],
            "complexity_score": score_de_1_à_10,
            "main_sections": ["section1", "section2", ...]
        }}
        """

        response = self.call_mixtral_api(prompt)
        try:
            data = json.loads(response)
            sections = [RFPSection(name=section, content="") for section in data.get("main_sections", [])]

            return RFPAnalysis(
                title=data.get("title", "RFP Sans Titre"),
                budget=data.get("budget"),
                deadline=data.get("deadline"),
                requirements=data.get("requirements", []),
                complexity_score=data.get("complexity_score", 5.0),
                sections=sections
            )
        except Exception as e:
            raise Exception(f"Erreur lors de l'analyse RFP: {str(e)}")

    def make_decision(self, rfp_analysis: RFPAnalysis, cdc_structure: CdCStructure) -> DecisionType:
        """Décide si le RFP doit être accepté ou refusé (critères non exigeants)"""
        score = 0.0
        reasons = []

        # Critères flexibles pour enrichir la data

        # 1. Budget (très permissif)
        if rfp_analysis.budget:
            if rfp_analysis.budget >= 5000:
                score += 0.25
                reasons.append("Budget acceptable")
            elif rfp_analysis.budget >= 1000:
                score += 0.15
                reasons.append("Budget modeste mais viable")
        else:
            score += 0.1  # Budget non spécifié = acceptable
            reasons.append("Budget à négocier")

        # 2. Complexité (accepte presque tout)
        if rfp_analysis.complexity_score <= 8:
            score += 0.25
            reasons.append("Complexité maîtrisable")
        elif rfp_analysis.complexity_score <= 10:
            score += 0.15
            reasons.append("Complexité élevée mais faisable")

        # 3. Nombre d'exigences (très tolérant)
        req_count = len(rfp_analysis.requirements)
        if req_count <= 15:
            score += 0.2
            reasons.append("Nombre d'exigences raisonnable")
        elif req_count <= 25:
            score += 0.1
            reasons.append("Nombreuses exigences mais gérable")

        # 4. Présence de sections structurées
        if len(rfp_analysis.sections) >= 3:
            score += 0.15
            reasons.append("RFP bien structuré")

        # 5. Bonus aléatoire pour variation des données
        import random
        random.seed(hash(rfp_analysis.title))
        bonus = random.uniform(0, 0.2)
        score += bonus

        # Seuil très bas pour accepter la plupart des RFP
        decision = DecisionType.ACCEPTE if score >= 0.4 else DecisionType.REFUSE

        return decision

    def generate_response(self, rfp_analysis: RFPAnalysis, decision: DecisionType,
                         cdc_structure: CdCStructure) -> Response:
        """Génère une réponse personnalisée selon la décision"""

        if decision == DecisionType.ACCEPTE:
            prompt = f"""
            Génère une réponse professionnelle POSITIVE à ce RFP:

            Projet: {rfp_analysis.title}
            Budget: {rfp_analysis.budget}
            Échéance: {rfp_analysis.deadline}
            Exigences principales: {', '.join(rfp_analysis.requirements[:5])}

            La réponse doit inclure:
            1. Confirmation de notre intérêt
            2. Notre compréhension des besoins
            3. Approche méthodologique proposée
            4. Équipe et compétences
            5. Planning indicatif
            6. Prochaines étapes

            Style: Professionnel, confiant, sur-mesure
            """
        else:
            prompt = f"""
            Génère une réponse professionnelle de DÉCLINAISON à ce RFP:

            Projet: {rfp_analysis.title}
            Budget: {rfp_analysis.budget}
            Échéance: {rfp_analysis.deadline}

            La réponse doit:
            1. Remercier pour l'opportunité
            2. Expliquer poliment pourquoi nous déclinons (sans critiquer)
            3. Laisser la porte ouverte pour de futures collaborations
            4. Éventuellement recommander d'autres prestataires

            Style: Courtois, respectueux, diplomatique
            """

        content = self.call_mixtral_api(prompt, max_tokens=1500)

        reasoning = f"Décision basée sur: Budget={'OK' if rfp_analysis.budget and rfp_analysis.budget >= 10000 else 'Insuffisant'}, Complexité={rfp_analysis.complexity_score}/10"
        return Response(
        decision=decision,
        content=content,
        reasoning=reasoning,
        confidence=0.8  # You might want to calculate this based on your criteria
    )

    def generate_pdf_response(self, response: Response, rfp_analysis: RFPAnalysis,
                             filename: str) -> str:
        """Génère un PDF professionnel pour la réponse"""

        doc = SimpleDocTemplate(filename, pagesize=A4)
        styles = getSampleStyleSheet()
        story = []

        # Style personnalisé pour le titre
        title_style = ParagraphStyle(
            'CustomTitle',
            parent=styles['Heading1'],
            fontSize=18,
            spaceAfter=30,
            textColor=colors.darkblue,
            alignment=1  # Center
        )

        # Style pour les sections
        section_style = ParagraphStyle(
            'CustomSection',
            parent=styles['Heading2'],
            fontSize=14,
            spaceAfter=12,
            textColor=colors.darkblue
        )

        # En-tête du document
        date_str = datetime.now().strftime("%d/%m/%Y")

        story.append(Paragraph("RÉPONSE À APPEL D'OFFRES", title_style))
        story.append(Spacer(1, 20))

        # Informations du projet
        story.append(Paragraph("INFORMATIONS DU PROJET", section_style))
        story.append(Paragraph(f"<b>Projet :</b> {rfp_analysis.title}", styles['Normal']))
        story.append(Paragraph(f"<b>Date de réponse :</b> {date_str}", styles['Normal']))
        if rfp_analysis.budget:
            story.append(Paragraph(f"<b>Budget :</b> {rfp_analysis.budget:,.0f} €", styles['Normal']))
        if rfp_analysis.deadline:
            story.append(Paragraph(f"<b>Échéance :</b> {rfp_analysis.deadline}", styles['Normal']))

        story.append(Spacer(1, 20))

        # Type de réponse
        decision_color = colors.green if response.decision == DecisionType.ACCEPTE else colors.red
        decision_text = "CANDIDATURE ACCEPTÉE" if response.decision == DecisionType.ACCEPTE else "CANDIDATURE DÉCLINÉE"

        decision_style = ParagraphStyle(
            'Decision',
            parent=styles['Heading2'],
            fontSize=16,
            textColor=decision_color,
            alignment=1,
            spaceAfter=20
        )

        story.append(Paragraph(decision_text, decision_style))

        # Contenu de la réponse
        story.append(Paragraph("NOTRE RÉPONSE", section_style))

        # Divise le contenu en paragraphes
        paragraphs = response.content.split('\n\n')
        for para in paragraphs:
            if para.strip():
                story.append(Paragraph(para.strip(), styles['Normal']))
                story.append(Spacer(1, 12))

        # Raisonnement (optionnel)
        if response.reasoning:
            story.append(Spacer(1, 20))
            story.append(Paragraph("ANALYSE INTERNE", section_style))
            story.append(Paragraph(response.reasoning, styles['Italic']))

        # Signature
        story.append(Spacer(1, 30))
        story.append(Paragraph("Cordialement,", styles['Normal']))
        story.append(Spacer(1, 10))
        story.append(Paragraph("[Nom de votre entreprise]", styles['Normal']))
        story.append(Paragraph("[Fonction]", styles['Normal']))
        story.append(Paragraph("[Contact]", styles['Normal']))

        # Génère le PDF
        doc.build(story)
        return filename

    def process_rfp(self, rfp_pdf_path: str, cdc_pdf_path: Optional[str] = None) -> Tuple[str, str]:
        """Traite un RFP complet et génère les deux types de réponses en PDF"""

        # 1. Extraction du texte PDF du RFP
        rfp_text = self.extract_pdf_text(rfp_pdf_path)

        # 2. Apprentissage de la structure du CdC-R
        if cdc_pdf_path:
            cdc_structure = self.process_cdc_reference(cdc_pdf_path)
            print(f"Structure apprise du CdC-R:")
            print(f"- {len(cdc_structure.sections)} sections identifiées")
            print(f"- {len(cdc_structure.mandatory_fields)} champs obligatoires")
        else:
            cdc_structure = self.default_cdc_structure
            print("Utilisation de la structure par défaut")

        # 3. Analyse du RFP
        print("Analyse du RFP en cours...")
        rfp_analysis = self.analyze_rfp(rfp_text)
        print(f"RFP analysé: {rfp_analysis.title}")
        print(f"Complexité: {rfp_analysis.complexity_score}/10")
        print(f"Exigences: {len(rfp_analysis.requirements)}")

        # 4. Prise de décision
        decision_real = self.make_decision(rfp_analysis, cdc_structure)
        print(f"Décision automatique: {decision_real.value}")

        # 5. Génération des deux réponses
        print("Génération des réponses...")
        response_real = self.generate_response(rfp_analysis, decision_real, cdc_structure)

        # Réponse opposée pour enrichir les données
        decision_opposite = DecisionType.REFUSE if decision_real == DecisionType.ACCEPTE else DecisionType.ACCEPTE
        response_opposite = self.generate_response(rfp_analysis, decision_opposite, cdc_structure)

        # 6. Génération des PDF
        base_name = os.path.splitext(os.path.basename(rfp_pdf_path))[0]
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")

        pdf_real = f"reponse_{decision_real.value}_{base_name}_{timestamp}.pdf"
        pdf_opposite = f"reponse_{decision_opposite.value}_{base_name}_{timestamp}.pdf"

        self.generate_pdf_response(response_real, rfp_analysis, pdf_real)
        self.generate_pdf_response(response_opposite, rfp_analysis, pdf_opposite)

        print(f"PDFs générés:")
        print(f"- {pdf_real}")
        print(f"- {pdf_opposite}")

        return pdf_real, pdf_opposite

# Exemple d'utilisation
def main():
    # Configuration
    API_KEY = "6a87e491ae0b1c041ccbaf70976a2395790053ad4b3d323272b3a6a52e5d054b"  # Remplacer par votre clé

    agent = RFPIntelligentAgent(API_KEY)

    # Traitement d'un RFP avec CdC-R de référence
    try:
        rfp_path = "/content/drive/MyDrive/Projet Talan /data asma/demo_package/Copie de RFP-AI_ML-20250722-965_Main_RFP.pdf"
        cdc_path = "/content/cahier_charges_reference.pdf"  # Votre CdC-R de référence

        # Traitement complet avec génération de PDF
        pdf_accepted, pdf_refused = agent.process_rfp(rfp_path, cdc_path)

        print("\n=== TRAITEMENT TERMINÉ ===")
        print(f"Réponse d'acceptation générée: {pdf_accepted}")
        print(f"Réponse de refus générée: {pdf_refused}")

        # Pour tester sans CdC-R de référence
        # pdf_accepted, pdf_refused = agent.process_rfp(rfp_path)

    except Exception as e:
        print(f"Erreur: {str(e)}")

# Test avec des données d'exemple (sans PDF)
def test_with_sample_data():
    """Test avec des données simulées"""
    API_KEY = "6a87e491ae0b1c041ccbaf70976a2395790053ad4b3d323272b3a6a52e5d054b"
    agent = RFPIntelligentAgent(API_KEY)

    # Simulation d'un RFP analysé
    sample_rfp = RFPAnalysis(
        title="Développement d'une plateforme e-commerce",
        budget=25000.0,
        deadline="2024-12-31",
        requirements=[
            "Interface utilisateur responsive",
            "Système de paiement sécurisé",
            "Gestion des stocks",
            "Panel d'administration",
            "Intégration avec API tiers"
        ],
        complexity_score=6.5,
        sections=[
            RFPSection("Contexte", ""),
            RFPSection("Besoins fonctionnels", ""),
            RFPSection("Contraintes techniques", "")
        ]
    )

    # Test de génération de réponses
    cdc_structure = agent.default_cdc_structure
    decision = agent.make_decision(sample_rfp, cdc_structure)
    response = agent.generate_response(sample_rfp, decision, cdc_structure)

    # Génération du PDF test
    test_pdf = f"test_response_{decision.value}.pdf"
    agent.generate_pdf_response(response, sample_rfp, test_pdf)
    print(f"PDF de test généré: {test_pdf}")

if __name__ == "__main__":
    # main()  # Utilisation normale
    #test_with_sample_data()  # Test avec données simulées
    print ("############################################""")
    main()

############################################
Structure apprise du CdC-R:
- 9 sections identifiées
- 4 champs obligatoires
Analyse du RFP en cours...
RFP analysé: Transformation numérique avec AI/ML
Complexité: 8/10
Exigences: 31
Décision automatique: accepte
Génération des réponses...
PDFs générés:
- reponse_accepte_Copie de RFP-AI_ML-20250722-965_Main_RFP_20250723_141535.pdf
- reponse_refuse_Copie de RFP-AI_ML-20250722-965_Main_RFP_20250723_141535.pdf

=== TRAITEMENT TERMINÉ ===
Réponse d'acceptation générée: reponse_accepte_Copie de RFP-AI_ML-20250722-965_Main_RFP_20250723_141535.pdf
Réponse de refus générée: reponse_refuse_Copie de RFP-AI_ML-20250722-965_Main_RFP_20250723_141535.pdf


In [None]:
!pip install chromadb deepeval reportlab PyPDF2 requests


Collecting chromadb
  Downloading chromadb-1.0.15-cp39-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (7.0 kB)
Collecting deepeval
  Downloading deepeval-3.3.1-py3-none-any.whl.metadata (17 kB)
Collecting pybase64>=1.4.1 (from chromadb)
  Downloading pybase64-1.4.1-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (8.4 kB)
Collecting posthog<6.0.0,>=2.4.0 (from chromadb)
  Downloading posthog-5.4.0-py3-none-any.whl.metadata (5.7 kB)
Collecting onnxruntime>=1.14.1 (from chromadb)
  Downloading onnxruntime-1.22.1-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (4.6 kB)
Collecting opentelemetry-api>=1.2.0 (from chromadb)
  Downloading opentelemetry_api-1.35.0-py3-none-any.whl.metadata (1.5 kB)
Collecting opentelemetry-exporter-otlp-proto-grpc>=1.2.0 (from chromadb)
  Downloading opentelemetry_exporter_otlp_proto_grpc-1.35.0-py3-none-any.whl.metadata (2.4 kB)
Collecting opentelemetry-sdk>=1.2.0 (fro

In [None]:
!pip install xai-sdk

Collecting xai-sdk
  Downloading xai_sdk-1.0.0-py3-none-any.whl.metadata (21 kB)
Downloading xai_sdk-1.0.0-py3-none-any.whl (109 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m109.5/109.5 kB[0m [31m3.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: xai-sdk
Successfully installed xai-sdk-1.0.0


In [None]:
import requests
import json
import PyPDF2
import io
from typing import Dict, List, Optional, Tuple
from dataclasses import dataclass
from enum import Enum
import re
from reportlab.lib.pagesizes import letter, A4
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, PageBreak, Table, TableStyle
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
from reportlab.lib.units import inch
from reportlab.lib import colors
from datetime import datetime
import os
import chromadb
from chromadb.config import Settings
from deepeval.synthesizer import Synthesizer
from deepeval.synthesizer.config import ContextConstructionConfig
import hashlib

class DecisionType(Enum):
    ACCEPTE = "accepte"
    REFUSE = "refuse"

@dataclass
class CdCSection:
    name: str
    content: str
    importance: float = 1.0
    is_mandatory: bool = False
    subsections: List[str] = None

@dataclass
class CdCStructure:
    sections: List[CdCSection]
    mandatory_fields: List[str]
    evaluation_criteria: Dict[str, float]
    document_metadata: Dict[str, str] = None

@dataclass
class RFPAnalysis:
    title: str
    budget: Optional[float]
    deadline: Optional[str]
    requirements: List[str]
    complexity_score: float
    technical_requirements: List[str]
    functional_requirements: List[str]
    constraints: List[str]

@dataclass
class CahierDesCharges:
    title: str
    sections: Dict[str, str]  # section_name -> content
    decision_type: DecisionType
    metadata: Dict[str, str]

class RFPIntelligentAgent:
    def __init__(self, together_api_key: str, chroma_db_path: str = "./chroma_db"):
        self.together_api_key = together_api_key
        self.api_base_url = "https://api.together.xyz/v1/chat/completions"
        self.model = "mistralai/Mixtral-8x7B-Instruct-v0.1"

        # Initialisation ChromaDB
        self.chroma_client = chromadb.PersistentClient(path=chroma_db_path)
        self.cdc_collection = self.chroma_client.get_or_create_collection(
            name="cahiers_des_charges",
            metadata={"description": "Collection des cahiers des charges de référence"}
        )

        # Initialisation DeepEval Synthesizer (version modifiée)
        self.synthesizer = None  # Remplacez par votre propre implémentation si nécessaire
        self.context_config = {
            "chunk_size": 1000,
            "chunk_overlap": 200,
            "max_contexts": 5
        }

        # Structure par défaut
        self.default_sections = [
            CdCSection("1. CONTEXTE ET PRESENTATION DU PROJET", "", 1.0, True),
            CdCSection("2. OBJECTIFS ET ENJEUX", "", 0.9, True),
            CdCSection("3. PERIMETRE ET BESOINS FONCTIONNELS", "", 1.0, True),
            CdCSection("4. CONTRAINTES TECHNIQUES", "", 0.8, True),
            CdCSection("5. LIVRABLES ATTENDUS", "", 1.0, True),
            CdCSection("6. PLANNING ET JALONS", "", 0.7, True),
            CdCSection("7. BUDGET ET MODALITES FINANCIERES", "", 0.9, True),
            CdCSection("8. CRITERES D'EVALUATION", "", 0.6, False),
            CdCSection("9. CONDITIONS CONTRACTUELLES", "", 0.5, False),
            CdCSection("10. MODALITES DE SUIVI", "", 0.4, False)
        ]

    def extract_pdf_text(self, pdf_path: str) -> str:
        """Extrait le texte d'un fichier PDF"""
        try:
            with open(pdf_path, 'rb') as file:
                pdf_reader = PyPDF2.PdfReader(file)
                text = ""
                for page in pdf_reader.pages:
                    text += page.extract_text() + "\n"
                return text
        except Exception as e:
            raise Exception(f"Erreur lors de l'extraction du PDF: {str(e)}")

    def call_mixtral_api(self, prompt: str, max_tokens: int = 2000) -> str:
        """Appelle l'API Together AI avec Mixtral"""
        headers = {
            "Authorization": f"Bearer {self.together_api_key}",
            "Content-Type": "application/json"
        }

        data = {
            "model": self.model,
            "messages": [{"role": "user", "content": prompt}],
            "max_tokens": max_tokens,
            "temperature": 0.7
        }

        try:
            response = requests.post(self.api_base_url, headers=headers, json=data)
            response.raise_for_status()
            return response.json()["choices"][0]["message"]["content"]
        except Exception as e:
            raise Exception(f"Erreur API Together AI: {str(e)}")

    def store_cdc_reference_in_chroma(self, cdc_text: str, cdc_path: str):
        """Stocke le CdC de référence dans ChromaDB avec chunking"""
        # Découpage du texte en chunks
        chunks = self._chunk_text(cdc_text, chunk_size=1000, overlap=200)

        # Génération d'un ID unique pour ce document
        doc_id = hashlib.md5(cdc_path.encode()).hexdigest()

        # Stockage dans ChromaDB
        documents = []
        metadatas = []
        ids = []

        for i, chunk in enumerate(chunks):
            documents.append(chunk)
            metadatas.append({
                "source": cdc_path,
                "doc_id": doc_id,
                "chunk_id": i,
                "type": "reference_cdc"
            })
            ids.append(f"{doc_id}_chunk_{i}")

        # Ajout à la collection
        self.cdc_collection.add(
            documents=documents,
            metadatas=metadatas,
            ids=ids
        )

        print(f"CdC de référence stocké: {len(chunks)} chunks dans ChromaDB")

    def _chunk_text(self, text: str, chunk_size: int = 1000, overlap: int = 200) -> List[str]:
        """Découpe le texte en chunks avec overlap"""
        chunks = []
        start = 0

        while start < len(text):
            end = start + chunk_size
            chunk = text[start:end]

            # Essaie de couper à la fin d'une phrase
            if end < len(text):
                last_period = chunk.rfind('.')
                if last_period > chunk_size * 0.7:  # Au moins 70% du chunk
                    chunk = chunk[:last_period + 1]
                    end = start + last_period + 1

            chunks.append(chunk.strip())
            start = end - overlap if end < len(text) else end

        return chunks

    def extract_cdc_structure_with_chroma(self, cdc_text: str, cdc_path: str) -> CdCStructure:
        """Extrait la structure du CdC en utilisant ChromaDB et DeepEval"""

        # Stockage dans ChromaDB
        self.store_cdc_reference_in_chroma(cdc_text, cdc_path)

        # Recherche sémantique des sections principales
        sections_query = "sections principales structure cahier des charges"
        results = self.cdc_collection.query(
            query_texts=[sections_query],
            n_results=5
        )

        # Extraction des sections avec l'API
        prompt = f"""
        Analyse ce Cahier des Charges de référence et extrait TOUTES les sections principales avec leur structure.

        Contexte trouvé par recherche sémantique:
        {' '.join(results['documents'][0][:3])}

        Texte complet (premiers 3000 caractères):
        {cdc_text[:3000]}

        Extrait au format JSON:
        {{
            "sections": [
                {{
                    "name": "nom de la section",
                    "is_mandatory": true/false,
                    "importance": 0.0-1.0,
                    "subsections": ["sous-section1", "sous-section2"]
                }}
            ],
            "mandatory_fields": ["field1", "field2"],
            "evaluation_criteria": {{"criterion1": 0.3, "criterion2": 0.2}}
        }}
        """

        response = self.call_mixtral_api(prompt, max_tokens=1500)

        try:
            data = json.loads(response)
            sections = []

            for i, section_data in enumerate(data.get("sections", [])):
                section = CdCSection(
                    name=f"{i+1}. {section_data['name'].upper()}",
                    content="",
                    importance=section_data.get("importance", 1.0),
                    is_mandatory=section_data.get("is_mandatory", False),
                    subsections=section_data.get("subsections", [])
                )
                sections.append(section)

            return CdCStructure(
                sections=sections if sections else self.default_sections,
                mandatory_fields=data.get("mandatory_fields", []),
                evaluation_criteria=data.get("evaluation_criteria", {}),
                document_metadata={"source": cdc_path, "processed_date": datetime.now().isoformat()}
            )

        except Exception as e:
            print(f"Erreur parsing structure CdC: {e}. Utilisation structure par défaut.")
            return CdCStructure(
                sections=self.default_sections,
                mandatory_fields=["budget", "deadline", "deliverables"],
                evaluation_criteria={"budget": 0.3, "timeline": 0.25, "complexity": 0.2}
            )

    def analyze_rfp_enhanced(self, rfp_text: str) -> RFPAnalysis:
        """Analyse avancée du RFP avec extraction détaillée"""
        prompt = f"""
        Analyse en détail ce RFP et extrait toutes les informations structurées:

        {rfp_text[:4000]}...

        Format JSON attendu:
        {{
            "title": "titre exact du projet",
            "budget": montant_numérique_ou_null,
            "deadline": "date_limite_format_iso_ou_null",
            "requirements": ["exigence générale 1", "exigence générale 2"],
            "technical_requirements": ["exigence technique 1", "exigence technique 2"],
            "functional_requirements": ["besoin fonctionnel 1", "besoin fonctionnel 2"],
            "constraints": ["contrainte 1", "contrainte 2"],
            "complexity_score": score_de_1_à_10_avec_justification
        }}
        """

        response = self.call_mixtral_api(prompt, max_tokens=1500)

        try:
            data = json.loads(response)
            return RFPAnalysis(
                title=data.get("title", "Projet Sans Titre"),
                budget=data.get("budget"),
                deadline=data.get("deadline"),
                requirements=data.get("requirements", []),
                technical_requirements=data.get("technical_requirements", []),
                functional_requirements=data.get("functional_requirements", []),
                constraints=data.get("constraints", []),
                complexity_score=float(data.get("complexity_score", 5.0))
            )
        except Exception as e:
            print(f"Erreur analyse RFP: {e}")
            # Fallback analysis
            return RFPAnalysis(
                title="RFP Analysis Failed",
                budget=None,
                deadline=None,
                requirements=[],
                technical_requirements=[],
                functional_requirements=[],
                constraints=[],
                complexity_score=5.0
            )

    def generate_cdc_section_content(self, section: CdCSection, rfp_analysis: RFPAnalysis,
                                   decision: DecisionType, relevant_context: str = "") -> str:
        """Génère le contenu d'une section du CdC en utilisant la recherche sémantique"""

        # Recherche de contexte pertinent dans ChromaDB
        section_context = self.cdc_collection.query(
            query_texts=[f"{section.name} {section.subsections}"],
            n_results=3
        )

        context_text = " ".join(section_context['documents'][0]) if section_context['documents'] else ""

        decision_context = "acceptation du projet" if decision == DecisionType.ACCEPTE else "déclinaison polie du projet"

        prompt = f"""
        Génère le contenu détaillé pour la section "{section.name}" d'un cahier des charges.

        Contexte du RFP:
        - Projet: {rfp_analysis.title}
        - Budget: {rfp_analysis.budget}
        - Échéance: {rfp_analysis.deadline}
        - Exigences techniques: {rfp_analysis.technical_requirements[:3]}
        - Exigences fonctionnelles: {rfp_analysis.functional_requirements[:3]}

        Contexte de référence trouvé:
        {context_text[:1000]}

        Type de réponse: {decision_context}

        Sous-sections à couvrir: {section.subsections}

        Génère un contenu professionnel, détaillé et adapté au contexte.
        Si c'est une déclinaison, reste poli et constructif.
        Longueur: 200-500 mots selon l'importance de la section.
        """

        return self.call_mixtral_api(prompt, max_tokens=800)

    def make_decision_enhanced(self, rfp_analysis: RFPAnalysis) -> DecisionType:
        """Décision intelligente basée sur plusieurs critères"""
        score = 0.0

        # Critères de décision plus sophistiqués
        if rfp_analysis.budget and rfp_analysis.budget >= 10000:
            score += 0.3
        elif rfp_analysis.budget and rfp_analysis.budget >= 5000:
            score += 0.1

        if rfp_analysis.complexity_score <= 7:
            score += 0.25
        elif rfp_analysis.complexity_score <= 8.5:
            score += 0.1

        if len(rfp_analysis.technical_requirements) <= 10:
            score += 0.2

        if len(rfp_analysis.functional_requirements) <= 15:
            score += 0.15

        # Bonus/malus selon les contraintes
        constraint_keywords = ["urgent", "complexe", "critique", "innovation"]
        constraint_text = " ".join(rfp_analysis.constraints).lower()

        for keyword in constraint_keywords:
            if keyword in constraint_text:
                if keyword in ["urgent", "critique"]:
                    score -= 0.05
                else:
                    score += 0.05

        # Décision avec seuil adaptatif
        threshold = 0.45
        return DecisionType.ACCEPTE if score >= threshold else DecisionType.REFUSE

    def generate_cahier_des_charges(self, rfp_analysis: RFPAnalysis, cdc_structure: CdCStructure,
                                  decision: DecisionType) -> CahierDesCharges:
        """Génère un cahier des charges complet"""

        sections_content = {}

        print(f"Génération du CdC ({decision.value})...")

        for section in cdc_structure.sections:
            print(f"  - {section.name}")
            content = self.generate_cdc_section_content(section, rfp_analysis, decision)
            sections_content[section.name] = content

        # Titre adapté selon la décision
        if decision == DecisionType.ACCEPTE:
            title = f"CAHIER DES CHARGES - {rfp_analysis.title.upper()}"
        else:
            title = f"RÉPONSE DE DÉCLINAISON - {rfp_analysis.title.upper()}"

        metadata = {
            "rfp_title": rfp_analysis.title,
            "decision": decision.value,
            "generated_date": datetime.now().isoformat(),
            "budget": str(rfp_analysis.budget) if rfp_analysis.budget else "Non spécifié",
            "deadline": rfp_analysis.deadline or "Non spécifiée",
            "complexity": str(rfp_analysis.complexity_score)
        }

        return CahierDesCharges(
            title=title,
            sections=sections_content,
            decision_type=decision,
            metadata=metadata
        )

    def generate_pdf_cahier_des_charges(self, cdc: CahierDesCharges, filename: str) -> str:
        """Génère un PDF professionnel pour le cahier des charges"""

        doc = SimpleDocTemplate(filename, pagesize=A4,
                              leftMargin=72, rightMargin=72,
                              topMargin=72, bottomMargin=72)
        styles = getSampleStyleSheet()
        story = []

        # Styles personnalisés
        title_style = ParagraphStyle(
            'CdCTitle',
            parent=styles['Title'],
            fontSize=20,
            spaceAfter=30,
            textColor=colors.darkblue,
            alignment=1,
            fontName='Helvetica-Bold'
        )

        section_style = ParagraphStyle(
            'CdCSection',
            parent=styles['Heading1'],
            fontSize=14,
            spaceAfter=20,
            spaceBefore=20,
            textColor=colors.darkblue,
            fontName='Helvetica-Bold'
        )

        # Page de titre
        story.append(Paragraph(cdc.title, title_style))
        story.append(Spacer(1, 50))

        # Informations générales
        info_data = [
            ['Projet:', cdc.metadata.get('rfp_title', 'N/A')],
            ['Type:', 'Acceptation' if cdc.decision_type == DecisionType.ACCEPTE else 'Déclinaison'],
            ['Date:', datetime.now().strftime("%d/%m/%Y")],
            ['Budget:', cdc.metadata.get('budget', 'N/A')],
            ['Échéance:', cdc.metadata.get('deadline', 'N/A')],
            ['Complexité:', f"{cdc.metadata.get('complexity', 'N/A')}/10"]
        ]

        info_table = Table(info_data, colWidths=[2*inch, 4*inch])
        info_table.setStyle(TableStyle([
            ('BACKGROUND', (0, 0), (0, -1), colors.lightgrey),
            ('TEXTCOLOR', (0, 0), (0, -1), colors.black),
            ('FONTNAME', (0, 0), (0, -1), 'Helvetica-Bold'),
            ('FONTSIZE', (0, 0), (-1, -1), 10),
            ('GRID', (0, 0), (-1, -1), 1, colors.black),
            ('VALIGN', (0, 0), (-1, -1), 'TOP'),
        ]))

        story.append(info_table)
        story.append(PageBreak())

        # Contenu des sections
        for section_name, content in cdc.sections.items():
            story.append(Paragraph(section_name, section_style))

            # Divise le contenu en paragraphes
            paragraphs = content.split('\n\n') if content else ["Contenu à définir"]

            for para in paragraphs:
                if para.strip():
                    story.append(Paragraph(para.strip(), styles['Normal']))
                    story.append(Spacer(1, 10))

            story.append(Spacer(1, 20))

        # Pied de page avec signature
        story.append(Spacer(1, 30))
        story.append(Paragraph("Document généré automatiquement", styles['Italic']))
        story.append(Paragraph(f"Date: {datetime.now().strftime('%d/%m/%Y à %H:%M')}", styles['Italic']))

        # Génère le PDF
        doc.build(story)
        print(f"PDF généré: {filename}")
        return filename

    def process_rfp_complete(self, rfp_pdf_path: str, cdc_reference_path: Optional[str] = None) -> Tuple[str, str]:
        """Traitement complet d'un RFP avec génération de deux CdC"""

        print("=== DÉBUT DU TRAITEMENT RFP ===")

        # 1. Extraction du RFP
        print("1. Extraction du RFP...")
        rfp_text = self.extract_pdf_text(rfp_pdf_path)

        # 2. Traitement du CdC de référence
        if cdc_reference_path and os.path.exists(cdc_reference_path):
            print("2. Traitement du CdC de référence...")
            cdc_text = self.extract_pdf_text(cdc_reference_path)
            cdc_structure = self.extract_cdc_structure_with_chroma(cdc_text, cdc_reference_path)
            print(f"   Structure extraite: {len(cdc_structure.sections)} sections")
        else:
            print("2. Utilisation de la structure par défaut...")
            cdc_structure = CdCStructure(
                sections=self.default_sections,
                mandatory_fields=["budget", "deadline", "deliverables"],
                evaluation_criteria={"budget": 0.3, "timeline": 0.25}
            )

        # 3. Analyse du RFP
        print("3. Analyse détaillée du RFP...")
        rfp_analysis = self.analyze_rfp_enhanced(rfp_text)
        print(f"   Projet: {rfp_analysis.title}")
        print(f"   Complexité: {rfp_analysis.complexity_score}/10")
        print(f"   Exigences: {len(rfp_analysis.requirements)} générales, {len(rfp_analysis.technical_requirements)} techniques")

        # 4. Prise de décision
        print("4. Prise de décision...")
        primary_decision = self.make_decision_enhanced(rfp_analysis)
        opposite_decision = DecisionType.REFUSE if primary_decision == DecisionType.ACCEPTE else DecisionType.ACCEPTE

        print(f"   Décision principale: {primary_decision.value}")
        print(f"   Décision alternative: {opposite_decision.value}")

        # 5. Génération des deux CdC
        print("5. Génération des cahiers des charges...")

        cdc_primary = self.generate_cahier_des_charges(rfp_analysis, cdc_structure, primary_decision)
        cdc_opposite = self.generate_cahier_des_charges(rfp_analysis, cdc_structure, opposite_decision)

        # 6. Génération des PDF
        print("6. Génération des PDF...")

        base_name = os.path.splitext(os.path.basename(rfp_pdf_path))[0]
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")

        pdf_primary = f"cdc_{primary_decision.value}_{base_name}_{timestamp}.pdf"
        pdf_opposite = f"cdc_{opposite_decision.value}_{base_name}_{timestamp}.pdf"

        self.generate_pdf_cahier_des_charges(cdc_primary, pdf_primary)
        self.generate_pdf_cahier_des_charges(cdc_opposite, pdf_opposite)

        print("=== TRAITEMENT TERMINÉ ===")
        print(f"CdC Principal ({primary_decision.value}): {pdf_primary}")
        print(f"CdC Alternatif ({opposite_decision.value}): {pdf_opposite}")

        return pdf_primary, pdf_opposite

# Exemple d'utilisation
def main():
    # Configuration
    API_KEY = "6a87e491ae0b1c041ccbaf70976a2395790053ad4b3d323272b3a6a52e5d054b"

    # Initialisation de l'agent
    agent = RFPIntelligentAgent(API_KEY, chroma_db_path="./chroma_cdc_db")

    try:
        # Chemins des fichiers
        rfp_path = "/content/drive/MyDrive/Projet Talan /data asma/demo_package/Copie de RFP-AI_ML-20250722-965_Main_RFP.pdf"
        cdc_reference_path = "/content/cahier_charges_reference.pdf"  # Optionnel

        # Traitement complet
        pdf_primary, pdf_alternative = agent.process_rfp_complete(rfp_path, cdc_reference_path)

        print(f"\n✅ SUCCÈS!")
        print(f"📄 Cahier des charges principal: {pdf_primary}")
        print(f"📄 Cahier des charges alternatif: {pdf_alternative}")

    except Exception as e:
        print(f"❌ ERREUR: {str(e)}")
        import traceback
        traceback.print_exc()

if __name__ == "__main__":
    main()

=== DÉBUT DU TRAITEMENT RFP ===
1. Extraction du RFP...
2. Traitement du CdC de référence...


/root/.cache/chroma/onnx_models/all-MiniLM-L6-v2/onnx.tar.gz: 100%|██████████| 79.3M/79.3M [00:01<00:00, 72.4MiB/s]


CdC de référence stocké: 54 chunks dans ChromaDB
Erreur parsing structure CdC: Expecting value: line 1 column 2 (char 1). Utilisation structure par défaut.
   Structure extraite: 10 sections
3. Analyse détaillée du RFP...
   Projet: AI & ML Transformation Project
   Complexité: 8.0/10
   Exigences: 35 générales, 11 techniques
4. Prise de décision...
   Décision principale: accepte
   Décision alternative: refuse
5. Génération des cahiers des charges...
Génération du CdC (accepte)...
  - 1. CONTEXTE ET PRESENTATION DU PROJET
  - 2. OBJECTIFS ET ENJEUX
  - 3. PERIMETRE ET BESOINS FONCTIONNELS
  - 4. CONTRAINTES TECHNIQUES
  - 5. LIVRABLES ATTENDUS
  - 6. PLANNING ET JALONS
  - 7. BUDGET ET MODALITES FINANCIERES
  - 8. CRITERES D'EVALUATION
  - 9. CONDITIONS CONTRACTUELLES
  - 10. MODALITES DE SUIVI
Génération du CdC (refuse)...
  - 1. CONTEXTE ET PRESENTATION DU PROJET
  - 2. OBJECTIFS ET ENJEUX
  - 3. PERIMETRE ET BESOINS FONCTIONNELS
  - 4. CONTRAINTES TECHNIQUES
  - 5. LIVRABLES ATTEN