# Notebook 00: Configuration de l'Environnement

Bienvenue dans le projet "Cognitive Swarm: Multi-Agent Knowledge Discovery Engine" !

Ce notebook vous guidera √† travers les √©tapes initiales de configuration de votre environnement de d√©veloppement.

## √âtapes Pr√©alables

1.  **Installer Conda/Miniconda/Anaconda** : Si vous ne l'avez pas d√©j√†, installez une distribution Conda adapt√©e √† votre syst√®me d'exploitation depuis [Anaconda.com](https://www.anaconda.com/products/distribution) ou [Miniconda](https://docs.conda.io/en/latest/miniconda.html).

2.  **Cr√©er l'Environnement Conda** :
    * Ouvrez un terminal ou une invite de commande Anaconda.
    * Naviguez jusqu'√† la racine de ce projet (`cognitive-swarm-agents/`).
    * Ex√©cutez la commande suivante pour cr√©er l'environnement nomm√© `cognitive-swarm` √† partir du fichier `environment.yml` fourni :
        ```bash
        conda env create -f environment.yml
        ```
    * Si l'environnement existe d√©j√† et que vous souhaitez le mettre √† jour :
        ```bash
        conda env update -f environment.yml --prune
        ```

3.  **Activer l'Environnement Conda** :
    ```bash
    conda activate cognitive-swarm
    ```
    Vous devriez voir `(cognitive-swarm)` au d√©but de votre invite de commande.

4.  **Cr√©er le Fichier `.env`** :
    * √Ä la racine du projet (`cognitive-swarm-agents/`), cr√©ez un fichier nomm√© `.env`.
    * Copiez le contenu de `.env.example` dans votre nouveau fichier `.env`.
    * Remplissez les valeurs des variables d'environnement requises dans votre fichier `.env`, notamment :
        * `OPENAI_API_KEY`
        * `MONGO_URI` (votre cha√Æne de connexion MongoDB Atlas)
        * `WANDB_API_KEY` (si vous utilisez Weights & Biases)
        * Optionnellement, d'autres cl√©s API (`ANTHROPIC_API_KEY`, `GROQ_API_KEY`, `TAVILY_API_KEY`) si vous pr√©voyez d'utiliser ces services.

## V√©rification de l'Environnement

Les cellules de code ci-dessous vous aideront √† v√©rifier que tout est correctement configur√©.

In [None]:
# Importer les biblioth√®ques n√©cessaires pour ce notebook de configuration
import os
from dotenv import load_dotenv
from pathlib import Path
import importlib

# Tentative d'installation de python-dotenv si non pr√©sent (devrait √™tre dans environment.yml)
try:
    importlib.import_module('dotenv')
except ImportError:
    print("Installation de python-dotenv...")
    import subprocess
    import sys
    subprocess.check_call([sys.executable, "-m", "pip", "install", "python-dotenv"])
    print("python-dotenv install√©. Veuillez relancer ce kernel Jupyter.")
    # sys.exit() # Ou demander √† l'utilisateur de relancer

print("Imports de base r√©ussis.")

### 1. Chargement des Variables d'Environnement

Cette cellule charge les variables √† partir de votre fichier `.env` et affiche certaines d'entre elles pour v√©rification (les cl√©s API ne seront pas affich√©es int√©gralement).

In [None]:
# Charger les variables du fichier .env situ√© √† la racine du projet
# Le notebook est dans notebooks/, donc ../.env
dotenv_path = Path().resolve().parent / ".env" # Path().resolve() donne le r√©pertoire du notebook

if dotenv_path.exists():
    load_dotenv(dotenv_path=dotenv_path)
    print(f"Variables d'environnement charg√©es depuis : {dotenv_path}")
else:
    print(f"Fichier .env non trouv√© √† l'emplacement attendu : {dotenv_path}")
    print("Veuillez vous assurer d'avoir cr√©√© et configur√© votre fichier .env √† la racine du projet.")

# Importer les settings de notre projet (qui utilisent aussi dotenv)
# Pour que cela fonctionne, assurez-vous que le PYTHONPATH est correct
# ou que vous ex√©cutez Jupyter depuis la racine du projet.
# Si ex√©cut√© depuis le dossier notebooks :
import sys
project_root = Path().resolve().parent
if str(project_root) not in sys.path:
    sys.path.append(str(project_root))

try:
    from config.settings import settings
    print("Configuration du projet (settings.py) charg√©e avec succ√®s.")
except ImportError as e:
    print(f"Erreur lors de l'import de config.settings: {e}")
    print("Assurez-vous que vous ex√©cutez ce notebook depuis le r√©pertoire 'notebooks/' ou que la racine du projet est dans PYTHONPATH.")
    settings = None # Pour √©viter des erreurs plus loin si l'import √©choue

if settings:
    print(f"\n--- V√©rification des Settings Charg√©s ---")
    print(f"Nom du Projet: {settings.PROJECT_NAME}")
    print(f"Mode Debug: {settings.DEBUG}")
    print(f"Environnement Python (PYTHON_ENV): {settings.PYTHON_ENV}")

    print(f"\n--- Configuration des LLMs G√©n√©ratifs ---")
    print(f"Fournisseur LLM G√©n√©ratif par D√©faut: {settings.DEFAULT_LLM_MODEL_PROVIDER}")
    print(f"  Si OpenAI: Mod√®le = {settings.DEFAULT_OPENAI_GENERATIVE_MODEL}")
    print(f"  Si HuggingFace API: Repo ID = {settings.HUGGINGFACE_REPO_ID}")
    print(f"  Si Ollama: Mod√®le G√©n√©ratif = {settings.OLLAMA_GENERATIVE_MODEL_NAME}, Base URL = {settings.OLLAMA_BASE_URL}")
    
    print(f"\n--- Configuration des Embeddings ---")
    print(f"Fournisseur d'Embedding par D√©faut: {settings.DEFAULT_EMBEDDING_PROVIDER}")
    print(f"  Pour OpenAI: Mod√®le = {settings.OPENAI_EMBEDDING_MODEL_NAME}, Dimension = {settings.OPENAI_EMBEDDING_DIMENSION}")
    print(f"  Pour HuggingFace: Mod√®le = {settings.HUGGINGFACE_EMBEDDING_MODEL_NAME}, Dimension = {settings.HUGGINGFACE_EMBEDDING_MODEL_DIMENSION}")
    print(f"  Pour Ollama: Mod√®le = {settings.OLLAMA_EMBEDDING_MODEL_NAME}, Dimension = {settings.OLLAMA_EMBEDDING_MODEL_DIMENSION}, Base URL = {settings.OLLAMA_BASE_URL}")

    print(f"\n--- Cl√©s API (v√©rification de pr√©sence) ---")
    print(f"  OPENAI_API_KEY charg√©e: {bool(settings.OPENAI_API_KEY)}")
    if settings.OPENAI_API_KEY:
        print(f"    (d√©but : {settings.OPENAI_API_KEY[:4]}...)")
    print(f"  HUGGINGFACE_API_KEY charg√©e: {bool(settings.HUGGINGFACE_API_KEY)}")
    if settings.HUGGINGFACE_API_KEY:
        print(f"    (d√©but : {settings.HUGGINGFACE_API_KEY[:6]}...)")
    print(f"  WANDB_API_KEY charg√©e: {bool(settings.WANDB_API_KEY)}")
    if settings.WANDB_API_KEY:
        print(f"    (d√©but : {settings.WANDB_API_KEY[:4]}...)")
    print(f"  ANTHROPIC_API_KEY charg√©e: {bool(settings.ANTHROPIC_API_KEY)}")
    print(f"  GROQ_API_KEY charg√©e: {bool(settings.GROQ_API_KEY)}")
    print(f"  TAVILY_API_KEY charg√©e: {bool(settings.TAVILY_API_KEY)}")

    print(f"\n--- Configuration MongoDB ---")
    print(f"  MONGO_URI: {settings.MONGO_URI[:20]}... (tronqu√© pour affichage)")
    print(f"  MONGO_DATABASE_NAME: {settings.MONGO_DATABASE_NAME}")
    print(f"  LANGGRAPH_CHECKPOINTS_COLLECTION: {settings.LANGGRAPH_CHECKPOINTS_COLLECTION}")


    print(f"\n--- Configuration des Donn√©es et Chemins ---")
    print(f"  DATA_DIR: {settings.DATA_DIR}")
    print(f"  Chemin du dataset d'√©valuation RAG (par d√©faut): {settings.EVALUATION_DATASET_PATH}")

    if settings.DATA_DIR.exists():
        print(f"  Le r√©pertoire DATA_DIR ({settings.DATA_DIR}) existe.")
    else:
        print(f"  ATTENTION : Le r√©pertoire DATA_DIR ({settings.DATA_DIR}) n'existe pas. Certains scripts pourraient √©chouer.")
        print(f"  Vous pourriez avoir besoin de le cr√©er manuellement ou il sera cr√©√© par run_ingestion.py (pour ses sous-dossiers).")
    
    # V√©rifier le dataset d'√©valuation si le chemin est d√©fini
    if settings.EVALUATION_DATASET_PATH:
        eval_path = Path(settings.EVALUATION_DATASET_PATH)
        if eval_path.is_file(): # V√©rifier si c'est un fichier
            print(f"  Le fichier de dataset d'√©valuation RAG ({eval_path}) existe.")
        else:
            print(f"  ATTENTION : Le fichier de dataset d'√©valuation RAG ({eval_path}) n'existe PAS ou n'est pas un fichier.")
    else:
        print("  Aucun chemin de dataset d'√©valuation RAG n'est configur√© dans settings.py (EVALUATION_DATASET_PATH est None).")

else:
    print("\nLes settings du projet n'ont pas pu √™tre charg√©s. Veuillez v√©rifier l'import et le fichier .env.")

### 2. Test de Connexion √† MongoDB

Cette cellule tente de se connecter √† votre instance MongoDB en utilisant l'URI fournie dans `.env` et charg√©e via `settings.py`.
Assurez-vous que votre base de donn√©es MongoDB Atlas est accessible (IP autoris√©e, etc.) ou que votre instance locale est en cours d'ex√©cution.

In [None]:
libraries_to_check = [
    "langchain",
    "langchain_core",
    "langchain_openai",
    "langchain_community", # Ajout√© pour √™tre explicite, car HuggingFaceEmbeddings et OllamaEmbeddings en viennent
    "langgraph",
    "llama_index.core",
    "llama_index.vector_stores.mongodb",
    "llama_index.embeddings.openai",
    "llama_index.embeddings.huggingface", # <<< NOUVEAU CHECK
    "llama_index.embeddings.ollama",      # <<< NOUVEAU CHECK
    "pymongo",
    "motor",
    "arxiv",
    "fitz", # PyMuPDF
    "tiktoken",
    "pandas",
    "wandb",
    "crewai", # Ajout√© pour √™tre explicite
    "pydantic",
    "pydantic_settings",
    "fastapi", # Ajout√© pour √™tre explicite
    "uvicorn"  # Ajout√© pour √™tre explicite
]

print("--- V√©rification de l'import des biblioth√®ques principales ---")
all_libraries_found = True
for lib_name in libraries_to_check:
    try:
        importlib.import_module(lib_name)
        print(f"‚úÖ {lib_name} : Trouv√© et importable.")
    except ImportError:
        print(f"‚ùå {lib_name} : NON TROUV√â. Veuillez v√©rifier votre environnement Conda ('environment.yml') et vos requirements pip.")
        all_libraries_found = False

if all_libraries_found:
    print("\nüéâ Toutes les biblioth√®ques principales list√©es semblent √™tre correctement install√©es !")
else:
    print("\n‚ö†Ô∏è Certaines biblioth√®ques principales list√©es sont manquantes. Veuillez v√©rifier l'installation de votre environnement Conda/pip.")

### 3. V√©rification des Biblioth√®ques Principales

Cette cellule tente d'importer les biblioth√®ques majeures utilis√©es dans le projet pour s'assurer qu'elles sont bien install√©es dans l'environnement `cognitive-swarm`.

In [None]:
libraries_to_check = [
    "langchain",
    "langchain_core",
    "langchain_openai",
    "langgraph",
    "llama_index.core",
    "llama_index.vector_stores.mongodb",
    "llama_index.embeddings.openai",
    "pymongo",
    "motor",
    "arxiv",
    "fitz", # PyMuPDF
    "tiktoken",
    "pandas",
    "wandb",
    "pydantic",
    "pydantic_settings"
]

print("--- V√©rification de l'import des biblioth√®ques principales ---")
all_libraries_found = True
for lib_name in libraries_to_check:
    try:
        importlib.import_module(lib_name)
        print(f"‚úÖ {lib_name} : Trouv√© et importable.")
    except ImportError:
        print(f"‚ùå {lib_name} : NON TROUV√â. Veuillez v√©rifier votre environnement Conda ('environment.yml').")
        all_libraries_found = False

if all_libraries_found:
    print("\nüéâ Toutes les biblioth√®ques principales semblent √™tre correctement install√©es !")
else:
    print("\n‚ö†Ô∏è Certaines biblioth√®ques principales sont manquantes. Veuillez v√©rifier l'installation de votre environnement Conda.")

## Configuration Termin√©e

Si toutes les cellules ci-dessus se sont ex√©cut√©es sans erreur majeure (en particulier les erreurs d'import ou de connexion), votre environnement est probablement pr√™t pour la suite du projet "Cognitive Swarm".

Vous pouvez maintenant passer aux notebooks suivants pour explorer les diff√©rentes parties du syst√®me.