# Notebook 00: Configuration de l'Environnement

Bienvenue dans le projet "MAKERS: Multi Agent Knowledge Exploration & Retrieval System" !

Ce notebook vous guidera √† travers les √©tapes initiales de configuration de votre environnement de d√©veloppement.

## √âtapes Pr√©alables

1.  **Installer Conda/Miniconda/Anaconda** : Si vous ne l'avez pas d√©j√†, installez une distribution Conda adapt√©e √† votre syst√®me d'exploitation depuis [Anaconda.com](https://www.anaconda.com/products/distribution) ou [Miniconda](https://docs.conda.io/en/latest/miniconda.html).

2.  **Cr√©er l'Environnement Conda** :
    * Ouvrez un terminal ou une invite de commande Anaconda.
    * Naviguez jusqu'√† la racine de ce projet (`makers/`).
    * Ex√©cutez la commande suivante pour cr√©er l'environnement nomm√© `makers` √† partir du fichier `environment.yml` fourni :
        ```bash
        conda env create -f environment.yml
        ```
    * Si l'environnement existe d√©j√† et que vous souhaitez le mettre √† jour :
        ```bash
        conda env update -f environment.yml --prune
        ```

3.  **Activer l'Environnement Conda** :
    ```bash
    conda activate makers
    ```
    Vous devriez voir `(makers)` au d√©but de votre invite de commande.

4.  **Cr√©er le Fichier `.env`** :
    * √Ä la racine du projet (`makers/`), cr√©ez un fichier nomm√© `.env`.
    * Copiez le contenu de `.env.example` dans votre nouveau fichier `.env`.
    * Remplissez les valeurs des variables d'environnement requises dans votre fichier `.env`, notamment :
        * `OPENAI_API_KEY`
        * `MONGODB_URI` (votre cha√Æne de connexion MongoDB Atlas)
        * `WANDB_API_KEY` (si vous utilisez Weights & Biases)
        * Optionnellement, d'autres cl√©s API (`ANTHROPIC_API_KEY`, `GROQ_API_KEY`, `TAVILY_API_KEY`) si vous pr√©voyez d'utiliser ces services.

## V√©rification de l'Environnement

Les cellules de code ci-dessous vous aideront √† v√©rifier que tout est correctement configur√©.

In [1]:
# Importer les biblioth√®ques n√©cessaires pour ce notebook de configuration
import os
from dotenv import load_dotenv
from pathlib import Path
import importlib

# Tentative d'installation de python-dotenv si non pr√©sent (devrait √™tre dans environment.yml)
try:
    importlib.import_module('dotenv')
except ImportError:
    print("Installation de python-dotenv...")
    import subprocess
    import sys
    subprocess.check_call([sys.executable, "-m", "pip", "install", "python-dotenv"])
    print("python-dotenv install√©. Veuillez relancer ce kernel Jupyter.")
    # sys.exit() # Ou demander √† l'utilisateur de relancer

print("Imports de base r√©ussis.")

Imports de base r√©ussis.


### 1. Chargement des Variables d'Environnement

Cette cellule charge les variables √† partir de votre fichier `.env` et affiche certaines d'entre elles pour v√©rification (les cl√©s API ne seront pas affich√©es int√©gralement).

In [2]:
# Charger les variables du fichier .env situ√© √† la racine du projet
# Le notebook est dans notebooks/, donc ../.env
dotenv_path = Path().resolve().parent / ".env" # Path().resolve() donne le r√©pertoire du notebook

if dotenv_path.exists():
    load_dotenv(dotenv_path=dotenv_path)
    print(f"Variables d'environnement charg√©es depuis : {dotenv_path}")
else:
    print(f"Fichier .env non trouv√© √† l'emplacement attendu : {dotenv_path}")
    print("Veuillez vous assurer d'avoir cr√©√© et configur√© votre fichier .env √† la racine du projet.")

# Importer les settings de notre projet (qui utilisent aussi dotenv)
# Pour que cela fonctionne, assurez-vous que le PYTHONPATH est correct
# ou que vous ex√©cutez Jupyter depuis la racine du projet.
# Si ex√©cut√© depuis le dossier notebooks :
import sys
project_root = Path().resolve().parent
if str(project_root) not in sys.path:
    sys.path.append(str(project_root))

try:
    from config.settings import settings
    print("Configuration du projet (settings.py) charg√©e avec succ√®s.")
except ImportError as e:
    print(f"Erreur lors de l'import de config.settings: {e}")
    print("Assurez-vous que vous ex√©cutez ce notebook depuis le r√©pertoire 'notebooks/' ou que la racine du projet est dans PYTHONPATH.")
    settings = None # Pour √©viter des erreurs plus loin si l'import √©choue

if settings:
    print(f"\n--- V√©rification des Settings Charg√©s ---")
    print(f"Nom du Projet: {settings.PROJECT_NAME}")
    print(f"Mode Debug: {settings.DEBUG}")
    print(f"Environnement Python (PYTHON_ENV): {settings.PYTHON_ENV}")

    print(f"\n--- Configuration des LLMs G√©n√©ratifs ---")
    print(f"Fournisseur LLM G√©n√©ratif par D√©faut: {settings.DEFAULT_LLM_MODEL_PROVIDER}")
    print(f"  Si OpenAI: Mod√®le = {settings.DEFAULT_OPENAI_GENERATIVE_MODEL}")
    print(f"  Si HuggingFace API: Repo ID = {settings.HUGGINGFACE_REPO_ID}")
    print(f"  Si Ollama: Mod√®le G√©n√©ratif = {settings.OLLAMA_GENERATIVE_MODEL_NAME}, Base URL = {settings.OLLAMA_BASE_URL}")
    
    print(f"\n--- Configuration des Embeddings ---")
    print(f"Fournisseur d'Embedding par D√©faut: {settings.DEFAULT_EMBEDDING_PROVIDER}")
    print(f"  Pour OpenAI: Mod√®le = {settings.OPENAI_EMBEDDING_MODEL_NAME}, Dimension = {settings.OPENAI_EMBEDDING_DIMENSION}")
    print(f"  Pour HuggingFace: Mod√®le = {settings.HUGGINGFACE_EMBEDDING_MODEL_NAME}, Dimension = {settings.HUGGINGFACE_EMBEDDING_MODEL_DIMENSION}")
    print(f"  Pour Ollama: Mod√®le = {settings.OLLAMA_EMBEDDING_MODEL_NAME}, Dimension = {settings.OLLAMA_EMBEDDING_MODEL_DIMENSION}, Base URL = {settings.OLLAMA_BASE_URL}")

    print(f"\n--- Cl√©s API (v√©rification de pr√©sence) ---")
    print(f"  OPENAI_API_KEY charg√©e: {bool(settings.OPENAI_API_KEY)}")
    if settings.OPENAI_API_KEY:
        print(f"    (d√©but : {settings.OPENAI_API_KEY[:4]}...)")
    print(f"  HUGGINGFACE_API_KEY charg√©e: {bool(settings.HUGGINGFACE_API_KEY)}")
    if settings.HUGGINGFACE_API_KEY:
        print(f"    (d√©but : {settings.HUGGINGFACE_API_KEY[:6]}...)")
    print(f"  WANDB_API_KEY charg√©e: {bool(settings.WANDB_API_KEY)}")
    if settings.WANDB_API_KEY:
        print(f"    (d√©but : {settings.WANDB_API_KEY[:4]}...)")
    print(f"  ANTHROPIC_API_KEY charg√©e: {bool(settings.ANTHROPIC_API_KEY)}")
    print(f"  GROQ_API_KEY charg√©e: {bool(settings.GROQ_API_KEY)}")
    print(f"  TAVILY_API_KEY charg√©e: {bool(settings.TAVILY_API_KEY)}")

    print(f"\n--- Configuration MongoDB ---")
    print(f"  MONGODB_URI configur√©.")
    print(f"  MONGO_DATABASE_NAME: {settings.MONGO_DATABASE_NAME}")
    print(f"  LANGGRAPH_CHECKPOINTS_COLLECTION: {settings.LANGGRAPH_CHECKPOINTS_COLLECTION}")


    print(f"\n--- Configuration des Donn√©es et Chemins ---")
    print(f"  DATA_DIR: {settings.DATA_DIR}")
    print(f"  Chemin du dataset d'√©valuation RAG (par d√©faut): {settings.EVALUATION_DATASET_PATH}")

    if settings.DATA_DIR.exists():
        print(f"  Le r√©pertoire DATA_DIR ({settings.DATA_DIR}) existe.")
    else:
        print(f"  ATTENTION : Le r√©pertoire DATA_DIR ({settings.DATA_DIR}) n'existe pas. Certains scripts pourraient √©chouer.")
        print(f"  Vous pourriez avoir besoin de le cr√©er manuellement ou il sera cr√©√© par run_ingestion.py (pour ses sous-dossiers).")
    
    # V√©rifier le dataset d'√©valuation si le chemin est d√©fini
    if settings.EVALUATION_DATASET_PATH:
        eval_path = Path(settings.EVALUATION_DATASET_PATH)
        if eval_path.is_file(): # V√©rifier si c'est un fichier
            print(f"  Le fichier de dataset d'√©valuation RAG ({eval_path}) existe.")
        else:
            print(f"  ATTENTION : Le fichier de dataset d'√©valuation RAG ({eval_path}) n'existe PAS ou n'est pas un fichier.")
    else:
        print("  Aucun chemin de dataset d'√©valuation RAG n'est configur√© dans settings.py (EVALUATION_DATASET_PATH est None).")

else:
    print("\nLes settings du projet n'ont pas pu √™tre charg√©s. Veuillez v√©rifier l'import et le fichier .env.")

Fichier .env non trouv√© √† l'emplacement attendu : /home/facetoface/.env
Veuillez vous assurer d'avoir cr√©√© et configur√© votre fichier .env √† la racine du projet.
Configuration du projet (settings.py) charg√©e avec succ√®s.

--- V√©rification des Settings Charg√©s ---
Nom du Projet: MAKERS: Multi Agent Knowledge Exploration & Retrieval System
Mode Debug: False
Environnement Python (PYTHON_ENV): development

--- Configuration des LLMs G√©n√©ratifs ---
Fournisseur LLM G√©n√©ratif par D√©faut: ollama
  Si OpenAI: Mod√®le = gpt-4o
  Si HuggingFace API: Repo ID = mistralai/Mixtral-8x7B-Instruct-v0.1
  Si Ollama: Mod√®le G√©n√©ratif = mistral, Base URL = http://localhost:11434

--- Configuration des Embeddings ---
Fournisseur d'Embedding par D√©faut: ollama
  Pour OpenAI: Mod√®le = text-embedding-3-small, Dimension = 1536
  Pour HuggingFace: Mod√®le = sentence-transformers/all-MiniLM-L6-v2, Dimension = 384
  Pour Ollama: Mod√®le = nomic-embed-text, Dimension = 768, Base URL = http://loc

### 2. Test de Connexion √† MongoDB

Cette cellule tente de se connecter √† votre instance MongoDB en utilisant l'URI fournie dans `.env` et charg√©e via `settings.py`.
Assurez-vous que votre base de donn√©es MongoDB Atlas est accessible (IP autoris√©e, etc.) ou que votre instance locale est en cours d'ex√©cution.

In [3]:
import sys
from pathlib import Path # S'assurer que Path est disponible si ce n'est pas d√©j√† import√© plus haut
from pymongo import MongoClient
from pymongo.errors import ConnectionFailure

# Assurer que 'settings' est charg√© (normalement fait dans une cellule pr√©c√©dente, mais redondance pour la robustesse)
# Si la cellule pr√©c√©dente qui charge 'settings' n'a pas √©t√© ex√©cut√©e, ceci pourrait √©chouer.
# Le notebook `00_setup_environment.ipynb` a une cellule (id `bd1e853f`) qui devrait charger `settings`.

# Tentative de s'assurer que la racine du projet est dans le PYTHONPATH
# Ceci est g√©n√©ralement fait dans les premi√®res cellules du notebook.
# project_root_check = Path().resolve().parent # Path().resolve() donne le r√©pertoire du notebook
# if str(project_root_check) not in sys.path:
#    sys.path.append(str(project_root_check))
#    print(f"Ajout de {project_root_check} au PYTHONPATH (pour cette cellule).")

try:
    # Essayer d'importer settings si ce n'est pas d√©j√† fait ou si le kernel a √©t√© red√©marr√©
    # La cellule `bd1e853f` est suppos√©e avoir d√©j√† fait cela.
    if 'settings' not in globals():
        print("Variable 'settings' non trouv√©e globalement, tentative d'import depuis config.settings...")
        from config.settings import settings
        print("Configuration du projet (settings.py) charg√©e.")
    
    if settings and settings.MONGODB_URI:
        print(f"--- Tentative de connexion √† MongoDB ---")
        print("URI MongoDB configur√©.")
        
        # S'assurer que l'URI n'est pas la valeur par d√©faut non configur√©e
        if "<user>" in settings.MONGODB_URI or "<password>" in settings.MONGODB_URI or "<cluster_url>" in settings.MONGODB_URI:
            print("‚ùå ATTENTION : L'URI MongoDB semble contenir des placeholders (<user>, <password>, <cluster_url>).")
            print("Veuillez v√©rifier que MONGODB_URI est correctement configur√© dans votre fichier .env.")
        else:
            client = None  # Initialiser client √† None
            try:
                # Cr√©er un client MongoDB
                # Augmentation du timeout pour les connexions initiales (surtout pour Atlas gratuit)
                client = MongoClient(settings.MONGODB_URI, serverSelectionTimeoutMS=10000) # 10 secondes timeout
                
                # La commande ping est un moyen simple de v√©rifier la connexion.
                client.admin.command('ping')
                print("‚úÖ Connexion √† MongoDB r√©ussie !")
                
                # Optionnel : Lister les bases de donn√©es pour une v√©rification plus pouss√©e (peut n√©cessiter des droits)
                # try:
                #     db_names = client.list_database_names()
                #     print(f"Bases de donn√©es accessibles : {db_names}")
                # except Exception as e_list_db:
                #     print(f"‚ö†Ô∏è Impossible de lister les bases de donn√©es (droits insuffisants ou autre probl√®me) : {e_list_db}")

            except ConnectionFailure as cf:
                print(f"‚ùå √âCHEC de la connexion √† MongoDB : {cf}")
                print("   Veuillez v√©rifier les points suivants :")
                print("   1. Votre instance MongoDB (locale ou Atlas) est-elle en cours d'ex√©cution et accessible ?")
                print("   2. L'URI de connexion (MONGODB_URI) dans votre fichier .env est-il correct ?")
                print("   3. Si vous utilisez MongoDB Atlas, votre adresse IP actuelle est-elle autoris√©e dans les param√®tres d'acc√®s r√©seau ?")
                print("   4. V√©rifiez les logs de votre serveur MongoDB pour plus de d√©tails.")
            except Exception as e:
                print(f"‚ùå Une erreur inattendue est survenue lors de la tentative de connexion √† MongoDB : {e}")
            finally:
                if client:
                    client.close()
                    print("Connexion MongoDB (temporaire pour test) ferm√©e.")
    else:
        if not settings:
            print("‚ùå Les settings du projet n'ont pas pu √™tre charg√©s. Impossible de tester la connexion MongoDB.")
        elif not settings.MONGODB_URI:
            print("‚ùå MONGODB_URI n'est pas d√©fini dans les settings. Impossible de tester la connexion MongoDB.")
            print("   Veuillez d√©finir MONGODB_URI dans votre fichier .env.")

except NameError:
    print("‚ùå La variable 'settings' n'a pas pu √™tre charg√©e (probablement un probl√®me avec l'import de config.settings).")
    print("   Assurez-vous que la cellule pr√©c√©dente qui charge les settings a √©t√© ex√©cut√©e sans erreur.")
except ImportError:
    print("‚ùå √âchec de l'import de 'config.settings'. Assurez-vous que le PYTHONPATH est correct ou ex√©cutez le notebook depuis la racine du projet ou le dossier 'notebooks'.")

--- Tentative de connexion √† MongoDB ---
URI MongoDB configur√©.
‚úÖ Connexion √† MongoDB r√©ussie !
Connexion MongoDB (temporaire pour test) ferm√©e.


### 3. V√©rification des Biblioth√®ques Principales

Cette cellule tente d'importer les biblioth√®ques majeures utilis√©es dans le projet pour s'assurer qu'elles sont bien install√©es dans l'environnement `makers`.

In [4]:
libraries_to_check = [
    "langchain",
    "langchain_core",
    "langchain_openai",
    "langgraph",
    "llama_index.core",
    "llama_index.vector_stores.mongodb",
    "llama_index.embeddings.openai",
    "pymongo",
    "motor",
    "arxiv",
    "fitz", # PyMuPDF
    "tiktoken",
    "pandas",
    "wandb",
    "pydantic",
    "pydantic_settings"
]

print("--- V√©rification de l'import des biblioth√®ques principales ---")
all_libraries_found = True
for lib_name in libraries_to_check:
    try:
        importlib.import_module(lib_name)
        print(f"‚úÖ {lib_name} : Trouv√© et importable.")
    except ImportError:
        print(f"‚ùå {lib_name} : NON TROUV√â. Veuillez v√©rifier votre environnement Conda ('environment.yml').")
        all_libraries_found = False

if all_libraries_found:
    print("\nüéâ Toutes les biblioth√®ques principales semblent √™tre correctement install√©es !")
else:
    print("\n‚ö†Ô∏è Certaines biblioth√®ques principales sont manquantes. Veuillez v√©rifier l'installation de votre environnement Conda.")

--- V√©rification de l'import des biblioth√®ques principales ---
‚úÖ langchain : Trouv√© et importable.
‚úÖ langchain_core : Trouv√© et importable.
‚úÖ langchain_openai : Trouv√© et importable.
‚úÖ langgraph : Trouv√© et importable.
‚úÖ llama_index.core : Trouv√© et importable.
‚úÖ llama_index.vector_stores.mongodb : Trouv√© et importable.
‚úÖ llama_index.embeddings.openai : Trouv√© et importable.
‚úÖ pymongo : Trouv√© et importable.
‚úÖ motor : Trouv√© et importable.
‚úÖ arxiv : Trouv√© et importable.
‚úÖ fitz : Trouv√© et importable.
‚úÖ tiktoken : Trouv√© et importable.
‚úÖ pandas : Trouv√© et importable.
‚úÖ wandb : Trouv√© et importable.
‚úÖ pydantic : Trouv√© et importable.
‚úÖ pydantic_settings : Trouv√© et importable.

üéâ Toutes les biblioth√®ques principales semblent √™tre correctement install√©es !


## Configuration Termin√©e

Si toutes les cellules ci-dessus se sont ex√©cut√©es sans erreur majeure (en particulier les erreurs d'import ou de connexion), votre environnement est probablement pr√™t pour la suite du projet "MAKERS".

Vous pouvez maintenant passer aux notebooks suivants pour explorer les diff√©rentes parties du syst√®me.