# RLHF WordPress Memory Trainer sur Google Colab

Ce notebook permet d'exécuter le trainer RLHF de DeepSeek sur Google Colab avec accélération GPU.

## Installation des dépendances

In [None]:
# Cloner le dépôt
!git clone https://github.com/pascalseppey/renee.git
%cd renee

In [None]:
# Installer les dépendances nécessaires
!pip install openai requests

## Configuration de l'environnement Colab

In [None]:
# Créer les répertoires nécessaires
!mkdir -p ./data/memory
!mkdir -p ./checkpoints

## Configuration pour utiliser PyTorch avec GPU

In [None]:
# Vérifier si le GPU est disponible
import torch
print(f"GPU disponible: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"Nom du GPU: {torch.cuda.get_device_name(0)}")
    print(f"Mémoire totale: {torch.cuda.get_device_properties(0).total_memory / 1e9} GB")

## Préparer les clés API

In [None]:
# Configurer la clé API OpenAI
import os
os.environ["OPENAI_API_KEY"] = "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"
# Remplacez par votre clé API si nécessaire

## Installation d'Ollama pour exécuter DeepSeek localement

Étant donné que Google Colab est un environnement Linux, nous pouvons installer Ollama directement.

In [None]:
# Installer Ollama pour Linux
!curl -fsSL https://ollama.com/install.sh | sh
# Démarrer le service Ollama en arrière-plan
!ollama serve &

In [None]:
# Télécharger le modèle DeepSeek
!ollama pull deepseek:7b-chat

## Exécution de l'entraînement RLHF

In [None]:
# Adapter le script pour Google Colab
!python rlhf_wordpress_memory_trainer.py --num_examples 30 --verbose

## Vérification de la mémoire hiérarchique

In [None]:
# Vérifier le contenu du fichier de mémoire hiérarchique
import json

memory_file = './debug_memory/hierarchical_memory.json'
if os.path.exists(memory_file):
    with open(memory_file, 'r') as f:
        memory_data = json.load(f)

    # Afficher les statistiques
    print("Statistiques de la mémoire:")
    for level, memories in memory_data["memory_levels"].items():
        print(f"  {level}: {len(memories)} entrées")
    print(f"Total: {sum(len(memories) for level, memories in memory_data['memory_levels'].items())} entrées")
    
    # Afficher quelques exemples de mémoire de niveau FACTUAL
    if memory_data["memory_levels"]["FACTUAL"]:
        print("\nExemples de mémoire FACTUAL:")
        for i, memory in enumerate(memory_data["memory_levels"]["FACTUAL"][:3]):
            print(f"\nMémoire #{i+1} (ID: {memory['id']})")
            print(f"Contenu: {memory['content'][:200]}...")
            print(f"Importance: {memory['importance']}")
            print(f"Score: {memory['metadata'].get('score', 'N/A')}")
else:
    print(f"Fichier de mémoire {memory_file} non trouvé")

## Entraînement continu et amélioration du modèle

Vous pouvez exécuter plusieurs itérations d'entraînement pour améliorer continuellement le modèle. Entre chaque itération, le système sauvegardera automatiquement les nouvelles connaissances acquises dans le fichier de mémoire hiérarchique.

In [None]:
# Exécuter plusieurs itérations d'entraînement
for i in range(3):
    print(f"\n*** Itération d'entraînement #{i+1} ***\n")
    !python rlhf_wordpress_memory_trainer.py --num_examples 10 --verbose