[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github.com/briocheausucre/PIE-SXS02/main/notebook_script.ipynb)

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import os

class LlamaChatbot:
    def __init__(self, model_name, access_token, cache_dir="./llama_local"):
        self.model_name = model_name
        self.access_token = access_token
        self.cache_dir = cache_dir

        # Télécharger et stocker le tokenizer en local
        self.tokenizer = AutoTokenizer.from_pretrained(
            model_name, 
            token=access_token,
            cache_dir=cache_dir
        )
        
        # Télécharger et stocker le modèle en local
        self.model = AutoModelForCausalLM.from_pretrained(
            model_name,
            torch_dtype="auto",
            trust_remote_code=True,
            device_map="auto",
            cache_dir=cache_dir,
            use_auth_token=access_token
        )

        # Créer le pipeline en utilisant le modèle et le tokenizer téléchargés
        self.meta_pipeline = pipeline(
            "text-generation",
            model=self.model,
            tokenizer=self.tokenizer,
            torch_dtype="auto",
            device_map="auto",
            trust_remote_code=True
        )

    def get_completion(self, user_input):
        system_prompt = """
        You are a conservative guy.
        Help as much as you can.
        """
        prompt = f"#### System: {system_prompt}\n#### User: {user_input}\n\n#### Response from llama:"
        try:
            llama_response = self.meta_pipeline(
                prompt,
                max_length=500,
                do_sample=True,
                top_k=10,
                num_return_sequences=1,
                eos_token_id=self.tokenizer.eos_token_id,
                pad_token_id=self.tokenizer.eos_token_id,
                truncation=True  # Ajouté pour éviter l'avertissement
            )
            return llama_response[0]['generated_text']
        except Exception as e:
            print(f"Erreur lors de la génération de texte : {e}")
            return "Désolé, je n'ai pas pu traiter votre demande."

    def chat_loop(self):
        print("Entrez 'exit' pour quitter.")
        while True:
            try:
                prompt = input("\nEntrez votre prompt : ")
                if prompt.lower() == 'exit':
                    print("Chat terminé. Au revoir !")
                    break
                response = self.get_completion(prompt)
                print("\nLlama Response:\n", response)
            except KeyboardInterrupt:
                print("\nChat interrompu par l'utilisateur.")
                break
            except Exception as e:
                print(f"Une erreur est survenue : {e}")

if __name__ == "__main__":
    # Remplace ces valeurs par ton propre modèle et token d'accès
    access_token = "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"
    model_name = "meta-llama/Llama-3.2-3B-Instruct"
    
    # Initialiser le chatbot avec cache en local
    chatbot = LlamaChatbot(model_name, access_token)
    
    # Démarrer la boucle de chat
    chatbot.chat_loop()

In [None]:

# Remplace ces valeurs par ton propre modèle et token d'accès
access_token = "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"
model_name = "meta-llama/Llama-3.2-3B-Instruct"

# Initialiser le chatbot avec cache en local
chatbot = LlamaChatbot(model_name, access_token)

# Démarrer la boucle de chat
chatbot.chat_loop()