# Fichier de test et d'installation du modele Solon-embeddings-large-0.1
lien : https://huggingface.co/OrdalieTech/Solon-embeddings-large-0.1

---
## Imports et initialisations

In [1]:
import mlflow
import mlflow.pytorch
import numpy as np
import torch
import os
import logging
import boto3 # <-------------------- Dépendance requise par MLFlow pour pouvoir utiliser un service de stockage S3 (Minio)
import mlflow.pyfunc

from transformers import AutoTokenizer, AutoModel
from dotenv import load_dotenv
from minio import Minio, S3Error
from sklearn.metrics.pairwise import cosine_similarity
from mlflow.models import infer_signature, validate_serving_input, convert_input_example_to_serving_input
from mlflow.tracking import MlflowClient

# Demande peut-être de la configuration après un pull
MINIO_URL="localhost:9000"
MINIO_ACCESS_KEY="minioadmin"
MINIO_SECRET_KEY="minioadmin"
MLFLOW_TRACKING_URI="http://localhost:5000"
MLFLOW_DEFAULT_ARTIFACT_ROOT="s3://mlflow/artifacts"
MLFLOW_S3_ENDPOINT_URL="http://localhost:9000"
AWS_ACCESS_KEY_ID="minioadmin"
AWS_SECRET_ACCESS_KEY="minioadmin"

# Initialiser le client MinIO
minio_client = Minio(
    MINIO_URL,
    access_key=MINIO_ACCESS_KEY,
    secret_key=MINIO_SECRET_KEY,
    secure=False  # <-------------------- mettre à True pour utiliser HTTPS
)

# Nom du bucket (dossier) pour les artefacts MLflow
bucket_name = 'mlflow'

# Créer le bucket s'il n'existe pas
try:
    if not minio_client.bucket_exists(bucket_name):
        minio_client.make_bucket(bucket_name)
        print(f"Bucket '{bucket_name}' créé avec succès.")
    else:
        print(f"Bucket '{bucket_name}' existe déjà.")
except S3Error as err:
    print(f"Erreur lors de la création du bucket: {err}")

# Vérifiez les variables d'environnement pour MinIO
print("MinIO URL:", MLFLOW_S3_ENDPOINT_URL)
print("AWS Access Key:", AWS_ACCESS_KEY_ID)


# Définir l'URI de suivi MLflow pour pointer vers votre instance locale
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
mlflow.set_experiment("Solon-embeddings")

Bucket 'mlflow' existe déjà.
MinIO URL: http://localhost:9000
AWS Access Key: minioadmin


<Experiment: artifact_location='s3://mlflow/artifacts/1', creation_time=1723348421747, experiment_id='1', last_update_time=1723348421747, lifecycle_stage='active', name='Solon-embeddings', tags={}>

---
## Téléchargement du modèle 
Télécharge et créer un dossier "models" dans "install_models" avec "special_tokens_map.json" | "tokenizer_config.json" | "tokenizer.json"
```
app
|_install_models
|__models
|___special_tokens_map.json
|___tokenizer_config.json
|___tokenizer.json
```

In [2]:
# Charger le tokenizer
tokenizer = AutoTokenizer.from_pretrained("OrdalieTech/Solon-embeddings-large-0.1")

# Charger le modèle
model = AutoModel.from_pretrained("OrdalieTech/Solon-embeddings-large-0.1")

---
## Test du modèle avec la partie locale

In [3]:
def extract_features(text):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
    with torch.no_grad():
        outputs = model(**inputs)
    return outputs.last_hidden_state.mean(dim=1).numpy()

text = ["Il fait beau", "Il est beau", "Il va faire beau", "Il a fait beau", "C'est très beau"]
features = extract_features(text)
print(features)

[[ 0.96402365  1.4223621   1.0408337  ...  0.1549829  -0.38752386
   0.11577153]
 [ 0.36774197  0.13094549  0.96774954 ... -0.9510918   0.21017613
   0.7587245 ]
 [ 0.0997332   1.0194489   0.86829764 ...  0.72202337  0.20158945
   0.16800208]
 [ 0.9345613   0.41134351  0.66911495 ...  0.17017119  0.39119667
   0.18250458]
 [ 1.1195613   1.6284131  -0.20209625 ... -1.39997     0.80081695
   1.1151884 ]]


---
## Encapsulation du modèle et customisation de predict
Fait correspondre le modèle a une PyFunc car utilisé predict pour un modèle sauvegarder sur mlflow avec pytorch pose problème aux inputs qui ne correspondent pas, predict attend un float de base et le modèle lui a besoin d'un string.

### Enregistrement sur le server MLFlow

In [4]:
class PyTorchModelWrapper(mlflow.pyfunc.PythonModel):
    def load_context(self, context):
        # Charger le modèle PyTorch et le tokenizer
        self.model = model  # Remplacez par le chemin si vous souhaitez le charger depuis un fichier
        self.tokenizer = tokenizer  # Idem pour le tokenizer

    def predict(self, context, model_input):
        # Tokenization des inputs
        inputs = self.tokenizer(model_input, return_tensors="pt", padding=True, truncation=True)
        
        # Désactiver le gradient pour l'inférence
        with torch.no_grad():
            outputs = self.model(**inputs)
        
        # Retourner la moyenne des embeddings (ou toute autre opération que vous souhaitez effectuer)
        return outputs.last_hidden_state.mean(dim=1).numpy()

# Enregistrement du modèle PyFunc encapsulé sans exemple d'entrée
with mlflow.start_run():
    mlflow.pyfunc.log_model(
        artifact_path="solon-embeddings-large-model",
        python_model=PyTorchModelWrapper(),
        conda_env=mlflow.pytorch.get_default_conda_env(),
        registered_model_name="solon-embeddings-large-model",
    )
    mlflow.log_param("model_name", "OrdalieTech/Solon-embeddings-large-0.1")
    mlflow.log_param("source", "Script d'installation Solon-embeddings-large-0.1.ipynb")
    mlflow.log_param("model_version", "none")
    mlflow.log_metric("mean_cos_similarity", 0)
    mlflow.log_metric("cos_similarity_top_1", 0)
    mlflow.log_metric("cos_similarity_top_2", 0)
    mlflow.log_metric("cos_similarity_top_3", 0)
    mlflow.log_metric("cos_similarity_top_4", 0)
    mlflow.log_metric("cos_similarity_top_5", 0)

Registered model 'solon-embeddings-large-model' already exists. Creating a new version of this model...
2024/08/12 17:49:36 INFO mlflow.store.model_registry.abstract_store: Waiting up to 300 seconds for model version to finish creation. Model name: solon-embeddings-large-model, version 2
Created version '2' of model 'solon-embeddings-large-model'.
2024/08/12 17:49:36 INFO mlflow.tracking._tracking_service.client: 🏃 View run nimble-fawn-832 at: http://localhost:5000/#/experiments/1/runs/49b763db850845ac8a557162e01db1a6.
2024/08/12 17:49:36 INFO mlflow.tracking._tracking_service.client: 🧪 View experiment at: http://localhost:5000/#/experiments/1.


### Installation en local ou sur un stockage
ATTENTION installe le modèle ou sur un stockage type blob etc

In [5]:
"""mlflow.pyfunc.save_model(
    path="models/solon-embeddings-large-model",
    python_model=PyTorchModelWrapper(),
    conda_env=mlflow.pytorch.get_default_conda_env(),
    signature=signature,
    input_example=input_example
)"""

'mlflow.pyfunc.save_model(\n    path="models/solon-embeddings-large-model",\n    python_model=PyTorchModelWrapper(),\n    conda_env=mlflow.pytorch.get_default_conda_env(),\n    signature=signature,\n    input_example=input_example\n)'

---
## Test du modèle via MLFlow

### Récupération du dernier modèle

In [6]:
# Nom du modèle enregistré
model_name = "solon-embeddings-large-model"

# Créer une instance de MlflowClient
client = MlflowClient()

# Récupérer toutes les versions du modèle
model_versions = client.get_latest_versions(model_name, stages=["None", "Staging", "Production"])

# Filtrer la dernière version du modèle en fonction de l'ordre de version
latest_version = max([int(version.version) for version in model_versions])

print(f"La dernière version du modèle {model_name} est : {latest_version}")

La dernière version du modèle solon-embeddings-large-model est : 2


  model_versions = client.get_latest_versions(model_name, stages=["None", "Staging", "Production"])


### Test du dernier modele enregistrer via MLFlow

In [7]:

# Charger le modèle depuis MLflow
model_uri = f"models:/solon-embeddings-large-model/{latest_version}"  # Pour l'utilisation du modèle d'un run c'est run:/<id_run>/ 
loaded_model = mlflow.pyfunc.load_model(model_uri)

# Exemple de question et de réponses
question = ["Il fait beau"]
responses = ["Il fait beau", "Il est beau", "Il va faire beau", "Il a fait beau", "C'est très beau"]
response_1 = ["Il fait beau"]
response_2 = ["Il est beau"]
response_3 = ["Il va faire beau"]
response_4 = ["Il a fait beau"]
response_5 = ["C'est très beau"]

# Extraire les embeddings
question_embedding = loaded_model.predict(question)
responses_embeddings = loaded_model.predict(responses)
response_1_embedding = loaded_model.predict(response_1)
response_2_embedding = loaded_model.predict(response_2)
response_3_embedding = loaded_model.predict(response_3)
response_4_embedding = loaded_model.predict(response_4)
response_5_embedding = loaded_model.predict(response_5)

# Calculer la similarité cosinus entre la question et les réponses
cos_similarities = cosine_similarity(question_embedding, responses_embeddings)

# Exemple de valeur moyenne de la similarité cosinus (pour une paire)
mean_cos_similarity = np.mean(cos_similarities)

cos_similaritie_1 = cosine_similarity(question_embedding, response_1_embedding)
cos_similaritie_2 = cosine_similarity(question_embedding, response_2_embedding)
cos_similaritie_3 = cosine_similarity(question_embedding, response_3_embedding)
cos_similaritie_4 = cosine_similarity(question_embedding, response_4_embedding)
cos_similaritie_5 = cosine_similarity(question_embedding, response_5_embedding)

with mlflow.start_run() as run:
    # Enregistrer les paramètres et les métriques
    mlflow.log_param("model_name", "OrdalieTech/Solon-embeddings-large-0.1")
    mlflow.log_param("source", "Script de test Solon-embeddings-large-0.1.ipynb")
    mlflow.log_param("model_version", f"solon-embeddings-large-model v{latest_version}")
    mlflow.log_metric("mean_cos_similarity", mean_cos_similarity)
    mlflow.log_metric("cos_similarity_top_1", cos_similaritie_1)
    mlflow.log_metric("cos_similarity_top_2", cos_similaritie_2)
    mlflow.log_metric("cos_similarity_top_3", cos_similaritie_3)
    mlflow.log_metric("cos_similarity_top_4", cos_similaritie_4)
    mlflow.log_metric("cos_similarity_top_5", cos_similaritie_5)

Downloading artifacts:   0%|          | 0/5 [00:00<?, ?it/s]

2024/08/12 17:49:44 INFO mlflow.tracking._tracking_service.client: 🏃 View run serious-moth-891 at: http://localhost:5000/#/experiments/1/runs/2f48452a4dbd418e8040da14c2dd6b71.
2024/08/12 17:49:44 INFO mlflow.tracking._tracking_service.client: 🧪 View experiment at: http://localhost:5000/#/experiments/1.
