# Transformation from Torch Script to Hugging face format
- Tokenizer: Stelle sicher, dass du den richtigen Tokenizer für dein Modell verwendest. Dies ist oft der gleiche, der beim Training des Modells verwendet wurde.

In [None]:
import torch

# Lade dein Torch Script-Modell
modelloc = "/home/thsch026/masterarbeit/models/generated/awq/quant"
model = torch.jit.load("Meta-Llama-3-8B-Instruct-HF-w8-g128-awq-v2.pt")

Erstelle eine Wrapper-Klasse für das Modell:
Um das Modell in lm_eval verwenden zu können, musst du eine Wrapper-Klasse erstellen, die das Modell in das erforderliche Format bringt. Hier ist ein Beispiel für eine solche Wrapper-Klasse:

In [None]:
from transformers import AutoTokenizer

class TorchScriptModelWrapper:
    def __init__(self, model_path, tokenizer_name):
        self.model = torch.jit.load(model_path)
        self.tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
    
    def __call__(self, inputs):
        # Tokenisiere die Eingaben
        inputs = self.tokenizer(inputs, return_tensors="pt")
        # Führe eine Vorwärtsausführung des Modells durch
        with torch.no_grad():
            outputs = self.model(**inputs)
        return outputs


In [None]:
Lade den Wrapper in lm_eval:
Passe das lm_eval-Skript an, um dein benutzerdefiniertes Modell zu verwenden. Hier ist ein Beispiel, wie du das machen könntest:

In [None]:
from lm_eval.tasks import get_task
from lm_eval.evaluator import simple_evaluate

# Dein benutzerdefiniertes Modell und Tokenizer
model_wrapper = TorchScriptModelWrapper("path_to_your_model.pt", "tokenizer_name")

# Wähle die Aufgabe, die du bewerten möchtest
task = get_task("task_name")

# Bewerte das Modell mit der Aufgabe
results = simple_evaluate(
    model=model_wrapper,
    tasks=[task],
    num_fewshot=0  # Anzahl der Beispiele, die für Few-Shot-Lernen verwendet werden sollen
)

print(results)

# Einladen als .pt und speichern in HF

In [None]:
import torch

# Lade das Torch Script-Modell
torch_script_model = torch.jit.load("path_to_your_model.pt")


In [None]:
import torch.nn as nn
from transformers import AutoConfig, AutoModelForSequenceClassification

class TorchScriptToPyTorchModel(nn.Module):
    def __init__(self, torch_script_model):
        super(TorchScriptToPyTorchModel, self).__init__()
        self.torch_script_model = torch_script_model

    def forward(self, input_ids, attention_mask=None, token_type_ids=None):
        # Passe die Eingaben an, falls nötig
        return self.torch_script_model(input_ids, attention_mask, token_type_ids)

# Initialisiere das Wrapper-Modell
model_wrapper = TorchScriptToPyTorchModel(torch_script_model)


In [None]:
# Beispiel für eine Konfiguration
config = AutoConfig.from_pretrained("bert-base-uncased")

# Initialisiere das Modell mit der Wrapper-Klasse
model = AutoModelForSequenceClassification.from_config(config)
model.classifier = model_wrapper  # Ersetze die Klassifizierungs-Schicht durch das Torch Script-Modell


In [None]:
from transformers import AutoTokenizer

# Speichere das Modell
model.save_pretrained("path_to_save_model")

# Speichere den Tokenizer (falls notwendig)
tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
tokenizer.save_pretrained("path_to_save_model")


In [None]:
## Nochmal als kompletter code

In [None]:
import torch
import torch.nn as nn
from transformers import AutoConfig, AutoModelForSequenceClassification, AutoTokenizer

# Schritt 1: Lade das Torch Script-Modell
torch_script_model = torch.jit.load("path_to_your_model.pt")

# Schritt 2: Erstelle ein Wrapper-Modell
class TorchScriptToPyTorchModel(nn.Module):
    def __init__(self, torch_script_model):
        super(TorchScriptToPyTorchModel, self).__init__()
        self.torch_script_model = torch_script_model

    def forward(self, input_ids, attention_mask=None, token_type_ids=None):
        # Passe die Eingaben an, falls nötig
        return self.torch_script_model(input_ids, attention_mask, token_type_ids)

# Initialisiere das Wrapper-Modell
model_wrapper = TorchScriptToPyTorchModel(torch_script_model)

# Schritt 3: Erstelle eine Hugging Face-Transformers Modell-Instanz
config = AutoConfig.from_pretrained("bert-base-uncased")
model = AutoModelForSequenceClassification.from_config(config)
model.classifier = model_wrapper  # Ersetze die Klassifizierungs-Schicht durch das Torch Script-Modell

# Schritt 4: Speichere das Modell im Hugging Face-Format
model.save_pretrained("path_to_save_model")

# Speichere den Tokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
tokenizer.save_pretrained("path_to_save_model")
