In [1]:
#!pip install transformers
#!pip install datasets


In [2]:
#!pip install seqeval

# Skript1: Model Finetuning für Text-Klassifizierung mit germaneval2019 Task2 -Subtask1

Dieses Notebook beschreibt das Training eines Text-Klassifizierungsmodells für den Datensatz GermEval 2019 Task2 -Subtask1.
Es wird ein BERT - Modell mit der nativen Hugging Face Transformer Bibliothek trainiert. Das Training erfolgt nach dem gleichen Split wie es der Shared Task 2019 vorgab.

In [3]:
# Importieren der Hugging Face Datesets Bibliothek
import datasets

In [4]:
# Parameter für die Scriptsteuerung:
# die Task für die das Modell trainiert werden soll
task = "task1"
# das zu verwendende pretrained Transformer Modell
model_checkpoint = "deepset/gbert-base"
# die Trainingsbatchsize
batch_size = 4

## Preprocessing des Datasets
Zunächst müssen die Daten aus dem GermEval2019 Datensatz vorverarbeitet werden. Dazu werden diese in einen `Pandas DataFrames` umgewandelt.

In [5]:
import pandas as pd

Als ersten werden mit Hilfe der `read_csv()` Methode die Daten für das Trainings- und das Valiederungsset zu einem `DataFrame` zusammengefügt. Dabei werden die Werte in den Labelspalten in numerische Kategorienencodings umgewandelt.

In [6]:
data1=pd.read_csv("../datasets/germeval2019/train_valid/germeval2018.test_.txt",delimiter="\t", header=None,quoting=3)
data2=pd.read_csv("../datasets/germeval2019/train_valid/germeval2018.training.txt",delimiter="\t", header=None,quoting=3)
data3=pd.read_csv("../datasets/germeval2019/train_valid/germeval2019.training_subtask1_2_korrigiert.txt",delimiter="\t", header=None,quoting=3)
data_all = data1.append([data2,data3])
data_all.columns = ["text","task1_label","task2_label"]
# Umwandlung der Label in die jeweiligen numerischen Encodings
data_all.task1_label = data_all.task1_label.astype('category').cat.codes
data_all.task2_label = data_all.task2_label.astype('category').cat.codes
data_all

Unnamed: 0,text,task1_label,task2_label
0,"Meine Mutter hat mir erzählt, dass mein Vater ...",1,2
1,@Tom174_ @davidbest95 Meine Reaktion; |LBR| Ni...,1,2
2,"#Merkel rollt dem Emir von #Katar, der islamis...",1,2
3,„Merle ist kein junges unschuldiges Mädchen“ K...,1,2
4,@umweltundaktiv Asylantenflut bringt eben nur ...,0,0
...,...,...,...
3990,250 Menschen auf der Demonstration gegen das D...,1,2
3991,Erneut Massaker an Kurdische ZivilistInnen dur...,1,2
3992,Hunderte Refugees haben die Grenze zur spanisc...,1,2
3993,Heute ab 17:00 Uhr an der Alten Oper FFM: Kund...,1,2


Für das Testdataset wird ebenfalls ein `DataFrame` erzeugt und die Label encodiert.

In [7]:
data_test = pd.read_csv("../datasets/germeval2019/test/germeval2019GoldLabelsSubtask1_2.txt",delimiter="\t", header=None, quoting=3)
data_test.columns = ["text","task1_label","task2_label"]
data_test.task1_label = data_test.task1_label.astype('category').cat.codes
data_test.task2_label = data_test.task2_label.astype('category').cat.codes
data_test

Unnamed: 0,text,task1_label,task2_label
0,@JanZimmHHB @mopo Komisch das die Realitätsver...,0,1
1,@faznet @Gruene_Europa @SPDEuropa @CDU CDU ste...,0,0
2,"@DLFNachrichten Die Gesichter, Namen, Religion...",1,2
3,@welt Wie verwirrt muss man sein um sich zu we...,0,0
4,@hacker_1991 @torben_braga Weil die AfD den Fe...,0,0
...,...,...,...
3026,Es fand aber nie eine Emanzipierungs-Phase der...,1,2
3027,Um es klar zu stellen: Ich will hier kein Whit...,1,2
3028,Und dann habe ich da noch die McArthur-Briefe ...,1,2
3029,al sehen wer der Ersatzmann wird. Hier könnte ...,1,2


Anschließend kann aus den `Pandas DataFrames` ein `Hugging Face Dataset` generiert werden. Hierfür wird zunächst ein `Feature` Dictionary erzeugt. Dieses enthält Typisierungen für die Features des Datasets. So werden die Features `task1_label` und `task2_label` jeweils als `ClassLabel` typisiert und das `text` Feature wird als String-Value deklariert.

In [8]:
# Erzeugen eines DataSet Objektes mit allen Daten
features = datasets.Features({
  #'__index_level_0__': datasets.Value(dtype='int32', id=None),
  'task1_label': datasets.ClassLabel(num_classes=2, names=['OFFENSE', 'OTHER'], names_file=None, id=None),
  'task2_label': datasets.ClassLabel(num_classes=4, names=['ABUSE', 'INSULT', 'OTHER', 'PROFANITY'], names_file=None, id=None),
  'text': datasets.Value(dtype='string', id=None)
})
dataset = datasets.Dataset.from_pandas(data_all,features=features)
dataset_test = datasets.Dataset.from_pandas(data_test,features=features)

Beispielausgabe der Dataset Objekte:

In [9]:
dataset_test, dataset

(Dataset({
     features: ['task1_label', 'task2_label', 'text'],
     num_rows: 3031
 }),
 Dataset({
     features: ['task1_label', 'task2_label', 'text'],
     num_rows: 12536
 }))

#### Split des Datasets

Mithilfe der der Dataset Objekte wird anschließend der Trainings- und Validierungssplit durchgeführt. Die gewählte größe des Validierungsset beträgt 20% des Datasets:

In [10]:
# Aufsplitten des Trainingssets in 80/20 (Training/Validation)Split
dataset_train_valid = dataset.train_test_split(test_size=0.2, seed=42)

Die `train_test_split()` Methode gibt ein `DatasetDict` Objekt zurück. Dies ist ein Dictionary mit einem Trainings- und einem Testdataset. Das Testdataset stellt in diesem Fall das Validierungsdataset dar.

In [11]:
dataset_train_valid

DatasetDict({
    train: Dataset({
        features: ['task1_label', 'task2_label', 'text'],
        num_rows: 10028
    })
    test: Dataset({
        features: ['task1_label', 'task2_label', 'text'],
        num_rows: 2508
    })
})

Um ein gemeinsames Dataset Objekt zu erhalten, werden die Datasets anschließend zusammengefügt und entsprechend des Splits benannt:

In [12]:
# Zusammenfügen aller DataSet-Objekte zu einem gemeinsamen DataSet mit benannten Splits
dataset_train_valid_test = datasets.DatasetDict({"train": dataset_train_valid["train"],
                                                 "valid": dataset_train_valid["test"],
                                                 "test": dataset_test})

Aufbau des gesamten Dataset Dictionary:

In [13]:
dataset_train_valid_test

DatasetDict({
    train: Dataset({
        features: ['task1_label', 'task2_label', 'text'],
        num_rows: 10028
    })
    valid: Dataset({
        features: ['task1_label', 'task2_label', 'text'],
        num_rows: 2508
    })
    test: Dataset({
        features: ['task1_label', 'task2_label', 'text'],
        num_rows: 3031
    })
})

Funktion für die Ausgabe von Beispieldaten aus dem Dataset:

In [14]:
# Quelle in Anlehnung an: https://colab.research.google.com/github/huggingface/notebooks/blob/master/examples/text_classification.ipynb#scrollTo=X6HrpprwIrIz
import random
import pandas as pd
from IPython.display import display, HTML


def show_random_elements(dataset, num_examples=10,seed=None):
    assert num_examples <= len(dataset), "Can't pick more elements than there are in the dataset."
    picks = []
    random.seed(seed)
    for _ in range(num_examples):
        pick = random.randint(0, len(dataset)-1)
        while pick in picks:
            random.seed(seed)
            pick = random.randint(0, len(dataset)-1)
        picks.append(pick)
    
    df = pd.DataFrame(dataset[picks])
    for column, typ in dataset.features.items():
        if isinstance(typ, datasets.ClassLabel):
            df[column] = df[column].transform(lambda i: typ.names[i])
    display(HTML(df.to_html()))

Ausgabe von Beispieldaten aus dem Trainingsdataset:

In [15]:
show_random_elements(dataset_train_valid_test["train"],seed=42)

Unnamed: 0,task1_label,task2_label,text
0,OTHER,OTHER,@AfDimBundestag @Heinrich_Krug Gehört den zu einer Integration nicht auch die Bräuche des jeweiligen zu akzeptieren..? |LBR| Und wer das nicht tut welchen Sinn gibt es noch denjenigen unter uns zu wissen..? |LBR| Ich bin für Weihnachtsbäume statt Moscheen
1,OTHER,OTHER,immerhin entstehen auch neue räume für die StArTuP sZEnE *-*
2,OFFENSE,INSULT,@FOJ45360104 @Papier451 Bei einigen Promis zeigt sich das sie entweder zu viele Schnaps Pralinen gefuttert haben oder was wahrscheinlicher ist eine Gehirn Prothese tragen.
3,OFFENSE,ABUSE,"Das lustige am Feminismus ist ja, dass dieser alle negativen Klischees über Frauen bestätigt ☺"
4,OTHER,OTHER,@mountainman1977 @StapelChipsYT Au ja. Ich stell Dir Dein Zeugnis aus :)
5,OFFENSE,INSULT,Diese Göring ist die schlimmste Lügen-Erzählerin Deutschlands. Schlimm das DIE in die Regierung kommt. #illner
6,OTHER,OTHER,Martin Schulz ist Kanzlerkandidat der SPD ohne Schulabschluss. Er ist |LBR| 2 x sitzen geblieben. Ist das Ihre Führungsspitze?
7,OFFENSE,ABUSE,@prussian_pride Er ist nur noch ein Mettwoch vom Herzkasper entfernt
8,OFFENSE,ABUSE,"Freiheit und Vielfalt sind immer dann gewährleistet, wenn alle Frau_innen Kopftuch tragen und jeder dieselbe linke Meinung hat."
9,OTHER,OTHER,@SPDJevenstedt @WilmsVal @Ralf_Stegner 10 Minuten spricht jemand #ProGoKo. 10 Minuten spricht jemand #NoGroKo. Reihefolge wird ausgelost. Und dann dürfen sich alle zu Wort melden. @Ralf_Stegner oder die Redner.innen antworten dann auf Fragen nach 4-5 Wortmeldungen.


# Preprocessing der Daten

Beschaffen des zugehörigen Tokenizers zum ausgewählten Modell:

In [16]:
from transformers import AutoTokenizer
    
tokenizer = AutoTokenizer.from_pretrained(model_checkpoint, use_fast=True)

Der Tokenizer kann direkt genutzt werden, um eine Inputsequenz zu tokenisieren. Dabei erhält man ein Dictionary mit Mappings zu den input_ids, token_type_ids und eine attention_mask. Die input_id ist die Identifikation des jeweiligen Tokens im Vokabluar des Modells. Token_type_ids markieren Tokens in Seq2Seq Tasks und geben dem Modell Informationen darüber, zu welchem Teil einer zweiteiligen Eingabesequenz ein Token gehört. Die attention_mask teilt dem Modell mit, für welche Token die Attention berechnet werden soll. Ist eine Eingabesequenz z. B. sehr kurz im Gegensatz zu den anderen, dann wird diese per Padding auf die gleiche Länge gebracht. Die attention_mask verhindert anschließend, dass die Attention für diese Padding Token berechnet wird.

In [17]:
tokenizer("Es ist natürlich viel einfacher auch weiterhin jeden Widerstand zu skandalisieren als den Konzernen die Stirn zu bieten. Ist einfach gemütlicher, als die eigenen Fehler zu reflektieren.")

{'input_ids': [102, 479, 215, 3392, 827, 12822, 313, 3750, 2809, 8550, 205, 11473, 11545, 7232, 276, 190, 8448, 106, 128, 21429, 205, 3915, 566, 2302, 1523, 28283, 105, 818, 276, 128, 2233, 5099, 205, 21713, 11044, 566, 103], 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}

Um die Daten der Datasets vorzuverarbeiten wird die folgende Methode definiert\
In der Methode werden zunächst die Werte des `text` Features mit dem Tokenizer des Modells tokeniesiert und anschließend ein Label Attribut mit dem Wert der aktuellen Task eingefügt. Die Methode gibt Ausgabe des Tokenizers anschließend zurück.

In [18]:
def preprocess_data(data):
  tokenized_inputs = tokenizer(data['text'], truncation=True)
  if task.endswith("1"):
    label = data["task1_label"]
  else:
    label = data["task2_label"]
  tokenized_inputs["label"] = label
  return tokenized_inputs

Die Funktion kann beliebig viele Datensätze verarbeiten. Werden mehrere übergeben dann gibt der Tokenizer eine Liste zurück:

In [19]:
preprocess_data(dataset_train_valid_test["train"][:1])

{'input_ids': [[102, 17329, 3505, 2354, 17338, 105, 5561, 17329, 2812, 1662, 3225, 2641, 700, 262, 1743, 319, 1571, 335, 840, 5421, 1110, 778, 1421, 2361, 255, 268, 4604, 7971, 2856, 128, 10037, 153, 125, 23699, 450, 8433, 341, 128, 816, 22398, 3460, 103]], 'token_type_ids': [[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]], 'attention_mask': [[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]], 'label': [0]}

Anwendung der `preprocess_data` Funktion auf alle Teildatensätze im DataSet-Objekt `dataset_train_valid_test` mithilfe von `map`
 - `batched=True` beschleunigt die Verarbeitung des FastTokenizers

In [20]:
dataset_preprocessed = dataset_train_valid_test.map(preprocess_data,batched=True)

HBox(children=(FloatProgress(value=0.0, max=11.0), HTML(value='')))




HBox(children=(FloatProgress(value=0.0, max=3.0), HTML(value='')))




HBox(children=(FloatProgress(value=0.0, max=4.0), HTML(value='')))




Durch das Preprocessing werden die Ausgaben des Tokenizers als Features des DataSets ergänzt.\
In der folgenden Ausgaben sieht man, dass nun die attention_mask, die input_ids, die label und die token_type_ids als Features ergänzt wurden.

In [21]:
dataset_preprocessed["train"]

Dataset({
    features: ['attention_mask', 'input_ids', 'label', 'task1_label', 'task2_label', 'text', 'token_type_ids'],
    num_rows: 10028
})

In [22]:
show_random_elements(dataset_preprocessed["train"],seed=42,num_examples=2)

Unnamed: 0,attention_mask,input_ids,label,task1_label,task2_label,text,token_type_ids
0,"[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]","[102, 17329, 7561, 328, 28742, 246, 17329, 4669, 2032, 20611, 30894, 22098, 30885, 190, 205, 369, 7106, 255, 313, 128, 24546, 2041, 222, 5288, 205, 14499, 566, 566, 1992, 18406, 183, 14822, 18406, 700, 309, 199, 255, 4273, 9817, 6112, 800, 288, 447, 23374, 389, 734, 205, 1770, 566, 566, 1992, 18406, 183, 14822, 18406, 395, 1089, 231, 5834, 21712, 1477, 25534, 30882, 103]",1,OTHER,OTHER,@AfDimBundestag @Heinrich_Krug Gehört den zu einer Integration nicht auch die Bräuche des jeweiligen zu akzeptieren..? |LBR| Und wer das nicht tut welchen Sinn gibt es noch denjenigen unter uns zu wissen..? |LBR| Ich bin für Weihnachtsbäume statt Moscheen,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]"
1,"[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]","[102, 13795, 5677, 313, 1133, 10201, 30881, 231, 128, 234, 3120, 30923, 30890, 30920, 117, 24626, 30882, 30913, 1178, 232, 1178, 103]",1,OTHER,OTHER,immerhin entstehen auch neue räume für die StArTuP sZEnE *-*,"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]"


Es liegen nun alle Eingabedaten in der richtigen Form vor, um ein BERT-Modell zu trainieren.

# Finetuning des Modells

Für die Konstruktion des Modells wird ein Label-ID Mapping erzeugt. Dieses Mapping wird anschließend in der Configuration des Modells hinterlegt. Es ermöglicht dem Modell die vorhergesagten Label als Texte auszugeben anstatt ihrer numerischen Kodierung.

In [23]:
if task.endswith("1"):
  id2label = {"0":"OFFENSE", "1":"OTHER"}
  label2id = {"OFFENSE": "0", "OTHER":"1"}
else:
  id2label = {"0":"ABUSE", "1":"INSULT","2": "OTHER", "3": "PROFANITY"}
  label2id = {"ABUSE": "0", "INSULT":"1", "OTHER": "2", "PROFANITY": "3"}
  

Erzeugen und Konfiguration des Modells mit Label-ID Mapping:
 - `AutoModelForSequenceClassification.from_pretrained` lädt automatisch das entsprechende Modell herunter und initialisiert einen Klassifizierungskopf am Ende des Modells.
 - Die auftretenden Warnungen geben nur Auskunft darüber, dass der Kopf des Modells ausgetauscht wurde und demzufolge keine trainierten Weights hat

In [24]:
from transformers import AutoModelForSequenceClassification, TrainingArguments, Trainer

num_labels = 2 if task.endswith("1") else 4
model = AutoModelForSequenceClassification.from_pretrained(model_checkpoint, num_labels=num_labels, id2label=id2label, label2id=label2id)

Some weights of the model checkpoint at deepset/gbert-base were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of BertForSequenceClassification were not initialized from the model checkpoint a

#### Vorbereitung für die Erzeugung des `Trainers`:
- Es müssen zunächst die `TrainingArguments` konfiguriert werden, dabei handelt es sich um die Hyperparameter des Trainings:
 - Dazu zählen z.B. die Anzahl der Epoch, die Learning Rate, die Batchsize und der weight_decay
 - `load_best_model_at_end` und `metric_for_best_model` sorgen dafür, dass am Ende des Trainings das Model mit der höchsten `F1_Score` geladen wird

In [25]:
metric_name = 'eval_f1'

args = TrainingArguments( 
    output_dir= f"{task}_transformer_native",
    evaluation_strategy = "epoch",
    # empfohlener Standardwert für das Finetuning
    learning_rate=2e-5,
    per_device_train_batch_size=batch_size,
    per_device_eval_batch_size=batch_size,
    num_train_epochs=5,
    # empfohlener Standardwert für das Finetuning
    weight_decay=0.01,
    load_best_model_at_end=True,
    metric_for_best_model=metric_name,
)

Damit das Modell während des Trainings die gewünschten Metriken berechnen kann, muss eine Funktion definiert werden die diese Metriken berechnet. Das übernimmt die `compute_metric` Funktion:
- Die Datasets Bibliothek ermöglicht es, Funktionen zur Berechnung von Metriken herunterzuladen.

In [26]:
metric_acc = datasets.load_metric("accuracy")
metric_f1 = datasets.load_metric("f1")
metric_prec = datasets.load_metric("precision")
metric_rec = datasets.load_metric("recall")

Diese Metriken werden nun wie folgt in der `compute_metrics` Funktion berechnet. Die Funktion liefert anschließend ein Dictionary mit den vier Metriken `accuracy, precision, recall, f1` zurück.

In [27]:
import numpy as np
def compute_metrics(p):
  predictions, labels = p
  predictions = np.argmax(predictions, axis=1)
  accurracy = metric_acc.compute(predictions=predictions, references=labels)
  f1 = metric_f1.compute(predictions=predictions, references=labels, average="macro" )
  prec = metric_prec.compute(predictions=predictions, references=labels,average="macro")
  recall = metric_rec.compute(predictions=predictions, references=labels,average="macro")
 
  return {
      "accurracy" : accurracy["accuracy"],
      "precision" : prec["precision"],
      "recall": recall["recall"],
      "f1": f1["f1"]
  }

Anschließend kann der `Trainer` erzeugt werden. Diesem wird das Modell, die Hyperparameter, die Trainings- und Evaluierungsdatensätze, der Tokenizer sowie die `compute_metrics` Funktion übergeben.
- Der Tokenizer wird übergeben um das Padding entsprechend der Vorgaben im Modell durchzuführen. 

In [28]:
trainer = Trainer(
    model,
    args,
    train_dataset=dataset_preprocessed["train"],
    eval_dataset=dataset_preprocessed["valid"],
    tokenizer=tokenizer,
    compute_metrics=compute_metrics
)

Nun kann trainiert werden:

In [29]:
trainer.train()

Epoch,Training Loss,Validation Loss,Accurracy,Precision,Recall,F1,Runtime,Samples Per Second
1,0.5753,0.565884,0.795056,0.77237,0.803808,0.779608,7.1827,349.171
2,0.4155,0.7667,0.800638,0.777433,0.808573,0.785119,7.2572,345.589
3,0.2318,0.979783,0.835327,0.843199,0.768533,0.790611,7.2067,348.009
4,0.0892,1.19883,0.836124,0.819546,0.793826,0.804328,7.1122,352.632
5,0.0491,1.338885,0.834131,0.814865,0.795324,0.803661,7.1343,351.54


TrainOutput(global_step=12535, training_loss=0.26168580464171753, metrics={'train_runtime': 898.1569, 'train_samples_per_second': 13.956, 'total_flos': 2145155242317024, 'epoch': 5.0})

Nachdem das Modell trainiert wurde, muss es noch gegen den ungesehenen Testdatensatz evaluiert werden:

In [30]:
trainer.evaluate(dataset_preprocessed["test"])

{'eval_loss': 1.4142526388168335,
 'eval_accurracy': 0.8096337842296272,
 'eval_precision': 0.789026889034447,
 'eval_recall': 0.7582414201893786,
 'eval_f1': 0.7698639398759974,
 'eval_runtime': 8.647,
 'eval_samples_per_second': 350.525,
 'epoch': 5.0}

Speichern des Models

In [31]:
trainer.save_model(f'./deepset_finetuned/offensive_language_deepset_{task}_standard_finetune_gem_germeval2019_split_makrof1')

In [32]:
tokenizer.save_pretrained(f'./deepset_finetuned/offensive_language_deepset_{task}_standard_finetune_gem_germeval2019_split_makrof1')

('./deepset_finetuned/offensive_language_deepset_task1_standard_finetune_gem_germeval2019_split_makrof1/tokenizer_config.json',
 './deepset_finetuned/offensive_language_deepset_task1_standard_finetune_gem_germeval2019_split_makrof1/special_tokens_map.json',
 './deepset_finetuned/offensive_language_deepset_task1_standard_finetune_gem_germeval2019_split_makrof1/vocab.txt',
 './deepset_finetuned/offensive_language_deepset_task1_standard_finetune_gem_germeval2019_split_makrof1/added_tokens.json')

#### Beispielhafte Anwendung des Modells

Um ein Transformers Modell einfach anzuwenden, nutzt man die Methode `pipeline`. Diese baut automatisch in Abhängigkeit vom übergebenen Task und Modell eine Pipeline. Die Pipeline kümmert sich um die nötigen Schritte um aus einer Stringeingabe eine Modellvorhersage zu erzeugen:

In [33]:
from transformers import pipeline

In [34]:
# der Task für SequenceClassification ist immer "sentiment-analysis"
classifier = pipeline("sentiment-analysis",model=f'./deepset_finetuned/offensive_language_deepset_{task}_standard_finetune_gem_germeval2019_split_makrof1')

In [41]:
classifier("Unglaublich wie beschissen du heute gespielt hast @ThomasMüller")

[{'label': 'OFFENSE', 'score': 0.9997395873069763}]

In [36]:
classifier('''“Der Sozialismus ist eine Religion der Lüge. Ihre Glaubenssätze sind:
            Neid und Missgunst, Hass und Verachtung, Faulheit und Mittelmäßigkeit, 
            Raub und Diebstahl.” ― Roland Baader"''')

[{'label': 'OTHER', 'score': 0.9990344643592834}]