# Bert Score

BertScore verwendet kontextbezogene Einbettungen, die durch ein vorab trainiertes Bert- Modell erstellt wurden, und berechnet den Matching mithilfe der Kosinusähnlichkeit, optional gewichtet mit inversen Dokumenthäufigkeitswerten. Er gibt die Ergebnisse der Übersetzungsqualität in 3 Metriken an:

![Bert](https://miro.medium.com/v2/resize:fit:1100/format:webp/1*qIW4oGKgh_ZcYCRKoj5yPA.png)

- Precision (Präzision): Dies ist das Verhältnis der korrekten Übersetzungen zu allen vorgenommenen Übersetzungen. Eine hohe Precision bedeutet, dass die meisten vorgenommenen Übersetzungen korrekt waren. Je höher, desto genauer ist die Übersetzung.

- Recall (Erkennungsrate): Dies ist das Verhältnis der korrekten Übersetzungen zu allen möglichen korrekten Übersetzungen. Eine hohe Recall bedeutet, dass die meisten korrekten Übersetzungen auch tatsächlich erkannt wurden. Je höher, desto mehr wurde richtig übersetzt.

- F1-Score: Dies ist das harmonische Mittel aus Precision und Recall und gibt eine kombinierte Bewertung der Übersetzungsqualität. Ein hoher F1-Score deutet darauf hin, dass sowohl Precision als auch Recall hoch sind.

Quellen: 
- https://arxiv.org/pdf/2004.04696
- https://huggingface.co/spaces/evaluate-metric/bleurt/blob/main/app.py
- https://huggingface.co/spaces/evaluate-metric/bertscore
- https://pytorch.org/get-started/locally/



In [6]:
# Imports
import os
import json
from evaluate import load

In [3]:
# Pfad der JSONS ermitteln
folder = "../Data/atticus"
list_files = os.listdir(folder)

# Leere Liste für englische und deutsche Texte
list_english_text = []
list_german_text = []

# Laden der Files und Extraktion der englischen Texte (Source Language = en-US)
for path in list_files:
    path_complete = folder + "//" + path
    with open(path_complete,'r', encoding="utf-8-sig") as file:
        obj = json.load(file)

    # Iterieren durch die Texte der JSON und Selection der englischen Texte
    for text in obj:
        # Selection der englischen Sätze
        list_english_text.append(text['Text'])
        # Überprüfen, ob die Sprache "de-DE" ist und Speichern in einer Liste
        for translation in text['Translations']:
            if translation['Language'] == 'de-DE':
                list_german_text.append(translation['Text'])

In [4]:
# Erstellen der Datensätze
predictions = list_german_text[20:23]
references = ["WAS GIBT ES NEUES & STORYTELLINGAlle bestehenden Franchise werden eingestellt und ein vollständig neues Produktangebot wird eingeführtVerbrauchererkenntnissen basiert und auf Aktivitäten fokussiertFühlt sich besser an als keinen BH zu tragen, vom Entspannen bis zum Erledigen von BesorgungenGebaut für 24 Stunden KomfortNiemand möchte während der Pandemie BHs tragen, sie möchte reinen Komfort und dieses BH-lose GefühlDieses PRIMEGREEN-Produkt wird aus recyceltem Polyester hergestellt, um Umweltauswirkungen zu reduzieren NACHHALTIGKEITRECYCELTE MATERIALIEN PRIME – PRIMEGREEN. SPEZIFIKATIONENVerkaufsstartdatum: 01-01-2022Stoff: 81% REC.PA/19% ELArtikelnummer: HD0267, HD0269, HD0268, HC5584, HD0270TECHNOLOGIEN & EIGENSCHAFTENLEICHTE KOMPRESSION - Bietet leichte UnterstützungAEROREADY - Leitet Schweiß von Ihrer Haut ab und hält Sie trocken und komfortabelHERAUSNEHMBARE POLSTER - Für optionale AbdeckungKÖRPER UND FUTTER VERBUNDEN - Mit atmungsaktivem VerbindungsklebebandVERBUNDENE NÄHTE UND KANTEN - Für einen glättenden Effekt und ein angenehmes GefühlDEZENTE MARKIERUNG - Erhöhtes adidas Badge of Sport Logo mit Glanzfinish an der Seite",
              "DOWNLOAD PRODUKTINFORMATIONEN",
              "Haben Sie eine Frage oder einen Vorschlag? Fragen Sie unten!"]

In [7]:
# Laden des Modells
bertscore = load("bertscore")

# Anwenden des Modells auf den Datensatz
results_bert = bertscore.compute(predictions=predictions, references=references, lang="de")

# Ausgabe (Wird in % Ausgegeben)
print(f'Bert score -> {results_bert}')

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to see activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


Bert score -> {'precision': [0.7125904560089111, 0.8146710991859436, 0.9406546950340271], 'recall': [0.702753484249115, 0.8103688955307007, 0.9463291764259338], 'f1': [0.7076377272605896, 0.8125143051147461, 0.9434834122657776], 'hashcode': 'bert-base-multilingual-cased_L9_no-idf_version=0.3.12(hug_trans=4.42.4)'}
