Thanks to: https://python.langchain.com/docs/guides/evaluation/string/embedding_distance 

In [None]:
from langchain.evaluation import load_evaluator
from langchain.evaluation import EmbeddingDistance


list(EmbeddingDistance)

In [None]:
# Create a dictionary of all the predictions and references

evaluations = [
    {
        "prediction": "I detest pizza",
        "reference": "Pizza is disgusting"
    },
    {
        "prediction": "I shall go",
        "reference": "Go I shall"
    },
    {
        "prediction": "How do I get an EU blue card?",
        "reference": "sie zu einem Zeitpunkt, als die Blaue Karte EU nach Nummer 1 noch gültig war, in einem anderen Mitgliedstaat der Europäischen Union nach Artikel 21 Absatz 3 der Richtlinie (EU) 2021/1883 des Europäischen Parlaments und des Rates vom 20. Oktober 2021 über die Bedingungen für die Einreise und den Aufenthalt von Drittstaatsangehörigen zur Ausübung einer hoch qualifizierten Beschäftigung und zur Aufhebung der Richtlinie 2009/50/EG des Rates (ABl. L 382 vom 28.10.2021, S. 1) einen Antrag auf Erteilung einer Blauen Karte EU gestellt haben, den dieser Mitgliedstaat abgelehnt hat"
    },
    {
        "prediction": "I studied in Germany?",
        "reference": "der Mitgliedstaat der Europäischen Union nach Nummer 2 bei den zuständigen Behörden der Bundesrepublik Deutschland ein Ersuchen auf Gestattung der Wiedereinreise des Ausländers in die Bundesrepublik Deutschland gestellt hat."
    },
    {
        "prediction": "Can I live in Germany if I'm attending college?",
        "reference": "Ausländern, die für ein Studium von einer deutschen Wissenschaftsorganisation oder einer deutschen öffentlichen Stelle vermittelt werden, die Stipendien auch aus öffentlichen Mitteln vergibt, und in diesem Zusammenhang in der Bundesrepublik Deutschland ein Stipendium auf Grund eines auch für öffentliche Mittel verwendeten Vergabeverfahrens erhalten,"
    },
    {
        "prediction": "I hate everything",
        "reference": "photons are like frogs"
    },
    {
        "prediction": "burger",
        "reference": "sandwich"
    },
    {
        "prediction": "burger",
        "reference": "citizen"
    },
    {
        "prediction": "Bürger",
        "reference": "citizen"
    }
]


In [None]:
evaluator = load_evaluator("embedding_distance")
evaluator.evaluate_strings(prediction="hi", reference="no offence")["score"]

In [None]:
# Defines a function evaluate_strings that 
## takes a dictionary of predictions and references "evaliations" and evaluates them for semantic similarity
## also takes in distance metric "distance_metric" as an argument which can contain: "euclidean", "cosine", "manhattan", "chebyshev", "hamming", 

def evaluate_strings(prediction, reference, distance_metric="cosine"):
    evaluator = load_evaluator("embedding_distance", distance_metric=distance_metric)
    score = evaluator.evaluate_strings(prediction=prediction, reference=reference)["score"]
    print(f"This is the score for {distance_metric} distance:")
    return score

In [None]:
# define the list of distance metrics 
distance_metrics = ["euclidean", "cosine", "manhattan", "chebyshev"]


In [None]:
# create a data frame to store the results in 
import pandas as pd
results = pd.DataFrame(columns=["prediction", "reference", "euclidean", "cosine", "manhattan", "chebyshev"])

In [None]:
# Put each evaluation into the dataframe
for evaluation in evaluations:
    results = results.append(evaluation, ignore_index=True)

In [None]:
# Evaluate each distance metric for each evaluation in the data frame, and put the results in the dataframe
for distance_metric in distance_metrics:
    results[distance_metric] = results.apply(lambda x: evaluate_strings(x["prediction"], x["reference"], distance_metric), axis=1)

In [None]:
results

### How to interpret

Depends on the score. 
* a score close to **zero** means sentences are semantically similar
* a score close to **one** means sentences are not semantically similar

In [None]:
evaluate_strings(
    prediction="Fairies are really out there existing, and they live with aliens", 
    reference="You can completely remove a virtual environment, but how you do that depends on what you used to create the venv",
    distance_metric="cosine")

In [None]:
evaluate_strings(prediction="I detest pizza", reference="Pizza is disgusting")

In [None]:
evaluate_strings(prediction="I shall go", reference="Go I shall")

Legal Quotes from: https://www.gesetze-im-internet.de/aufenthv/BJNR294510004.html

In [None]:
evaluate_strings(prediction="How do I get an EU blue card?", reference="sie zu einem Zeitpunkt, als die Blaue Karte EU nach Nummer 1 noch gültig war, in einem anderen Mitgliedstaat der Europäischen Union nach Artikel 21 Absatz 3 der Richtlinie (EU) 2021/1883 des Europäischen Parlaments und des Rates vom 20. Oktober 2021 über die Bedingungen für die Einreise und den Aufenthalt von Drittstaatsangehörigen zur Ausübung einer hoch qualifizierten Beschäftigung und zur Aufhebung der Richtlinie 2009/50/EG des Rates (ABl. L 382 vom 28.10.2021, S. 1) einen Antrag auf Erteilung einer Blauen Karte EU gestellt haben, den dieser Mitgliedstaat abgelehnt hat")

In [None]:
evaluate_strings("I studied in  germany?", "der Mitgliedstaat der Europäischen Union nach Nummer 2 bei den zuständigen Behörden der Bundesrepublik Deutschland ein Ersuchen auf Gestattung der Wiedereinreise des Ausländers in die Bundesrepublik Deutschland gestellt hat.")

In [None]:
evaluate_strings("can I live in Germany if I'm attending college?", "Ausländern, die für ein Studium von einer deutschen Wissenschaftsorganisation oder einer deutschen öffentlichen Stelle vermittelt werden, die Stipendien auch aus öffentlichen Mitteln vergibt, und in diesem Zusammenhang in der Bundesrepublik Deutschland ein Stipendium auf Grund eines auch für öffentliche Mittel verwendeten Vergabeverfahrens erhalten,")

In [None]:
evaluate_strings("I hate everything", "photons are like frogs")

In [None]:
evaluate_strings("burger", "sandwich")

In [None]:
evaluate_strings("burger", "citizen")