In [82]:
import pickle

import pandas as pd
from tqdm.notebook import tqdm
tqdm.pandas()

pd.set_option("display.max_colwidth", None)

In [83]:
examples = {}

for i in range(0, 5):
    with open("../../out/definitions.pickle", "rb") as definitions_file:
        with open(f"../../out/llama/examples_{i}_shot_v4.pickle", "rb") as examples_file:
            examples[i] = {}
            cur_definitions = pickle.load(definitions_file)
            cur_examples = pickle.load(examples_file)
            for (d, de), ex in zip(cur_definitions.items(), cur_examples):
                if i == 0:
                    examples[i][d] = (de, [], ex)
                else:
                    examples[i][d] = (de, *ex[:2])
    examples[i] = pd.DataFrame.from_dict(examples[i], orient="index", columns=["definition", "examples", "generated"])

Add levenshtein ratio:

In [84]:
from Levenshtein import ratio

def ex_gen_levenshtein(row):
    ex = row["examples"]
    try:
        gen = eval(row["generated"])
        lev = 0
        for e in ex:
            for g in gen:
               lev += ratio(str(e), str(g))
        if len(ex) * len(gen) > 0:
            lev /= len(ex) * len(gen)
        else:
            lev = float("NaN")
        return lev
    except SyntaxError:
        return float("NaN")
    
    
def def_gen_levenshtein(row):
    de = row["definition"]
    try:
        gen = eval(row["generated"])
        lev = 0
        for g in gen:
           lev += ratio(str(de), str(g))
        if len(gen) > 0:
            lev /= len(gen)
        else:
            lev = float("NaN")
        return lev
    except SyntaxError:
        return float("NaN")

for e in examples:
    examples[e][f"{e}_ex_gen_levenshtein"] = examples[e].progress_apply(ex_gen_levenshtein, axis=1)
    examples[e][f"{e}_def_gen_levenshtein"] = examples[e].progress_apply(def_gen_levenshtein, axis=1)

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/86 [00:00<?, ?it/s]

  0%|          | 0/86 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

Jaro-Winkler score:

In [85]:
from Levenshtein import jaro_winkler

def ex_gen_jaro_winkler(row):
    ex = row["examples"]
    try:
        gen = eval(row["generated"])
        lev = 0
        for e in ex:
            for g in gen:
               lev += jaro_winkler(str(e), str(g))
        if len(ex) * len(gen) > 0:
            lev /= len(ex) * len(gen)
        else:
            lev = float("NaN")
        return lev
    except SyntaxError:
        return float("NaN")
    
    
def def_gen_jaro_winkler(row):
    de = row["definition"]
    try:
        gen = eval(row["generated"])
        lev = 0
        for g in gen:
           lev += jaro_winkler(str(de), str(g))
        if len(gen) > 0:
            lev /= len(gen)
        else:
            lev = float("NaN")
        return lev
    except SyntaxError:
        return float("NaN")

for e in examples:
    examples[e][f"{e}_ex_gen_jaro_winkler"] = examples[e].progress_apply(ex_gen_jaro_winkler, axis=1)
    examples[e][f"{e}_def_gen_jaro_winkler"] = examples[e].progress_apply(def_gen_jaro_winkler, axis=1)

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/86 [00:00<?, ?it/s]

  0%|          | 0/86 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

BLEU score:

In [86]:
import nltk
nltk.download('punkt')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\Tim\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!


True

In [87]:
from nltk.translate.bleu_score import sentence_bleu, SmoothingFunction
from nltk.tokenize import word_tokenize, sent_tokenize

def ex_gen_bleu(row):
    ex = [word_tokenize(e) for e in row["examples"]]
    gen = [word_tokenize(g) for g in sent_tokenize(row["generated"][1:-1])]
    bleu = 0
    smoothing = SmoothingFunction()
    try:
        for g in gen:
           bleu += sentence_bleu(ex, str(g), smoothing_function=smoothing.method2)
        if len(gen) > 0:
            bleu /= len(gen)
        else:
            bleu = float("NaN")
        return bleu
    except:
        return float("NaN")
    
    
def def_gen_bleu(row):
    de = [word_tokenize(d) for d in sent_tokenize(row["definition"])]
    gen = [word_tokenize(g) for g in sent_tokenize(row["generated"][1:-1])]
    bleu = 0
    smoothing = SmoothingFunction()
    try:
        for g in gen:
           bleu += sentence_bleu(de, str(g), smoothing_function=smoothing.method2)
        if len(gen) > 0:
            bleu /= len(gen)
        else:
            bleu = float("NaN")
        return bleu
    except:
        return float("NaN")

for e in examples:
    examples[e][f"{e}_ex_gen_bleu"] = examples[e].progress_apply(ex_gen_bleu, axis=1)
    examples[e][f"{e}_def_gen_bleu"] = examples[e].progress_apply(def_gen_bleu, axis=1)

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/86 [00:00<?, ?it/s]

  0%|          | 0/86 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

  0%|          | 0/211 [00:00<?, ?it/s]

In [88]:
print("Levenshtein ratio:")
print(examples[0]["0_ex_gen_levenshtein"].mean())
print(examples[0]["0_ex_gen_levenshtein"].std())
print("-----")
print(examples[0]["0_def_gen_levenshtein"].mean())
print(examples[0]["0_def_gen_levenshtein"].std())
print("=====")
print("Jaro-Winkler similarity score:")
print(examples[0]["0_ex_gen_jaro_winkler"].mean())
print(examples[0]["0_ex_gen_jaro_winkler"].std())
print("-----")
print(examples[0]["0_def_gen_jaro_winkler"].mean())
print(examples[0]["0_def_gen_jaro_winkler"].std())
print("=====")
print("BLEU score:")
print(examples[0]["0_ex_gen_bleu"].mean())
print(examples[0]["0_ex_gen_bleu"].std())
print("-----")
print(examples[0]["0_def_gen_bleu"].mean())
print(examples[0]["0_def_gen_bleu"].std())
examples[0]

Levenshtein ratio:
nan
nan
-----
0.10114475565618114
0.0620259342675694
=====
Jaro-Winkler similarity score:
nan
nan
-----
0.5292155267564049
0.03532567550015861
=====
BLEU score:
nan
nan
-----
0.01074641159259956
0.00845470715247841


Unnamed: 0,definition,examples,generated,0_ex_gen_levenshtein,0_def_gen_levenshtein,0_ex_gen_jaro_winkler,0_def_gen_jaro_winkler,0_ex_gen_bleu,0_def_gen_bleu
10,"Die ""Negation:NEG_XgeschweigedennY-Konstruktion"" korreliert zwei Propositionen, die jeweils einen Punkt auf einem pragmatisch definiertem Maßstab markieren. Die erste Proposition ist pragmatisch stärker als die zweite Proposition; so zieht, pragmatisch betrachtet, die Wahrheit der ersten Proposition automatisch die Wahrheit der zweiten Proposition nach sich. Einfacher ausgedrückt: Ist die erste Proposition wahr, so muss die zweite Proposition ebenfalls wahr sein. Die erste Proposition ist darüber hinaus auch informativer als die zweite Proposition, da die erstgenannte pragmatisch betrachtet die letztgenannte einschließt, während diese wiederum die diskursrelevantere der beiden Propositionen ist. Die Konstruktion umfasst das konstruktionsevozierende Element (KEE) ""geschweige_denn"", die internen Kern-Konstruktionselemente (Kern-KE) ""Erstes_Konjunkt"" und ""Zweites_Konjunkt"" sowie die externen Kern-KE ""Negator"" und ""Fokuskontext"". Das ""Erste_Konjunkt"" geht dem ""KEE"" voraus, auf welches das ""Zweite_Konjunkt"" folgt. Der informationsstrukturelle Fokus liegt auf dem ""Ersten_Konjunkt"", das die Basis für den entstehenden Kontrast zwischen den zwei Propositionen bildet. Das ""Erste_Konjunkt"" und das ""Zweite_Konjunkt"" bilden jeweils einen Teil der beiden Propositionen ab, wobei das ""Erste_Konjunkt"" meist zusätzlih vom ""Negator"" negiert wird. Der ""Fokuskontext"" indiziert in der Regel den Rest der Proposition. Werden beide Konjunkte im Wechsel mit dem ""Fokuskontext"" kombiniert, können die einander gegenübergestellten Propositionen vollständig wiederhergestellt (oder: vervollständigt) werden. Im Gegensatz zum ""Ersten_Konjunkt"" und ""Zweiten_Konjunkt"" muss der ""Fokuskontext"" nicht zwangsläufig realisiert werden – wird der ""Fokuskontext"" nicht realisiert, drücken die beiden Konjunkte jeweils vollständige Propositionen aus. "" Die zwei gegenübergestellten Propositionen sind hier die beiden Aussagen, dass die meisten von ihnen zuvor noch nie einen Computer a) gesehen und b) bedient haben. Die Verwendung der ""Negation:NEG_XgeschweigedennY-Konstruktion"" erfordert die Einstufung von Sehen und Bedienen auf einer 'pragmatischen Skala', was dazu führt, dass die Aussage Die meisten von ihnen haben zuvor noch nie einen Computer bedient als 'größere' Behauptung betrachtet werden muss als Die meisten von ihnen haben zuvor noch nie einen Computer gesehen. Mit anderen Worten: Wenn die meisten von ihnen einen Computer zuvor noch nie gesehen haben, dann haben sie ihn ganz sicher auch nicht bedient bzw. wenn sie einen Computer noch nie gesehen haben, können sie diesen auch nicht bedient haben. Proposition a) schließt Proposition b) somit aus. Unter dem Aspekt der Negation wird die erste Proposition Die meisten von ihnen haben zuvor noch nie einen Computer gesehen damit zur stärkeren der beiden kontrastierten Propositionen.",[],"[""Die meisten von ihnen haben zuvor noch nie einen Computer gesehen."", ""Die meisten von ihnen haben zuvor noch nie einen Computer bedient.""]",,0.045486,,0.533359,,0.016514
100,"Die ""Äquativ_Plural-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Entitäten an, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""gleich"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit), und den beiden Kern-Konstruktionselementen (KE) ""Verglichene_Entitäten"" und ""Dimension"". Dabei umfasst das KE ""Verglichene_Entitäten"" diejenigen Einheiten, die hinsichtlich eines bestimmten Wertes einer durch die Vergleichskategorie definierten Skala gleichgesetzt werden. Die Skala wird dabei durch die ""Dimension"" angezeigt (X und Y sind gleich groß vergleicht zum Beispiel X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht sich die Einheiten (""Verglichene_Entitäten"") gleichen.",[],"[""Die Katsup-Bottel sind gleich stark wie die Ketchup-Bottel"", ""Die Tafel ist gleichweit von der Mauer entfernt wie der Stuhl"", ""Die Schere ist gleichschärf wie die Zange""]",,0.099222,,0.536421,,0.004941
1004,"Die ""Superlativ_Klimax:ADJ1_ADJ1-er_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt primär durch die Wiederholung der in höchstem Maße zutreffenden Eigenschaft; zunächst im Positiv und dann im Komparativ. Anstelle einer Superlativform steht zuletzt die polar eingeordnete Entität. Die Zuweisung erfolgt auch durch den Vergleich der Entität mit einer immer impliziten Gesamtheit. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Das konstruktionsevozierende Element (KEE) ""-er"" bildet gemeinsam mit der wiederholten ""Dimension"" den Komparativ; durch die Struktur der Konstruktion, die der klassischen dreiteiligen Steigerungsform von Verben (X, X-er, am X-sten) nachempfunden ist, wird die superlative Bedeutung, die das dritte Verb innehat, auf das ""Verglichene"" übertragen, das an seiner Stelle steht. Neben den internen Kern-Konstruktionselementen (Kern-KE) ""Dimension"" und ""Verglichenes"" besteht die Konstruktion aus einer immer nullinstantiierten weil nie ausgedrückten ""Vergleichsmenge"", auf die implizit verwiesen wird. "" Groß, größer, RTL lässt sich paraphrasieren mit RTL ist am größten [von allen].",[],"[""Die meiste Zeit verbringen die Schüler im Klassenzimmer."", ""Das Auto ist schneller als das Fahrrad."", ""Das Essen schmeckt am besten."", ""Der Elefant ist größer als der Affe."", ""Der Tag am Ende des Monats ist länger als am Anfang des Monats.""]",,0.064510,,0.530598,,0.020904
1006,"Die ""Superlativ:PRÄP_ADJ-ster_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt durch den Vergleich einer Entität mit einer impliziten Gesamtheit. Die ""Präposition"" steht stets vor der meist als Adjektiv realisierten ""Dimension"", an die das konstruktionsevozierende Element (KEE) ""(e)st"" angehangen wird. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Neben der ""Präposition"", dem ""KEE"" und der ""Dimension"" besteht die Konstruktion aus zwei weiteren Kern-Konstruktionselementen (Kern-KE): dem ""Verglichenen"" (die Entität, der eine durch die ""Dimension"" ausgedrückte Eigenschaft in vollem Ausmaß zugewiesen wird) und der ""Vergleichsmenge"" (die stets implizite Menge an Entitäten, die über die selbe Eigenschaft in geringerem Ausmaß verfügen).",[],"[""Die Sache ist die beste, die ich je gemacht habe.""]",,0.097713,,0.552389,,0.015067
101,"Die ""Äquativ:ADJwieNP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Die Besonderheit der Konstruktion besteht darin, dass einer Entität ein Wert auf der Skala zugewiesen wird, der vom durchschnittlich erwartbaren Wert abweicht. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""wie"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit) und den drei Kern-Konstruktionselementen (KE) ""Dimension"", ""Verglichenes"" und ""Bezugswert"". Das ""Verglichene"" und der ""Bezugswert"" sind die Einheiten, die in Bezug auf bestimmte Werte spezifischer Attribute auf einer Skala verglichen werden. Die Skala wird durch die ""Dimension"" angezeigt (X ist groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht das Element im Fokus (""Verglichenes"") zu einem bestehenden Wert (""Bezugswert"") gleichgesetzt wird.",[],"[""Das Auto fährt schnell wie ein Flugzeug."", ""Das Essensrestaurant bietet köstliche Speisen wie ein fünfsterne-Restaurant."", ""Das Auto fährt schneller als ein Fahrrad."", ""Das Haus besteht aus Holz wie ein Baum."", ""Das Mädchen ist wie ein bisschen Hase."", ""Das Auto fährt schneller als der Bus.""]",,0.080981,,0.531476,,0.017836
...,...,...,...,...,...,...,...,...,...
97,"Die ""Komparativ:ADJ1-eralsADJ1-Konstruktion"" gehört zu den Vergleichskonstruktionen. Die Konstruktion wird formal mit einem Komparativ realisiert, hat allerdings eine superlativische Bedeutung. Wie bei anderen Vergleichskonstruktionen setzt sich auch diese aus den drei Kern-Konstruktionselementen (KE) ""Verglichenes"", ""Bezugswert"" und ""Dimension"" zusammen. Genauer wird dabei eine zu vergleichende Entität, das ""Verglichene"", hinsichtlich eines konkreten Attributs (der ""Dimension"" des Vergleichs) zu einem ""Bezugswert"" auf einer imaginären Skala in Relation gesetzt. Die ""Dimension"" benennt dabei die Skala, die dem Vergleich zugrundeliegt. Dadurch, dass das die ""Dimension"" anzeigende Adjektiv im Komparativ nicht zugleich als ""Bezugswert"" fungiert und mithin den Orientierungswert für den Vergleich markieren kann, erhält die Konstruktion die für sie spezifische metasprachliche Funktion. Ihre Funktion besteht darin, auf der durch die ""Dimension"" angezeigten imaginären Skala auf einen Wertebereich zu verweisen, der jenseits des ""Bezugswertes"" liegt, den die verwendete lexikalische Kategorie benennt: Heller als hell bedeutet demnach 'heller als der Wert, den das Adjektiv hell auf der Skala markiert'. Der angezeigte Bereich gilt in der Folge als exorbitant hoch. So wird die durch das Adjektiv kodierte Eigenschaft dem ""Verglichenen"" in einem besonders hohen Maße attestiert; so ist 'ein Licht, das heller ist als hell', besonders hell.",[],"[""Ein Mann, der im Vergleich zu seinem Bruder sehr hübsch ist"", ""Das Auto fährt schneller als das Auto von Frau Müller"", ""Das Haus ist größer als das Haus von Familie Schmidt"", ""Die Blume ist schöner als die Blume von Frau Müller""]",,0.068047,,0.510532,,0.004356
973,"Bei ""Disjunktion_Doppeltitel:XoderY"" handelt es sich um eine Konstruktion, welche in ihrer spezifischen Funktionalität ausschließlich als Titel erscheint und damit als kommunikative Ressource der geschriebenen Sprache fungiert. Als Titel bzw. Überschrift stellen Instanzen des Musters Leseanleitungen dar, deren Besonderheit darin besteht, dass sie in Form der Disjunktion zwei Möglichkeiten präsentieren, unter denen der nachfolgende Text zu lesen ist (vgl. Finkbeiner/Tienken 2018: 268). Diese metalinguistische Interpretation ergibt sich daraus, dass die Koordinationsphrase, in der der Konnektor ""oder"" mit ""Disjunkt_1"" und ""Disjunkt_2"" zwei voneinander unabhängige Phrasen verknüpft, nicht propositional im Sinne einer Alternativfrage interpretiert wird, als sei eine Wahl zwischen zwei Sachverhalten bzw. Entitäten zu treffen (im Sinne von: In diesem Text geht es entweder um Christoph Columbus oder um Die Entdeckung Amerikas), sondern vielmehr so, dass die Disjunkte zwei Formulierungsalternativen für ein- und denselben Sachverhalt bereitstellen, die als äquivalent gelten und gleichermaßen zutreffen (im Sinne von: In diesem Text geht es um Christoph Columbus oder anders gesagt um Die Entdeckung Amerikas) (vgl. Finkbeiner/Tienken 2018: 260). Neben der spezifischen Kontext-Restriktion, als Titelformat ausschließlich an die sequenzielle Position der Überschrift gebunden zu sein, ist die Kxn in dreifacher Hinsicht restringiert (vgl. Finkbeiner/Tienken 2018: 259-262): 1) Zum einen liegt eine Nicht-Gleichartigkeitsbeschränkung der Disjunkte vor, insofern diese in der Regel durch unterschiedliche syntaktische Phrasenstrukturen (z.B. EN und NP oder NP und w-VL-Satz) oder bei einer identischen Phrasenstruktur (z.B. NP und NP) durch unterschiedliche Mikrostrukturen realisiert werden (z.B. eine NP mit präpositionalem Attribut und eine NP mit Genitivattribut). ""2) Zweitens gibt es eine klare Restriktion hinsichtlich der Reihenfolge der Disjunkte: So fungiert innerhalb der Kxn das beim linearen Lesen später aufgenommene zweite Disjunkt als explizierender Zusatz zum ersten Disjunkt. Der Y-Slot zeichnet sich somit durch ein semantisches Explikationspotenzial zum X-Slot aus, was tendenziell mit einer syntaktisch größeren Komplexität von ""Disjunkt_2"" einhergeht (z.B. EN vor NP oder NP vor w-VL-Satz). ""3) Da sich die Disjunkte normalerweise auf denselben generellen Aspekt des Bezugstextes (meistens das Thema) beziehen, unterliegen sie drittens einer Äquivalenzbeschränkung. Kombinationen von Disjunkten, die auf unterschiedliche Eigenschaften des Textes bezogen sind (z.B. thematische Charakterisierung und Textsortencharakterisierung) werden von der Kxn nicht lizensiert (vgl. Der Fall Ecstasy oder Eine Essaysammlung). """,[],"[""XoderY""]",,0.004368,,0.611841,,0.044620
976,"Bei ""Korrelation_Affirmation:WoXist, istY"" handelt es sich um eine verfestigte, nicht völlig kompositionelle und produktive Phrasem-Konstruktion (PhK) des Deutschen, die neben einem kleinen Set an usuellen Sprichwort-Realisierungen eine große Menge an okkasionellen Bildungen lizensiert. Aus syntaktischer Sicht handelt es sich um ein satzwertiges Strukturmuster der Form Wo X ist, ist Y, das aus zwei Teilsätzen (lokaler Adverbialsatz und Hauptsatz) besteht. Während mit dem Adverb ""wo"", und den beiden Verbformen ""ist"" drei Positionen lexikalisch gefüllt sind, welche im Verbund die PhK evozieren, fungieren mit X (""Entität_1"") und Y (""Entität_2"") zwei nominale Positionen als variabel, aber nicht beliebig zu besetzende Slots. Aus semantischer Sicht bringt die PhK eine Korrelation zwischen zwei Entitäten oder Sachverhalten zum Ausdruck, die einer affirmativen Existenzquantifikation entspricht: So gilt: 'Wenn es (irgendwo) X gibt, dann gibt es (dort) typischerweise auch Y' (z.B. für Wo Licht ist, ist auch Schatten: Wenn es irgendwo Licht gibt, dann muss es dort auch Schatten geben, bzw. im übertragenen Sinne: Wenn es etwas Positives gibt, dann gibt es typischerweise auch etwas Negatives) (vgl. Steyer 2012: 309).",[],"[""Wo es regnet, ist es auch dunkel."", ""Wo es leicht regnet, ist es auch kalt."", ""Wo es warm ist, ist es auch hellig."", ""Wo es kalt ist, ist es auch dunkel."", ""Wo es heiß ist, ist es auch trocken.""]",,0.056259,,0.540455,,0.019036
98,"Die ""Äquativ:soADJwieXP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Das konstruktionsevozierende Element (KEE) kann entweder durch ""so"", ""genauso"", ""ebenso""oder (selten) ""gleich"" realisiert werden und gibt an, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit). Neben dem KEE besteht der Vergleichsausdruck außerdem aus drei Kern-Konstruktionselementen (KE). Das KE ""Verglichenes"" umfasst diejenige Einheit, die im Fokus des Vergleichs steht und zu einem bereits bestehenden Wert gleichgesetzt wird (zu dem KE ""Bezugswert""). Das KE ""Dimension"" benennt dabei die Skala des Vergleichs, d.h. es gibt genauer an, in welcher Hinsicht ""Verglichenes"" und ""Bezugswert"" gleichgesetzt werden (X ist so groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe').",[],"[""X"", ""so"", ""so"", ""groß"", ""als"", ""Y""]",,0.004971,,0.523915,,0.011746


In [89]:
print("Levenshtein ratio:")
print(examples[1]["1_ex_gen_levenshtein"].mean())
print(examples[1]["1_ex_gen_levenshtein"].std())
print("-----")
print(examples[1]["1_def_gen_levenshtein"].mean())
print(examples[1]["1_def_gen_levenshtein"].std())
print("=====")
print("Jaro-Winkler similarity score:")
print(examples[1]["1_ex_gen_jaro_winkler"].mean())
print(examples[1]["1_ex_gen_jaro_winkler"].std())
print("-----")
print(examples[1]["1_def_gen_jaro_winkler"].mean())
print(examples[1]["1_def_gen_jaro_winkler"].std())
print("=====")
print("BLEU score:")
print(examples[1]["1_ex_gen_bleu"].mean())
print(examples[1]["1_ex_gen_bleu"].std())
print("-----")
print(examples[1]["1_def_gen_bleu"].mean())
print(examples[1]["1_def_gen_bleu"].std())
examples[1]

Levenshtein ratio:
0.03202020538900645
0.013491980548376026
-----
0.13416783200991286
0.07466546867492732
=====
Jaro-Winkler similarity score:
0.45296166028232177
0.08916730540202354
-----
0.5304984578265755
0.03072053834165266
=====
BLEU score:
0.014727100861931732
0.010794883568769339
-----
0.008888787680779215
0.0072444791471314085


Unnamed: 0,definition,examples,generated,1_ex_gen_levenshtein,1_def_gen_levenshtein,1_ex_gen_jaro_winkler,1_def_gen_jaro_winkler,1_ex_gen_bleu,1_def_gen_bleu
10,"Die ""Negation:NEG_XgeschweigedennY-Konstruktion"" korreliert zwei Propositionen, die jeweils einen Punkt auf einem pragmatisch definiertem Maßstab markieren. Die erste Proposition ist pragmatisch stärker als die zweite Proposition; so zieht, pragmatisch betrachtet, die Wahrheit der ersten Proposition automatisch die Wahrheit der zweiten Proposition nach sich. Einfacher ausgedrückt: Ist die erste Proposition wahr, so muss die zweite Proposition ebenfalls wahr sein. Die erste Proposition ist darüber hinaus auch informativer als die zweite Proposition, da die erstgenannte pragmatisch betrachtet die letztgenannte einschließt, während diese wiederum die diskursrelevantere der beiden Propositionen ist. Die Konstruktion umfasst das konstruktionsevozierende Element (KEE) ""geschweige_denn"", die internen Kern-Konstruktionselemente (Kern-KE) ""Erstes_Konjunkt"" und ""Zweites_Konjunkt"" sowie die externen Kern-KE ""Negator"" und ""Fokuskontext"". Das ""Erste_Konjunkt"" geht dem ""KEE"" voraus, auf welches das ""Zweite_Konjunkt"" folgt. Der informationsstrukturelle Fokus liegt auf dem ""Ersten_Konjunkt"", das die Basis für den entstehenden Kontrast zwischen den zwei Propositionen bildet. Das ""Erste_Konjunkt"" und das ""Zweite_Konjunkt"" bilden jeweils einen Teil der beiden Propositionen ab, wobei das ""Erste_Konjunkt"" meist zusätzlih vom ""Negator"" negiert wird. Der ""Fokuskontext"" indiziert in der Regel den Rest der Proposition. Werden beide Konjunkte im Wechsel mit dem ""Fokuskontext"" kombiniert, können die einander gegenübergestellten Propositionen vollständig wiederhergestellt (oder: vervollständigt) werden. Im Gegensatz zum ""Ersten_Konjunkt"" und ""Zweiten_Konjunkt"" muss der ""Fokuskontext"" nicht zwangsläufig realisiert werden – wird der ""Fokuskontext"" nicht realisiert, drücken die beiden Konjunkte jeweils vollständige Propositionen aus. "" Die zwei gegenübergestellten Propositionen sind hier die beiden Aussagen, dass die meisten von ihnen zuvor noch nie einen Computer a) gesehen und b) bedient haben. Die Verwendung der ""Negation:NEG_XgeschweigedennY-Konstruktion"" erfordert die Einstufung von Sehen und Bedienen auf einer 'pragmatischen Skala', was dazu führt, dass die Aussage Die meisten von ihnen haben zuvor noch nie einen Computer bedient als 'größere' Behauptung betrachtet werden muss als Die meisten von ihnen haben zuvor noch nie einen Computer gesehen. Mit anderen Worten: Wenn die meisten von ihnen einen Computer zuvor noch nie gesehen haben, dann haben sie ihn ganz sicher auch nicht bedient bzw. wenn sie einen Computer noch nie gesehen haben, können sie diesen auch nicht bedient haben. Proposition a) schließt Proposition b) somit aus. Unter dem Aspekt der Negation wird die erste Proposition Die meisten von ihnen haben zuvor noch nie einen Computer gesehen damit zur stärkeren der beiden kontrastierten Propositionen.","['Es ist ein Foto , nur ein Foto , schwarz - weiß , darauf zu sehen eine stolze und gütige alte Frau , die Silberhaare straff nach hinten gesteckt , schwarz gekleidet , das Tuch geht bis zum Boden .']","[""Es ist ein schwarz-weißes Foto"", ""Es ist ein schwarzes Foto mit Silberhaar""]",0.044634,0.024027,0.446333,0.537068,0.016245,0.013661
100,"Die ""Äquativ_Plural-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Entitäten an, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""gleich"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit), und den beiden Kern-Konstruktionselementen (KE) ""Verglichene_Entitäten"" und ""Dimension"". Dabei umfasst das KE ""Verglichene_Entitäten"" diejenigen Einheiten, die hinsichtlich eines bestimmten Wertes einer durch die Vergleichskategorie definierten Skala gleichgesetzt werden. Die Skala wird dabei durch die ""Dimension"" angezeigt (X und Y sind gleich groß vergleicht zum Beispiel X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht sich die Einheiten (""Verglichene_Entitäten"") gleichen.","['Wir würdigen Freiheit und Toleranz , sie verehren Tyrannei und Terror "" "" , sagte Netanjahu .']","[""Wir fördern den Schutz des Umwelt, während wir den Abbau fossiler Brennstoffe fördern "" , sagte der Umweltminister ."", ""Der Minister betonte die Bedeutung des Wohlbefindens der Bevölkerung, während er die Kürzung der Sozialleistungen beteuerte "" , sagte der Finanzminister .""]",,,,,0.010267,0.007070
1004,"Die ""Superlativ_Klimax:ADJ1_ADJ1-er_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt primär durch die Wiederholung der in höchstem Maße zutreffenden Eigenschaft; zunächst im Positiv und dann im Komparativ. Anstelle einer Superlativform steht zuletzt die polar eingeordnete Entität. Die Zuweisung erfolgt auch durch den Vergleich der Entität mit einer immer impliziten Gesamtheit. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Das konstruktionsevozierende Element (KEE) ""-er"" bildet gemeinsam mit der wiederholten ""Dimension"" den Komparativ; durch die Struktur der Konstruktion, die der klassischen dreiteiligen Steigerungsform von Verben (X, X-er, am X-sten) nachempfunden ist, wird die superlative Bedeutung, die das dritte Verb innehat, auf das ""Verglichene"" übertragen, das an seiner Stelle steht. Neben den internen Kern-Konstruktionselementen (Kern-KE) ""Dimension"" und ""Verglichenes"" besteht die Konstruktion aus einer immer nullinstantiierten weil nie ausgedrückten ""Vergleichsmenge"", auf die implizit verwiesen wird. "" Groß, größer, RTL lässt sich paraphrasieren mit RTL ist am größten [von allen].","['Wissenschafter der Regierung sind zum Schluss gekommen , dass mit der Installation von 400 000 Solarspiegeln der Lebensraum der Wüstenschildkröten verloren ginge .']","[""Ich möchte gerne eine neue Jacke kaufen."", ""Sie erlauben mir, das Auto zu benutzen?"", ""Du solltest dich früh zu Bett begeben."", ""Es ist jetzt Zeit, den Schlafanzug anzuziehen.""]",0.035953,0.058335,0.407182,0.516549,0.025672,0.021385
1006,"Die ""Superlativ:PRÄP_ADJ-ster_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt durch den Vergleich einer Entität mit einer impliziten Gesamtheit. Die ""Präposition"" steht stets vor der meist als Adjektiv realisierten ""Dimension"", an die das konstruktionsevozierende Element (KEE) ""(e)st"" angehangen wird. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Neben der ""Präposition"", dem ""KEE"" und der ""Dimension"" besteht die Konstruktion aus zwei weiteren Kern-Konstruktionselementen (Kern-KE): dem ""Verglichenen"" (die Entität, der eine durch die ""Dimension"" ausgedrückte Eigenschaft in vollem Ausmaß zugewiesen wird) und der ""Vergleichsmenge"" (die stets implizite Menge an Entitäten, die über die selbe Eigenschaft in geringerem Ausmaß verfügen).",['Der LSD - Rausch hat mich bisher am meisten begeistert .'],"[""Der Rauchsäule im Park ist am wenigsten angenehm"", ""Die Sause im Auto fühlt sich am meisten verletzt""]",0.033673,0.094693,0.488368,0.540318,0.011621,0.007979
101,"Die ""Äquativ:ADJwieNP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Die Besonderheit der Konstruktion besteht darin, dass einer Entität ein Wert auf der Skala zugewiesen wird, der vom durchschnittlich erwartbaren Wert abweicht. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""wie"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit) und den drei Kern-Konstruktionselementen (KE) ""Dimension"", ""Verglichenes"" und ""Bezugswert"". Das ""Verglichene"" und der ""Bezugswert"" sind die Einheiten, die in Bezug auf bestimmte Werte spezifischer Attribute auf einer Skala verglichen werden. Die Skala wird durch die ""Dimension"" angezeigt (X ist groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht das Element im Fokus (""Verglichenes"") zu einem bestehenden Wert (""Bezugswert"") gleichgesetzt wird.","['Weil Verschlüsselungstechnologie dabei eine wichtige Rolle spielt , spricht man auch von einer Kryptowährung .']","[""Weil der KE 'Grund' erfüllt ist"", ""Weil der Modifikator 'hilft'"", ""Weil der KE 'Folge' folgt""]",0.043093,0.049037,0.315511,0.491955,0.011174,0.007473
...,...,...,...,...,...,...,...,...,...
97,"Die ""Komparativ:ADJ1-eralsADJ1-Konstruktion"" gehört zu den Vergleichskonstruktionen. Die Konstruktion wird formal mit einem Komparativ realisiert, hat allerdings eine superlativische Bedeutung. Wie bei anderen Vergleichskonstruktionen setzt sich auch diese aus den drei Kern-Konstruktionselementen (KE) ""Verglichenes"", ""Bezugswert"" und ""Dimension"" zusammen. Genauer wird dabei eine zu vergleichende Entität, das ""Verglichene"", hinsichtlich eines konkreten Attributs (der ""Dimension"" des Vergleichs) zu einem ""Bezugswert"" auf einer imaginären Skala in Relation gesetzt. Die ""Dimension"" benennt dabei die Skala, die dem Vergleich zugrundeliegt. Dadurch, dass das die ""Dimension"" anzeigende Adjektiv im Komparativ nicht zugleich als ""Bezugswert"" fungiert und mithin den Orientierungswert für den Vergleich markieren kann, erhält die Konstruktion die für sie spezifische metasprachliche Funktion. Ihre Funktion besteht darin, auf der durch die ""Dimension"" angezeigten imaginären Skala auf einen Wertebereich zu verweisen, der jenseits des ""Bezugswertes"" liegt, den die verwendete lexikalische Kategorie benennt: Heller als hell bedeutet demnach 'heller als der Wert, den das Adjektiv hell auf der Skala markiert'. Der angezeigte Bereich gilt in der Folge als exorbitant hoch. So wird die durch das Adjektiv kodierte Eigenschaft dem ""Verglichenen"" in einem besonders hohen Maße attestiert; so ist 'ein Licht, das heller ist als hell', besonders hell.","['Und so schenkt er dem britischen Bond - Darsteller Daniel Craig als Südstaaten - Slang kauendem Safeknacker die mit Abstand lustigste Rolle , die dieser je spielen durfte .']","[""Die mit Abstand lustigste Rolle"", ""Die mit Abstand schmutzigste Rolle"", ""Die mit Abstand größte Rolle"", ""Die mit Abstand beste Rolle"", ""Die mit Abstand schnellste Rolle"", ""Die mit Abstand teuerste Rolle"", ""Die mit Abstand lüstigste Rolle"", ""Die mit Abstand aufregendste Rolle"", ""Die mit Abstand komplexeste Rolle"", ""Die mit Abstand schlechteste Rolle""]",0.049831,0.041040,0.453718,0.537851,0.003571,0.002786
973,"Bei ""Disjunktion_Doppeltitel:XoderY"" handelt es sich um eine Konstruktion, welche in ihrer spezifischen Funktionalität ausschließlich als Titel erscheint und damit als kommunikative Ressource der geschriebenen Sprache fungiert. Als Titel bzw. Überschrift stellen Instanzen des Musters Leseanleitungen dar, deren Besonderheit darin besteht, dass sie in Form der Disjunktion zwei Möglichkeiten präsentieren, unter denen der nachfolgende Text zu lesen ist (vgl. Finkbeiner/Tienken 2018: 268). Diese metalinguistische Interpretation ergibt sich daraus, dass die Koordinationsphrase, in der der Konnektor ""oder"" mit ""Disjunkt_1"" und ""Disjunkt_2"" zwei voneinander unabhängige Phrasen verknüpft, nicht propositional im Sinne einer Alternativfrage interpretiert wird, als sei eine Wahl zwischen zwei Sachverhalten bzw. Entitäten zu treffen (im Sinne von: In diesem Text geht es entweder um Christoph Columbus oder um Die Entdeckung Amerikas), sondern vielmehr so, dass die Disjunkte zwei Formulierungsalternativen für ein- und denselben Sachverhalt bereitstellen, die als äquivalent gelten und gleichermaßen zutreffen (im Sinne von: In diesem Text geht es um Christoph Columbus oder anders gesagt um Die Entdeckung Amerikas) (vgl. Finkbeiner/Tienken 2018: 260). Neben der spezifischen Kontext-Restriktion, als Titelformat ausschließlich an die sequenzielle Position der Überschrift gebunden zu sein, ist die Kxn in dreifacher Hinsicht restringiert (vgl. Finkbeiner/Tienken 2018: 259-262): 1) Zum einen liegt eine Nicht-Gleichartigkeitsbeschränkung der Disjunkte vor, insofern diese in der Regel durch unterschiedliche syntaktische Phrasenstrukturen (z.B. EN und NP oder NP und w-VL-Satz) oder bei einer identischen Phrasenstruktur (z.B. NP und NP) durch unterschiedliche Mikrostrukturen realisiert werden (z.B. eine NP mit präpositionalem Attribut und eine NP mit Genitivattribut). ""2) Zweitens gibt es eine klare Restriktion hinsichtlich der Reihenfolge der Disjunkte: So fungiert innerhalb der Kxn das beim linearen Lesen später aufgenommene zweite Disjunkt als explizierender Zusatz zum ersten Disjunkt. Der Y-Slot zeichnet sich somit durch ein semantisches Explikationspotenzial zum X-Slot aus, was tendenziell mit einer syntaktisch größeren Komplexität von ""Disjunkt_2"" einhergeht (z.B. EN vor NP oder NP vor w-VL-Satz). ""3) Da sich die Disjunkte normalerweise auf denselben generellen Aspekt des Bezugstextes (meistens das Thema) beziehen, unterliegen sie drittens einer Äquivalenzbeschränkung. Kombinationen von Disjunkten, die auf unterschiedliche Eigenschaften des Textes bezogen sind (z.B. thematische Charakterisierung und Textsortencharakterisierung) werden von der Kxn nicht lizensiert (vgl. Der Fall Ecstasy oder Eine Essaysammlung). """,['Rope Skipping : das neue Seilspringen'],"[""Ihre Haare sind jetzt wie ein roter Faden"", ""Die neue Farbe des Winters ist grau""]",0.031552,0.027346,0.370689,0.520138,0.012554,0.009350
976,"Bei ""Korrelation_Affirmation:WoXist, istY"" handelt es sich um eine verfestigte, nicht völlig kompositionelle und produktive Phrasem-Konstruktion (PhK) des Deutschen, die neben einem kleinen Set an usuellen Sprichwort-Realisierungen eine große Menge an okkasionellen Bildungen lizensiert. Aus syntaktischer Sicht handelt es sich um ein satzwertiges Strukturmuster der Form Wo X ist, ist Y, das aus zwei Teilsätzen (lokaler Adverbialsatz und Hauptsatz) besteht. Während mit dem Adverb ""wo"", und den beiden Verbformen ""ist"" drei Positionen lexikalisch gefüllt sind, welche im Verbund die PhK evozieren, fungieren mit X (""Entität_1"") und Y (""Entität_2"") zwei nominale Positionen als variabel, aber nicht beliebig zu besetzende Slots. Aus semantischer Sicht bringt die PhK eine Korrelation zwischen zwei Entitäten oder Sachverhalten zum Ausdruck, die einer affirmativen Existenzquantifikation entspricht: So gilt: 'Wenn es (irgendwo) X gibt, dann gibt es (dort) typischerweise auch Y' (z.B. für Wo Licht ist, ist auch Schatten: Wenn es irgendwo Licht gibt, dann muss es dort auch Schatten geben, bzw. im übertragenen Sinne: Wenn es etwas Positives gibt, dann gibt es typischerweise auch etwas Negatives) (vgl. Steyer 2012: 309).",['«Das ist Kommunismus pur.»'],"[""Das ist eine Kumme pure Empörung"", ""Das ist eine unverschämliche Blutäder pure Wut""]",0.037116,0.059365,0.450332,0.538709,0.013137,0.010155
98,"Die ""Äquativ:soADJwieXP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Das konstruktionsevozierende Element (KEE) kann entweder durch ""so"", ""genauso"", ""ebenso""oder (selten) ""gleich"" realisiert werden und gibt an, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit). Neben dem KEE besteht der Vergleichsausdruck außerdem aus drei Kern-Konstruktionselementen (KE). Das KE ""Verglichenes"" umfasst diejenige Einheit, die im Fokus des Vergleichs steht und zu einem bereits bestehenden Wert gleichgesetzt wird (zu dem KE ""Bezugswert""). Das KE ""Dimension"" benennt dabei die Skala des Vergleichs, d.h. es gibt genauer an, in welcher Hinsicht ""Verglichenes"" und ""Bezugswert"" gleichgesetzt werden (X ist so groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe').","['"" "" "" Probleme über Probleme - die NFL versagt mit ihrem Krisen - Management schwer "" "" , urteilte die "" "" USA Today "" "" kurz vor dem Finale auf ihrer ersten Sportseite und stellte ein großes Foto dazu , das einen explodierenden Football zeigt . ""']","[""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln - ich habe es immer"", ""Meine Kugeln über Kugeln -ich habe es immer"", ""Meine Kugeln über Kugeln -ich habe es immer"", ""Meine Kugeln über Kugeln -ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer"", ""Meine Kugeln über Kugeln-ich habe es immer""]",0.031705,0.084256,0.392293,0.516959,0.001330,0.000879


In [90]:
print("Levenshtein ratio:")
print(examples[2]["2_ex_gen_levenshtein"].mean())
print(examples[2]["2_ex_gen_levenshtein"].std())
print("-----")
print(examples[2]["2_def_gen_levenshtein"].mean())
print(examples[2]["2_def_gen_levenshtein"].std())
print("=====")
print("Jaro-Winkler similarity score:")
print(examples[2]["2_ex_gen_jaro_winkler"].mean())
print(examples[2]["2_ex_gen_jaro_winkler"].std())
print("-----")
print(examples[2]["2_def_gen_jaro_winkler"].mean())
print(examples[2]["2_def_gen_jaro_winkler"].std())
print("=====")
print("BLEU score:")
print(examples[2]["2_ex_gen_bleu"].mean())
print(examples[2]["2_ex_gen_bleu"].std())
print("-----")
print(examples[2]["2_def_gen_bleu"].mean())
print(examples[2]["2_def_gen_bleu"].std())
examples[2]

Levenshtein ratio:
0.031095286256492386
0.015107604348162322
-----
0.14181002538542156
0.07559574531738042
=====
Jaro-Winkler similarity score:
0.4626004951772992
0.08052875419973504
-----
0.5337409359706476
0.023204684842052167
=====
BLEU score:
0.015225751105127704
0.008972366771576337
-----
0.009336242785646594
0.006800328622785435


Unnamed: 0,definition,examples,generated,2_ex_gen_levenshtein,2_def_gen_levenshtein,2_ex_gen_jaro_winkler,2_def_gen_jaro_winkler,2_ex_gen_bleu,2_def_gen_bleu
10,"Die ""Negation:NEG_XgeschweigedennY-Konstruktion"" korreliert zwei Propositionen, die jeweils einen Punkt auf einem pragmatisch definiertem Maßstab markieren. Die erste Proposition ist pragmatisch stärker als die zweite Proposition; so zieht, pragmatisch betrachtet, die Wahrheit der ersten Proposition automatisch die Wahrheit der zweiten Proposition nach sich. Einfacher ausgedrückt: Ist die erste Proposition wahr, so muss die zweite Proposition ebenfalls wahr sein. Die erste Proposition ist darüber hinaus auch informativer als die zweite Proposition, da die erstgenannte pragmatisch betrachtet die letztgenannte einschließt, während diese wiederum die diskursrelevantere der beiden Propositionen ist. Die Konstruktion umfasst das konstruktionsevozierende Element (KEE) ""geschweige_denn"", die internen Kern-Konstruktionselemente (Kern-KE) ""Erstes_Konjunkt"" und ""Zweites_Konjunkt"" sowie die externen Kern-KE ""Negator"" und ""Fokuskontext"". Das ""Erste_Konjunkt"" geht dem ""KEE"" voraus, auf welches das ""Zweite_Konjunkt"" folgt. Der informationsstrukturelle Fokus liegt auf dem ""Ersten_Konjunkt"", das die Basis für den entstehenden Kontrast zwischen den zwei Propositionen bildet. Das ""Erste_Konjunkt"" und das ""Zweite_Konjunkt"" bilden jeweils einen Teil der beiden Propositionen ab, wobei das ""Erste_Konjunkt"" meist zusätzlih vom ""Negator"" negiert wird. Der ""Fokuskontext"" indiziert in der Regel den Rest der Proposition. Werden beide Konjunkte im Wechsel mit dem ""Fokuskontext"" kombiniert, können die einander gegenübergestellten Propositionen vollständig wiederhergestellt (oder: vervollständigt) werden. Im Gegensatz zum ""Ersten_Konjunkt"" und ""Zweiten_Konjunkt"" muss der ""Fokuskontext"" nicht zwangsläufig realisiert werden – wird der ""Fokuskontext"" nicht realisiert, drücken die beiden Konjunkte jeweils vollständige Propositionen aus. "" Die zwei gegenübergestellten Propositionen sind hier die beiden Aussagen, dass die meisten von ihnen zuvor noch nie einen Computer a) gesehen und b) bedient haben. Die Verwendung der ""Negation:NEG_XgeschweigedennY-Konstruktion"" erfordert die Einstufung von Sehen und Bedienen auf einer 'pragmatischen Skala', was dazu führt, dass die Aussage Die meisten von ihnen haben zuvor noch nie einen Computer bedient als 'größere' Behauptung betrachtet werden muss als Die meisten von ihnen haben zuvor noch nie einen Computer gesehen. Mit anderen Worten: Wenn die meisten von ihnen einen Computer zuvor noch nie gesehen haben, dann haben sie ihn ganz sicher auch nicht bedient bzw. wenn sie einen Computer noch nie gesehen haben, können sie diesen auch nicht bedient haben. Proposition a) schließt Proposition b) somit aus. Unter dem Aspekt der Negation wird die erste Proposition Die meisten von ihnen haben zuvor noch nie einen Computer gesehen damit zur stärkeren der beiden kontrastierten Propositionen.","['Es geht um das Bauprogramm des rot - grünen Senats .', 'Im Grunde war es Amerikas Konservativen gelungen , dem Gegner ihre eigene populistische Erzählung einzuflößen : dass die USA eben ein Mitte - rechts - Land seien und die abgehobenen Küsten - Eliten keine Ahnung hätten vom Leben und Denken des amerikanischenheartland .']","[""Die Schüler des künstenstudentischen Fachbereichs müssen sich ständig über ihre Prüfungsleistungen beschweren, aber der Kunstdekan sagt ihnen stets, dass sie es schon selbst machen können"", ""Erstens sagte der Lehrer nicht mal etwas, dann kam sie einfach zu spät, und dann war sie doch zu früh dran"", ""Das neue Musikvideo des Popstars war ganz in der Art wie man es von ihm erwartet hatte, genauso wie es in den Jahren zuvor immer wieder so war""]",0.012698,0.093497,0.560966,0.530770,0.003377,0.002566
100,"Die ""Äquativ_Plural-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Entitäten an, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""gleich"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit), und den beiden Kern-Konstruktionselementen (KE) ""Verglichene_Entitäten"" und ""Dimension"". Dabei umfasst das KE ""Verglichene_Entitäten"" diejenigen Einheiten, die hinsichtlich eines bestimmten Wertes einer durch die Vergleichskategorie definierten Skala gleichgesetzt werden. Die Skala wird dabei durch die ""Dimension"" angezeigt (X und Y sind gleich groß vergleicht zum Beispiel X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht sich die Einheiten (""Verglichene_Entitäten"") gleichen.","['Einmal sucht ein armer Kerl im Vollrausch Streit mit zwei Entgegenkommenden , sie ignorieren ihn , er blickt ihnen lange nachdenklich hinterher .', 'Dieses finanzsymbiotische Verhältnis – Amerika kauft Produkte aus chinesischen Fabriken , China räumt Amerika unbegrenzt Kredit ein – hat den USA lange Zeit genutzt .']","[""Die Tatsache, dass dieser Anruf in der Nacht eintrat, führte zu einer unerwarteten Überraschung"", ""Der Sinn dieser Übereinkunft besteht darin, den Fortschritt der Firma zu steuern""]",0.019204,0.147931,0.513913,0.531717,0.007721,0.004790
1004,"Die ""Superlativ_Klimax:ADJ1_ADJ1-er_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt primär durch die Wiederholung der in höchstem Maße zutreffenden Eigenschaft; zunächst im Positiv und dann im Komparativ. Anstelle einer Superlativform steht zuletzt die polar eingeordnete Entität. Die Zuweisung erfolgt auch durch den Vergleich der Entität mit einer immer impliziten Gesamtheit. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Das konstruktionsevozierende Element (KEE) ""-er"" bildet gemeinsam mit der wiederholten ""Dimension"" den Komparativ; durch die Struktur der Konstruktion, die der klassischen dreiteiligen Steigerungsform von Verben (X, X-er, am X-sten) nachempfunden ist, wird die superlative Bedeutung, die das dritte Verb innehat, auf das ""Verglichene"" übertragen, das an seiner Stelle steht. Neben den internen Kern-Konstruktionselementen (Kern-KE) ""Dimension"" und ""Verglichenes"" besteht die Konstruktion aus einer immer nullinstantiierten weil nie ausgedrückten ""Vergleichsmenge"", auf die implizit verwiesen wird. "" Groß, größer, RTL lässt sich paraphrasieren mit RTL ist am größten [von allen].","['Wissenschafter der Regierung sind zum Schluss gekommen , dass mit der Installation von 400 000 Solarspiegeln der Lebensraum der Wüstenschildkröten verloren ginge .', '"" Eine Gruppe von Rabbinern im spanischen Toledo importiere heimlich ein tödliches Gift aus Arabien , fülle es in "" Säcklein "" und organisiere die Verteilung an Agenten . ""']","[""Die Lehrerinnen betonen den Zweck der neuen Mathe-App"", ""Das neue Gesetz erklärt die Schaffung neuer Arbeitsplätze"", ""Die Künstlerin entwickelt eine neue Methode zum Gestalten von Kunstwerken""]",0.026001,0.085488,0.449454,0.541227,0.007630,0.005601
1006,"Die ""Superlativ:PRÄP_ADJ-ster_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt durch den Vergleich einer Entität mit einer impliziten Gesamtheit. Die ""Präposition"" steht stets vor der meist als Adjektiv realisierten ""Dimension"", an die das konstruktionsevozierende Element (KEE) ""(e)st"" angehangen wird. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Neben der ""Präposition"", dem ""KEE"" und der ""Dimension"" besteht die Konstruktion aus zwei weiteren Kern-Konstruktionselementen (Kern-KE): dem ""Verglichenen"" (die Entität, der eine durch die ""Dimension"" ausgedrückte Eigenschaft in vollem Ausmaß zugewiesen wird) und der ""Vergleichsmenge"" (die stets implizite Menge an Entitäten, die über die selbe Eigenschaft in geringerem Ausmaß verfügen).","['Der LSD - Rausch hat mich bisher am meisten begeistert .', 'Und am meisten genervt von Gabriels Interviews und Einlassungen zur Lage der SPD ist Martin Schulz .']","[""Ammie hat am wenigsten schlecht geübt, als sie schwanger war."", ""Heidi hat am meisten geübt, als sie schwanger war.""]",0.028251,0.106301,0.461476,0.522122,0.019687,0.014011
101,"Die ""Äquativ:ADJwieNP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Die Besonderheit der Konstruktion besteht darin, dass einer Entität ein Wert auf der Skala zugewiesen wird, der vom durchschnittlich erwartbaren Wert abweicht. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""wie"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit) und den drei Kern-Konstruktionselementen (KE) ""Dimension"", ""Verglichenes"" und ""Bezugswert"". Das ""Verglichene"" und der ""Bezugswert"" sind die Einheiten, die in Bezug auf bestimmte Werte spezifischer Attribute auf einer Skala verglichen werden. Die Skala wird durch die ""Dimension"" angezeigt (X ist groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht das Element im Fokus (""Verglichenes"") zu einem bestehenden Wert (""Bezugswert"") gleichgesetzt wird.","['Umstritten , weil es sich die Politik einst von den Sportlobbyisten diktieren lassen hat .', 'Die Verantwortung der Länder für die Hochschulen bleibt unberührt , doch kann der Bund künftig besser , weil langfristig , unterstützen .']","[""Umstritten, weil es sich die Politik einst von den Sportlobbyisten diktieren lassen hat."", ""Die Verantwortung der Länder für die Hochschulen bleibt unberührt, doch kann der Bund künftig besser, weil langfristig, unterstützen."", ""Das Problem der Umweltbelastung ist schwerwiegendeckend, weil sich die Industrie in der Vergangenheit hauptsächlich auf Qualität und Quantität konzentriert hat.""]",0.015125,0.189286,0.583017,0.539407,0.012081,0.007974
...,...,...,...,...,...,...,...,...,...
97,"Die ""Komparativ:ADJ1-eralsADJ1-Konstruktion"" gehört zu den Vergleichskonstruktionen. Die Konstruktion wird formal mit einem Komparativ realisiert, hat allerdings eine superlativische Bedeutung. Wie bei anderen Vergleichskonstruktionen setzt sich auch diese aus den drei Kern-Konstruktionselementen (KE) ""Verglichenes"", ""Bezugswert"" und ""Dimension"" zusammen. Genauer wird dabei eine zu vergleichende Entität, das ""Verglichene"", hinsichtlich eines konkreten Attributs (der ""Dimension"" des Vergleichs) zu einem ""Bezugswert"" auf einer imaginären Skala in Relation gesetzt. Die ""Dimension"" benennt dabei die Skala, die dem Vergleich zugrundeliegt. Dadurch, dass das die ""Dimension"" anzeigende Adjektiv im Komparativ nicht zugleich als ""Bezugswert"" fungiert und mithin den Orientierungswert für den Vergleich markieren kann, erhält die Konstruktion die für sie spezifische metasprachliche Funktion. Ihre Funktion besteht darin, auf der durch die ""Dimension"" angezeigten imaginären Skala auf einen Wertebereich zu verweisen, der jenseits des ""Bezugswertes"" liegt, den die verwendete lexikalische Kategorie benennt: Heller als hell bedeutet demnach 'heller als der Wert, den das Adjektiv hell auf der Skala markiert'. Der angezeigte Bereich gilt in der Folge als exorbitant hoch. So wird die durch das Adjektiv kodierte Eigenschaft dem ""Verglichenen"" in einem besonders hohen Maße attestiert; so ist 'ein Licht, das heller ist als hell', besonders hell.","['Denn das mit Abstand wichtigste Thema der Autobranche , das längst Millionen Menschen bewegt , war dem Chef der PS - Branche keine Erwähnung wert : die Zukunft des Verbrennungsmotors .', 'Da diese Trios die mit Abstand am stärksten vertretene Besucher - und Traurigkeitsspezies bilden , die Kernzielgruppe der Venus vermutlich , lohnt es sich , noch kurz bei ihnen zu verweilen .']","[""Denn das mit Abstand längst wichtigste Ziel der Politik ist die Umweltzerstörung. Die Regierung scheint dies jedoch nicht verstehen."",""Da das mit Abstand kraftvollste Ziel des Lebens das Erreichen der Befreiung von Sinnlosigkeit ist. Es ist eine Art Nachfrage, die einen größeren Bedarf an Selbstreflexion und Selbsttranszendenz erfordert.""]",0.011354,0.176099,0.584927,0.550501,0.018559,0.017219
973,"Bei ""Disjunktion_Doppeltitel:XoderY"" handelt es sich um eine Konstruktion, welche in ihrer spezifischen Funktionalität ausschließlich als Titel erscheint und damit als kommunikative Ressource der geschriebenen Sprache fungiert. Als Titel bzw. Überschrift stellen Instanzen des Musters Leseanleitungen dar, deren Besonderheit darin besteht, dass sie in Form der Disjunktion zwei Möglichkeiten präsentieren, unter denen der nachfolgende Text zu lesen ist (vgl. Finkbeiner/Tienken 2018: 268). Diese metalinguistische Interpretation ergibt sich daraus, dass die Koordinationsphrase, in der der Konnektor ""oder"" mit ""Disjunkt_1"" und ""Disjunkt_2"" zwei voneinander unabhängige Phrasen verknüpft, nicht propositional im Sinne einer Alternativfrage interpretiert wird, als sei eine Wahl zwischen zwei Sachverhalten bzw. Entitäten zu treffen (im Sinne von: In diesem Text geht es entweder um Christoph Columbus oder um Die Entdeckung Amerikas), sondern vielmehr so, dass die Disjunkte zwei Formulierungsalternativen für ein- und denselben Sachverhalt bereitstellen, die als äquivalent gelten und gleichermaßen zutreffen (im Sinne von: In diesem Text geht es um Christoph Columbus oder anders gesagt um Die Entdeckung Amerikas) (vgl. Finkbeiner/Tienken 2018: 260). Neben der spezifischen Kontext-Restriktion, als Titelformat ausschließlich an die sequenzielle Position der Überschrift gebunden zu sein, ist die Kxn in dreifacher Hinsicht restringiert (vgl. Finkbeiner/Tienken 2018: 259-262): 1) Zum einen liegt eine Nicht-Gleichartigkeitsbeschränkung der Disjunkte vor, insofern diese in der Regel durch unterschiedliche syntaktische Phrasenstrukturen (z.B. EN und NP oder NP und w-VL-Satz) oder bei einer identischen Phrasenstruktur (z.B. NP und NP) durch unterschiedliche Mikrostrukturen realisiert werden (z.B. eine NP mit präpositionalem Attribut und eine NP mit Genitivattribut). ""2) Zweitens gibt es eine klare Restriktion hinsichtlich der Reihenfolge der Disjunkte: So fungiert innerhalb der Kxn das beim linearen Lesen später aufgenommene zweite Disjunkt als explizierender Zusatz zum ersten Disjunkt. Der Y-Slot zeichnet sich somit durch ein semantisches Explikationspotenzial zum X-Slot aus, was tendenziell mit einer syntaktisch größeren Komplexität von ""Disjunkt_2"" einhergeht (z.B. EN vor NP oder NP vor w-VL-Satz). ""3) Da sich die Disjunkte normalerweise auf denselben generellen Aspekt des Bezugstextes (meistens das Thema) beziehen, unterliegen sie drittens einer Äquivalenzbeschränkung. Kombinationen von Disjunkten, die auf unterschiedliche Eigenschaften des Textes bezogen sind (z.B. thematische Charakterisierung und Textsortencharakterisierung) werden von der Kxn nicht lizensiert (vgl. Der Fall Ecstasy oder Eine Essaysammlung). ""","['Jan Ullrich ist der neue Boris Becker .', '"" Pünktlichkeit ist die neue Unpünktlichkeit . ""']","[""Ich habe meine Altersrolle vertauscht mit dem Hund."", ""Die Kürzung des Arbeitszeitrahmens ist das neue Wochenende."", ""Die Verwendung von Smartphones ist das neue Lesen von Büchern."", ""Einfache Lebensmittelzubereitung ist das neue Kochen."", ""Zitronen sind das neue Obst."", ""Lasern in der Kosmetik ist das neue Bootsmauschen.]",,,,,0.022913,0.016371
976,"Bei ""Korrelation_Affirmation:WoXist, istY"" handelt es sich um eine verfestigte, nicht völlig kompositionelle und produktive Phrasem-Konstruktion (PhK) des Deutschen, die neben einem kleinen Set an usuellen Sprichwort-Realisierungen eine große Menge an okkasionellen Bildungen lizensiert. Aus syntaktischer Sicht handelt es sich um ein satzwertiges Strukturmuster der Form Wo X ist, ist Y, das aus zwei Teilsätzen (lokaler Adverbialsatz und Hauptsatz) besteht. Während mit dem Adverb ""wo"", und den beiden Verbformen ""ist"" drei Positionen lexikalisch gefüllt sind, welche im Verbund die PhK evozieren, fungieren mit X (""Entität_1"") und Y (""Entität_2"") zwei nominale Positionen als variabel, aber nicht beliebig zu besetzende Slots. Aus semantischer Sicht bringt die PhK eine Korrelation zwischen zwei Entitäten oder Sachverhalten zum Ausdruck, die einer affirmativen Existenzquantifikation entspricht: So gilt: 'Wenn es (irgendwo) X gibt, dann gibt es (dort) typischerweise auch Y' (z.B. für Wo Licht ist, ist auch Schatten: Wenn es irgendwo Licht gibt, dann muss es dort auch Schatten geben, bzw. im übertragenen Sinne: Wenn es etwas Positives gibt, dann gibt es typischerweise auch etwas Negatives) (vgl. Steyer 2012: 309).","['Sonne pur gibt es allerdings nicht .', 'Denn das ist Karneval pur - auf brasilianische Art .']","[""Das ist Karneval pur - auf brasilianische Art.""]",0.036791,0.067770,0.512455,0.527030,0.025663,0.018147
98,"Die ""Äquativ:soADJwieXP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Das konstruktionsevozierende Element (KEE) kann entweder durch ""so"", ""genauso"", ""ebenso""oder (selten) ""gleich"" realisiert werden und gibt an, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit). Neben dem KEE besteht der Vergleichsausdruck außerdem aus drei Kern-Konstruktionselementen (KE). Das KE ""Verglichenes"" umfasst diejenige Einheit, die im Fokus des Vergleichs steht und zu einem bereits bestehenden Wert gleichgesetzt wird (zu dem KE ""Bezugswert""). Das KE ""Dimension"" benennt dabei die Skala des Vergleichs, d.h. es gibt genauer an, in welcher Hinsicht ""Verglichenes"" und ""Bezugswert"" gleichgesetzt werden (X ist so groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe').","['Probleme über Probleme - und auch noch künstlich erzeugt .', 'Probleme über Probleme also ; aber noch sind ja fünf Jahre Zeit .']","[""Probleme über Probleme - und auch noch künstlich erzeugt."", ""Probleme über Probleme also ; aber noch sind ja fünf Jahre Zeit.""]",0.029271,0.109730,0.454120,0.501760,0.020853,0.014179


In [91]:
# TODO Has only 86 rows instead of 211
print("Levenshtein ratio:")
print(examples[3]["3_ex_gen_levenshtein"].mean())
print(examples[3]["3_ex_gen_levenshtein"].std())
print("-----")
print(examples[3]["3_def_gen_levenshtein"].mean())
print(examples[3]["3_def_gen_levenshtein"].std())
print("=====")
print("Jaro-Winkler similarity score:")
print(examples[3]["3_ex_gen_jaro_winkler"].mean())
print(examples[3]["3_ex_gen_jaro_winkler"].std())
print("-----")
print(examples[3]["3_def_gen_jaro_winkler"].mean())
print(examples[3]["3_def_gen_jaro_winkler"].std())
print("=====")
print("BLEU score:")
print(examples[3]["3_ex_gen_bleu"].mean())
print(examples[3]["3_ex_gen_bleu"].std())
print("-----")
print(examples[3]["3_def_gen_bleu"].std())
print(examples[3]["3_def_gen_bleu"].mean())
examples[3]

Levenshtein ratio:
0.034333218863796866
0.014902791283742334
-----
0.13613946281007325
0.07115746249762238
=====
Jaro-Winkler similarity score:
0.44450024925406706
0.08092171452502514
-----
0.533688222498089
0.0213815992721509
=====
BLEU score:
0.014347835961160064
0.009868158369067197
-----
0.006438493847598917
0.008554543335161037


Unnamed: 0,definition,examples,generated,3_ex_gen_levenshtein,3_def_gen_levenshtein,3_ex_gen_jaro_winkler,3_def_gen_jaro_winkler,3_ex_gen_bleu,3_def_gen_bleu
10,"Die ""Negation:NEG_XgeschweigedennY-Konstruktion"" korreliert zwei Propositionen, die jeweils einen Punkt auf einem pragmatisch definiertem Maßstab markieren. Die erste Proposition ist pragmatisch stärker als die zweite Proposition; so zieht, pragmatisch betrachtet, die Wahrheit der ersten Proposition automatisch die Wahrheit der zweiten Proposition nach sich. Einfacher ausgedrückt: Ist die erste Proposition wahr, so muss die zweite Proposition ebenfalls wahr sein. Die erste Proposition ist darüber hinaus auch informativer als die zweite Proposition, da die erstgenannte pragmatisch betrachtet die letztgenannte einschließt, während diese wiederum die diskursrelevantere der beiden Propositionen ist. Die Konstruktion umfasst das konstruktionsevozierende Element (KEE) ""geschweige_denn"", die internen Kern-Konstruktionselemente (Kern-KE) ""Erstes_Konjunkt"" und ""Zweites_Konjunkt"" sowie die externen Kern-KE ""Negator"" und ""Fokuskontext"". Das ""Erste_Konjunkt"" geht dem ""KEE"" voraus, auf welches das ""Zweite_Konjunkt"" folgt. Der informationsstrukturelle Fokus liegt auf dem ""Ersten_Konjunkt"", das die Basis für den entstehenden Kontrast zwischen den zwei Propositionen bildet. Das ""Erste_Konjunkt"" und das ""Zweite_Konjunkt"" bilden jeweils einen Teil der beiden Propositionen ab, wobei das ""Erste_Konjunkt"" meist zusätzlih vom ""Negator"" negiert wird. Der ""Fokuskontext"" indiziert in der Regel den Rest der Proposition. Werden beide Konjunkte im Wechsel mit dem ""Fokuskontext"" kombiniert, können die einander gegenübergestellten Propositionen vollständig wiederhergestellt (oder: vervollständigt) werden. Im Gegensatz zum ""Ersten_Konjunkt"" und ""Zweiten_Konjunkt"" muss der ""Fokuskontext"" nicht zwangsläufig realisiert werden – wird der ""Fokuskontext"" nicht realisiert, drücken die beiden Konjunkte jeweils vollständige Propositionen aus. "" Die zwei gegenübergestellten Propositionen sind hier die beiden Aussagen, dass die meisten von ihnen zuvor noch nie einen Computer a) gesehen und b) bedient haben. Die Verwendung der ""Negation:NEG_XgeschweigedennY-Konstruktion"" erfordert die Einstufung von Sehen und Bedienen auf einer 'pragmatischen Skala', was dazu führt, dass die Aussage Die meisten von ihnen haben zuvor noch nie einen Computer bedient als 'größere' Behauptung betrachtet werden muss als Die meisten von ihnen haben zuvor noch nie einen Computer gesehen. Mit anderen Worten: Wenn die meisten von ihnen einen Computer zuvor noch nie gesehen haben, dann haben sie ihn ganz sicher auch nicht bedient bzw. wenn sie einen Computer noch nie gesehen haben, können sie diesen auch nicht bedient haben. Proposition a) schließt Proposition b) somit aus. Unter dem Aspekt der Negation wird die erste Proposition Die meisten von ihnen haben zuvor noch nie einen Computer gesehen damit zur stärkeren der beiden kontrastierten Propositionen.","['»Ohne Europa sind viele Fragen nicht mehr seriös in Angriff zu nehmen , geschweige denn zu lösen« , meint der grüne Bundesparteisekretär Lothar Lockl .', 'Bis heute sind viele dieser Untaten , dieser Massaker an der »Heimatfront« , kaum aufgeklärt , geschweige denn im öffentlichen Gedächtnis präsent .', 'Plötzlich konnte Quelle keine Rechnung mehr bezahlen , geschweige denn den Hauptkatalog für den Herbst und Winter finanzieren .']","[""Ich habe heute eine Socke verloren , geschweige denn den ganzen Tag"", ""Das Auto, das ich gekauft habe, war zu teuer , geschweige denn zu ungerechtfertigt"", ""Ich habe gestern viel gegessen , geschweige denn zu viel""]",0.024875,0.046342,0.494391,0.522728,0.006056,0.005041
100,"Die ""Äquativ_Plural-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Entitäten an, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""gleich"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit), und den beiden Kern-Konstruktionselementen (KE) ""Verglichene_Entitäten"" und ""Dimension"". Dabei umfasst das KE ""Verglichene_Entitäten"" diejenigen Einheiten, die hinsichtlich eines bestimmten Wertes einer durch die Vergleichskategorie definierten Skala gleichgesetzt werden. Die Skala wird dabei durch die ""Dimension"" angezeigt (X und Y sind gleich groß vergleicht zum Beispiel X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht sich die Einheiten (""Verglichene_Entitäten"") gleichen.","['Sicherheitsgefühl und objektive Sicherheit seien für die Lebensqualität gleich wichtig .', 'Wir haben schweizweit eine Patt - Situation , weil der linke und der rechte Block gleich stark sind .', 'Bis auf wenige Millimeter sind die Geräte praktisch gleich groß .']","[""Die äquative Pluralkonstruktion zeigt die Gleichheit zweier Einheiten, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden."", ""Die äquative Pluralkonstruktion zeigt die Gleichheit zweier Einheiten, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden."", ""Die äquative Pluralkonstruktion zeigt die Gleichheit zweier Einheiten, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden.""]",0.009958,0.315606,0.588034,0.585430,0.008671,0.005410
1004,"Die ""Superlativ_Klimax:ADJ1_ADJ1-er_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt primär durch die Wiederholung der in höchstem Maße zutreffenden Eigenschaft; zunächst im Positiv und dann im Komparativ. Anstelle einer Superlativform steht zuletzt die polar eingeordnete Entität. Die Zuweisung erfolgt auch durch den Vergleich der Entität mit einer immer impliziten Gesamtheit. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Das konstruktionsevozierende Element (KEE) ""-er"" bildet gemeinsam mit der wiederholten ""Dimension"" den Komparativ; durch die Struktur der Konstruktion, die der klassischen dreiteiligen Steigerungsform von Verben (X, X-er, am X-sten) nachempfunden ist, wird die superlative Bedeutung, die das dritte Verb innehat, auf das ""Verglichene"" übertragen, das an seiner Stelle steht. Neben den internen Kern-Konstruktionselementen (Kern-KE) ""Dimension"" und ""Verglichenes"" besteht die Konstruktion aus einer immer nullinstantiierten weil nie ausgedrückten ""Vergleichsmenge"", auf die implizit verwiesen wird. "" Groß, größer, RTL lässt sich paraphrasieren mit RTL ist am größten [von allen].","['Groß , größer , Istanbul', 'Hoch , höher , Holzdeppe :', '23. Juni 1999 Dumm , dümmer , Duden Der Bürger und die Arroganz der Macht :']","[""Lang , länger , die Woche"", ""Schwer , schwerer , die Woche"", ""Kalt , kälter , der Winter"", ""Zart , zarter , die Rose"", ""Stark , stärker , das Auto"", ""Schön , schöner , das Mädchen""]",0.041453,0.038041,0.290895,0.522073,0.005865,0.004691
1006,"Die ""Superlativ:PRÄP_ADJ-ster_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt durch den Vergleich einer Entität mit einer impliziten Gesamtheit. Die ""Präposition"" steht stets vor der meist als Adjektiv realisierten ""Dimension"", an die das konstruktionsevozierende Element (KEE) ""(e)st"" angehangen wird. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Neben der ""Präposition"", dem ""KEE"" und der ""Dimension"" besteht die Konstruktion aus zwei weiteren Kern-Konstruktionselementen (Kern-KE): dem ""Verglichenen"" (die Entität, der eine durch die ""Dimension"" ausgedrückte Eigenschaft in vollem Ausmaß zugewiesen wird) und der ""Vergleichsmenge"" (die stets implizite Menge an Entitäten, die über die selbe Eigenschaft in geringerem Ausmaß verfügen).","['Im besten Fall reicht eine mit weißer Farbe markierte Mittelinsel .', 'Dass eine Abstimmung nun erneut in größter Eile erfolgen müsste , macht die Sache nicht besser .', 'Maximilian Philipp hatte vor der Saison keiner auf der Rechnung , am Samstag traf der Ex-Freiburger zweimal nach bester Stürmerart .']","[""In diesem Bereich schafft es keiner seiner Schüler, auf dem höchsten Niveau zu bestehen."", ""In Bezug auf die Qualität der Arbeit steht sie an der Spitze der Klasse."", ""Das ist die beste Leistung, die wir bisher erbracht haben.""]",0.022998,0.133713,0.481087,0.528425,0.016634,0.011321
101,"Die ""Äquativ:ADJwieNP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Die Besonderheit der Konstruktion besteht darin, dass einer Entität ein Wert auf der Skala zugewiesen wird, der vom durchschnittlich erwartbaren Wert abweicht. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""wie"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit) und den drei Kern-Konstruktionselementen (KE) ""Dimension"", ""Verglichenes"" und ""Bezugswert"". Das ""Verglichene"" und der ""Bezugswert"" sind die Einheiten, die in Bezug auf bestimmte Werte spezifischer Attribute auf einer Skala verglichen werden. Die Skala wird durch die ""Dimension"" angezeigt (X ist groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht das Element im Fokus (""Verglichenes"") zu einem bestehenden Wert (""Bezugswert"") gleichgesetzt wird.","['Das Nichts steckt in einer Hülle aus Edelstahl , gewaltig wie ein Blauwal .', 'Bloß gut , dass die kleine Charlotte jetzt in den Kindergarten kommt , das ist für mich eine versöhnliche Szene in der großen Oper ZWOTAUSENDSIEBZEHN , wir sitzen gerührt in unseren Polsterstühlen und sogar die Störer verstummen , wenn die kleine Charlotte , die Tochter von Prince William und seiner Kate , ihre Morgenmilch aus einer kleinen Tasse mit abgespreiztem Finger trinkt , ja , da ist die Welt noch in Ordnung ingood old Britain , vollkommen überschätzt dieser Brexit , wir Sachsen lieben ja die Monarchien , und es tritt auf : die Diva , die heimliche Königin der Sachsen , NEIN , NICHT DIE MERKEL ! , unsere Victoria , schwedischer Sopran , grazil wie ein Schwan , Victoria liebt Leipzig und war wieder mal da in diesem Herbst ( Die Bild : "" "" . . . schlicht - rosa Hosenanzug , die Haare zum praktischen Knoten zusammengesteckt . "" ""', 'Er legte ein Dossier dazu , umfangreich wie eine Diplomarbeit , und gab ihm einen Titel : "" "" Die Gefährdungssituation unserer afghanischen Söhne im Falle einer Rückkehr nach Afghanistan "" "" .']","[""Können wir uns einfach einverständlich sein?"", ""Seinem Schwiegervater kann man die Hand nicht bieten."", ""Das Auto rollt in die Ferne, wie ein verschwindender Schatten.""]",0.029525,0.094437,0.476806,0.525358,0.023327,0.015643
...,...,...,...,...,...,...,...,...,...
1630,"Die Konstruktion ""Gegenüberstellung:allenXzumTrotz"" ""ist eine lexikalisch teilspezifizierte Mehrworteinheit [...], die feste lexikalische Komponenten einerseits und variable Slots andererseits [enthält]"" (Speyer 2011). Sie beschreibt etwas (eine Situation oder einen Umstand), das nicht eingetroffen ist, obwohl es auf den ersten Blick so schien. Dabei kann die Erwartung entweder positiv, wobei der tatsächliche Ausgang dann eher negativ ist, oder negativ sein und der Ausgang dann eher positiv. Die Konstruktion setzt sich zusammen aus dem konstruktionsevozierenden Element (KEE) ""allen_zum_Trotz"", das die feste lexikalische Komponente darstellt, dem internen Kern-Konstruktionselement (Kern-KE) ""Umstand"", das den variablen Slot darstellt und dem externen Konstruktionselement ""Resultat"", das den unerwarteten positiven oder negativen Ausgang der Situation beschreibt.","['Fußball-Idol Uwe Seeler hat allen HSV-Krisen zum Trotz die Hoffnung nicht aufgegeben , noch einmal eine deutsche Meisterschaft seines Hamburger SV zu erleben .', 'Dieser Zuschnitt vermittelte – allen nihilistischen Implikationen zum Trotz – immer auch einen optimistischen Glauben an die Handlungskraft des Individuums .', 'Doch allen Äußerlichkeiten zum Trotz ist die britische Gesellschaft zutiefst gespalten , was spätestens seit dem EU-Referendum im vergangenen Jahr nicht mehr zu übersehen ist .']","[""Das Auto rettete mich trotz des schlechten Wetters allen Umständen zum Trotz"", ""Der Junge hatte allen Bedenken zum Trotz eine beeindruckende Karriere als Musiker geplant"", ""Der Film war ein voller Triumph, trotz aller möglichen Probleme und Herausforderungen allen Widerstand zum Trotz""]",0.019247,0.160831,0.522718,0.546038,0.005378,0.003461
1631,"Die Konstruktion ""Direktiv:jetztheißtesX"" gehört zu der Familie der Direktivkonstruktionen und drückt eine Aufforderung, bzw. Ermutigung des Sprechers/der Sprecherin zu einer Handlung aus. Sie beinhaltet das konstruktionsevozierende Element (KEE) ""jetztheißtes"", auf das das interne Kern-Konstruktionselement (Kern-KE) ""Direktiv"" folgt.","['Jetzt heisst es aufs Ganze gehen .', 'Jetzt heisst es Durchhalten , und da ahnen viele Bürger , dass dies kein Spaziergang , sondern ein langer und anstrengender Marsch werden wird .', 'Schon nach wenigen Metern strampeln die Füsse in der Luft , jetzt heisst es , bequem in den Sitz gerutscht und geniessen .']","[""Jetzt heisst es aufs Ganze gehen."", ""Jetzt heisst es aufs Ganze gehen."", ""Jetzt heisst es aufs Ganze gehen.""]",0.044306,0.151762,0.368752,0.526681,0.029489,0.017026
1634,"Die Konstruktion ""Reduplikation_Wortbildung_Ablautdoppelung:X-X"" gehört zu der Familie der Reduplikationskonstruktionen. Sie setzt sich aus den beiden externen Kern-Konstruktionselementen (Kern-KE) ""Basis"" und ""Reduplikant"" zusammen, wobei zwischen den beiden fast identischen Elementen ein Vokalwechsel stattfindet. Am häufigsten ist der Wechsel von i zu a zu finden. Die Reihenfolge der Kern-KE ist dabei nicht festgelegt. Die Konstruktion spiegelt in ihrem umgangsprachlichen Ton in der Regel eine Sprecher*inneneinstellung zu einem gewissen Thema wider.","['Schrotts gemütlicher Tonfall tendierte zu einem einschläfernden Singsang .', '«Es war ein überlegt konzipierter , wirtschaftlicher Wahlkampf ohne Luxus und Schnickschnack» .', '«Heiliger Bimbam , ist dieses Genf abgelegen , » stöhnte ein junger Appenzeller mit vorgetäuschter Verzweiflung am Dienstagvormittag , als die Bahn dem Genfersee entlang zockelte .']","[""Waschmaschinen-Maschinenmacher-Maschinen"", ""Kleingeschäfte-Kleingewerbe-Kleingewerbe"", ""Radfahrer-Räderhersteller-Räder""]",0.026331,0.108798,0.280082,0.520194,0.012872,0.007822
1636,"Die Konstruktion ""Reduplikation_Wortbildung_Reimdoppelung:X-X"" gehört zu der Familie der Reduplikationskonstruktionen. Sie setzt sich aus den beiden externen Kern-Konstruktionselementen (Kern-KE) ""Basis"" und ""Reduplikant"" zusammen, wobei zwischen den beiden fast identischen Elementen ein Wechsel der Anlautkonsonanten stattfindet. Häufig steht die ""Basis"" an erster Stelle, jedoch nicht immer. Zudem können in seltenen Fällen Fugenelemente dazutreten. "" Die Konstruktion spiegelt in ihrem umgangsprachlichen Ton in der Regel eine Sprecher*inneneinstellung zu einem gewissen Thema wider.","['Der Lausanner Karim Slama «Bittet um etwas Aufmerksamkeit» in der Kellerbühne - in einem herrlichen französisch-deutschen Kuddelmuddel .', 'Und das Obertoggenburg bräuchte sich zum Beispiel hinter «Silvretta Nova» nicht zu verstecken , wenn die Pisten von Wildhaus , Unterwasser und Alt St.Johann untereinander besser erschlossen , eine höhere Dichte von Transportbahnen vorhanden wäre und mit riesigen Restaurants , Diskotheken und Skibars der gleiche Klimbim veranstaltet würde wie auf den Montafoner Bergen .', 'Das «Schoren» ist eine Adresse für all jene , die gutes Essen nicht mit Schickimicki verwechseln , für all jene , die unaufgeregte Professionalität und Qualität problemlos erkennen .']","[""Die Hüsler-Kuh «Grau-Fuchs» in der Kartäusergasse - in einem herrlichen süddeutschen Kuddelmuddel."", 'Das «Neuschwanstein» ist eine Adresse für all jene, die gutes Essen nicht mit Schickimicki verwechseln', 'Das «Büchel» ist eine Adresse für all jene, die gutes Essen nicht mit Schickimicki verwechseln']",0.017840,0.221874,0.546124,0.547304,0.010921,0.005379


In [92]:
print("Levenshtein ratio:")
print(examples[4]["4_ex_gen_levenshtein"].mean())
print(examples[4]["4_ex_gen_levenshtein"].std())
print("-----")
print(examples[4]["4_def_gen_levenshtein"].mean())
print(examples[4]["4_def_gen_levenshtein"].std())
print("=====")
print("Jaro-Winkler similarity score:")
print(examples[4]["4_ex_gen_jaro_winkler"].mean())
print(examples[4]["4_ex_gen_jaro_winkler"].std())
print("-----")
print(examples[4]["4_def_gen_jaro_winkler"].mean())
print(examples[4]["4_def_gen_jaro_winkler"].std())
print("=====")
print("BLEU score:")
print(examples[4]["4_ex_gen_bleu"].mean())
print(examples[4]["4_ex_gen_bleu"].std())
print("-----")
print(examples[4]["4_def_gen_bleu"].mean())
print(examples[4]["4_def_gen_bleu"].std())
examples[4]

Levenshtein ratio:
0.03190687782678974
0.01492259518946007
-----
0.1408555667682497
0.07790412359102843
=====
Jaro-Winkler similarity score:
0.45233205587348757
0.0898420571678826
-----
0.5317466904772062
0.032186789019234247
=====
BLEU score:
0.012877489859857235
0.009029325108903996
-----
0.007695101040245497
0.0065866771410472156


Unnamed: 0,definition,examples,generated,4_ex_gen_levenshtein,4_def_gen_levenshtein,4_ex_gen_jaro_winkler,4_def_gen_jaro_winkler,4_ex_gen_bleu,4_def_gen_bleu
10,"Die ""Negation:NEG_XgeschweigedennY-Konstruktion"" korreliert zwei Propositionen, die jeweils einen Punkt auf einem pragmatisch definiertem Maßstab markieren. Die erste Proposition ist pragmatisch stärker als die zweite Proposition; so zieht, pragmatisch betrachtet, die Wahrheit der ersten Proposition automatisch die Wahrheit der zweiten Proposition nach sich. Einfacher ausgedrückt: Ist die erste Proposition wahr, so muss die zweite Proposition ebenfalls wahr sein. Die erste Proposition ist darüber hinaus auch informativer als die zweite Proposition, da die erstgenannte pragmatisch betrachtet die letztgenannte einschließt, während diese wiederum die diskursrelevantere der beiden Propositionen ist. Die Konstruktion umfasst das konstruktionsevozierende Element (KEE) ""geschweige_denn"", die internen Kern-Konstruktionselemente (Kern-KE) ""Erstes_Konjunkt"" und ""Zweites_Konjunkt"" sowie die externen Kern-KE ""Negator"" und ""Fokuskontext"". Das ""Erste_Konjunkt"" geht dem ""KEE"" voraus, auf welches das ""Zweite_Konjunkt"" folgt. Der informationsstrukturelle Fokus liegt auf dem ""Ersten_Konjunkt"", das die Basis für den entstehenden Kontrast zwischen den zwei Propositionen bildet. Das ""Erste_Konjunkt"" und das ""Zweite_Konjunkt"" bilden jeweils einen Teil der beiden Propositionen ab, wobei das ""Erste_Konjunkt"" meist zusätzlih vom ""Negator"" negiert wird. Der ""Fokuskontext"" indiziert in der Regel den Rest der Proposition. Werden beide Konjunkte im Wechsel mit dem ""Fokuskontext"" kombiniert, können die einander gegenübergestellten Propositionen vollständig wiederhergestellt (oder: vervollständigt) werden. Im Gegensatz zum ""Ersten_Konjunkt"" und ""Zweiten_Konjunkt"" muss der ""Fokuskontext"" nicht zwangsläufig realisiert werden – wird der ""Fokuskontext"" nicht realisiert, drücken die beiden Konjunkte jeweils vollständige Propositionen aus. "" Die zwei gegenübergestellten Propositionen sind hier die beiden Aussagen, dass die meisten von ihnen zuvor noch nie einen Computer a) gesehen und b) bedient haben. Die Verwendung der ""Negation:NEG_XgeschweigedennY-Konstruktion"" erfordert die Einstufung von Sehen und Bedienen auf einer 'pragmatischen Skala', was dazu führt, dass die Aussage Die meisten von ihnen haben zuvor noch nie einen Computer bedient als 'größere' Behauptung betrachtet werden muss als Die meisten von ihnen haben zuvor noch nie einen Computer gesehen. Mit anderen Worten: Wenn die meisten von ihnen einen Computer zuvor noch nie gesehen haben, dann haben sie ihn ganz sicher auch nicht bedient bzw. wenn sie einen Computer noch nie gesehen haben, können sie diesen auch nicht bedient haben. Proposition a) schließt Proposition b) somit aus. Unter dem Aspekt der Negation wird die erste Proposition Die meisten von ihnen haben zuvor noch nie einen Computer gesehen damit zur stärkeren der beiden kontrastierten Propositionen.","['Ohne seine suggestiv - erhabenen Orchesterkompositionen hätten Filme wie Star Wars , Indiana Jones und E . T . wohl kaum jene sensationelle Wirkung entfaltet , dank der sich nicht nur das gesamte Hollywood - System grundlegend veränderte – sondern auch der orchestral eingespielte , sinfonische Soundtrack wieder zur beliebtesten Form der Filmmusik wurde .', 'Jeder Rest dumm - fröhlicher Ostalgie wird hier weggeätzt .', 'Auch er steht einem schwarz - roten Bündnis kritisch gegenüber :', 'Diese Extras verleihen den bittersüß - melancholischen Balladen und schmissigen Rockernummern , zwischen denen das Album pendelt , mehr Tiefe .']","[""Es ist schwer, die Trennung zwischen dem harmonischen und melodischen Melodien zu machen."", ""Der Regen rutschte auf den hellen Asphalt herunter und verweht die einladenden Schatten.""]",0.019157,0.059155,0.523316,0.516992,0.015100,0.012575
100,"Die ""Äquativ_Plural-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Entitäten an, die hinsichtlich eines bestimmten Wertes eines spezifischen Attributs auf einer Skala miteinander verglichen werden. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""gleich"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit), und den beiden Kern-Konstruktionselementen (KE) ""Verglichene_Entitäten"" und ""Dimension"". Dabei umfasst das KE ""Verglichene_Entitäten"" diejenigen Einheiten, die hinsichtlich eines bestimmten Wertes einer durch die Vergleichskategorie definierten Skala gleichgesetzt werden. Die Skala wird dabei durch die ""Dimension"" angezeigt (X und Y sind gleich groß vergleicht zum Beispiel X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht sich die Einheiten (""Verglichene_Entitäten"") gleichen.","['Sie fand es albern , ich hielt es für Kunst : Möhre in Armeestiefeln , Möhre im Maul eines Rindes , Möhre am australischen Bondi Beach .', 'Sie lebte in Berlin , ich studierte in Ludwigsburg an der Schauspielschule .', 'Dieses finanzsymbiotische Verhältnis – Amerika kauft Produkte aus chinesischen Fabriken , China räumt Amerika unbegrenzt Kredit ein – hat den USA lange Zeit genutzt .', 'Elena steigt ins Bildungsbürgertum auf , Lila sinkt ins Proletariat ab .']","[""Der Computerprogrammierer hatte eine Woche lang keine Erholung gehabt"", ""Die Katze schläft auf der Matte und blinzelt nicht""]",0.027152,0.107777,0.454579,0.543450,0.011515,0.006958
1004,"Die ""Superlativ_Klimax:ADJ1_ADJ1-er_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt primär durch die Wiederholung der in höchstem Maße zutreffenden Eigenschaft; zunächst im Positiv und dann im Komparativ. Anstelle einer Superlativform steht zuletzt die polar eingeordnete Entität. Die Zuweisung erfolgt auch durch den Vergleich der Entität mit einer immer impliziten Gesamtheit. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Das konstruktionsevozierende Element (KEE) ""-er"" bildet gemeinsam mit der wiederholten ""Dimension"" den Komparativ; durch die Struktur der Konstruktion, die der klassischen dreiteiligen Steigerungsform von Verben (X, X-er, am X-sten) nachempfunden ist, wird die superlative Bedeutung, die das dritte Verb innehat, auf das ""Verglichene"" übertragen, das an seiner Stelle steht. Neben den internen Kern-Konstruktionselementen (Kern-KE) ""Dimension"" und ""Verglichenes"" besteht die Konstruktion aus einer immer nullinstantiierten weil nie ausgedrückten ""Vergleichsmenge"", auf die implizit verwiesen wird. "" Groß, größer, RTL lässt sich paraphrasieren mit RTL ist am größten [von allen].","['Wie die Ratskanzlei mitteilt , seien Patientinnen und Patienten des Psychiatrischen Zentrums Appenzell AR sowie aus dem Bezirk Oberegg davon ausgenommen , da für diese separate Verträge gelten .', 'Mag sein , daß du einen Moment lang glaubst , du seiest einer Sinnestäuschung erlegen .', '"" Es gehe jedoch nicht vorrangig darum , Beschleunigung durch Verlangsamung zu ersetzen , sondern vielmehr darum , die "" "" "" "" Vielfalt der Zeitformen zu erhalten , zu kultivieren und produktiv zu machen . ""', 'Die Standeskommission habe daher den Beschluss gefasst , die Vereinbarung betreffend der Übernahme der Betriebsdefizite von Sonderschulen aufzuheben .']","[""Es ist erforderlich"", ""Es ist hilfreich"", ""Es ist wichtig"", ""Es ist notwendig"", ""Es ist angenehm"", ""Es ist möglich"", ""Es ist sinnvoll""]",0.063417,0.024054,0.237875,0.523521,0.007411,0.005927
1006,"Die ""Superlativ:PRÄP_ADJ-ster_NP-Konstruktion"" gehört zu der Familie der Vergleichskonstruktionen und weist einem Wert die höchste Stufe auf einer Skala zu. Die Zuweisung erfolgt durch den Vergleich einer Entität mit einer impliziten Gesamtheit. Die ""Präposition"" steht stets vor der meist als Adjektiv realisierten ""Dimension"", an die das konstruktionsevozierende Element (KEE) ""(e)st"" angehangen wird. Die ""Dimension"" benennt die Skala des Vergleichs, d.h. die Skala, auf der einem Wert die höchste Stufe zugewiesen wird. Neben der ""Präposition"", dem ""KEE"" und der ""Dimension"" besteht die Konstruktion aus zwei weiteren Kern-Konstruktionselementen (Kern-KE): dem ""Verglichenen"" (die Entität, der eine durch die ""Dimension"" ausgedrückte Eigenschaft in vollem Ausmaß zugewiesen wird) und der ""Vergleichsmenge"" (die stets implizite Menge an Entitäten, die über die selbe Eigenschaft in geringerem Ausmaß verfügen).","['"" "" In dieser Jahreszeit ist die Aedes - Mücke , die das Virus überträgt , am wenigsten aktiv "" "" , erklärt Jelinek .', '"" "" Das war wahrscheinlich das Rennen meiner Karriere , auf das ich am meisten stolz bin .', 'Unter den Einwohnern der großen EU - Länder sind die Deutschen laut einer YouGov - Studie am wenigsten empfänglich für populistische Politik .', 'Am meisten entsetzt über die strategischen Fehler ist der Mann , der Schulz ausgesucht hatte : Sigmar Gabriel .']","[""Der Hund bellt am meisten und jagt am wenigsten"", ""Das Auto ist am meisten von Schrott und am wenigsten von Holz"", ""Am meisten Vielzahl an Pflanzen gibt es im Frühling und am wenigsten im Winter"", ""Am meisten Geräten kommt die Asiatenfamilie und am wenigsten die afrikanischen Völker""]",0.024948,0.123555,0.478133,0.538464,0.005049,0.002957
101,"Die ""Äquativ:ADJwieNP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Die Besonderheit der Konstruktion besteht darin, dass einer Entität ein Wert auf der Skala zugewiesen wird, der vom durchschnittlich erwartbaren Wert abweicht. Der Vergleichsausdruck besteht aus dem konstruktionsevozierenden Element (KEE) ""wie"", das angibt, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit) und den drei Kern-Konstruktionselementen (KE) ""Dimension"", ""Verglichenes"" und ""Bezugswert"". Das ""Verglichene"" und der ""Bezugswert"" sind die Einheiten, die in Bezug auf bestimmte Werte spezifischer Attribute auf einer Skala verglichen werden. Die Skala wird durch die ""Dimension"" angezeigt (X ist groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe'). Die ""Dimension"" gibt also genauer an, in welcher Hinsicht das Element im Fokus (""Verglichenes"") zu einem bestehenden Wert (""Bezugswert"") gleichgesetzt wird.","['( darf ja im Grunde nichts schlechtes schreiben über ihn , weil wegen Vortrag und so bla , bla )', 'Aber es ist ein Buch , was einem das Lachen gefrieren lässt doch auf eine gewisse Weise , weil es ist ein Buch über einen großen Menschen , der sein wichtigstes Instrument verloren hat , seine Größe auszudrücken , nämlich die Sprache .', 'Nein , das finde ich überhaupt nicht . Weil das ist der soziologische Untergrund für die ganzen Geschichten .', 'Nur weil man ein guter Mensch ist , kommt man da nicht weiter .']","[""Weil ich schlecht bin"", ""Dafür habe ich mich etwas eingeschuldet"", ""Denn das ist die beste Möglichkeit, um einen Job zu finden"", ""Weil ich es gerne tue""]",0.050074,0.064067,0.392643,0.524077,0.008008,0.005206
...,...,...,...,...,...,...,...,...,...
97,"Die ""Komparativ:ADJ1-eralsADJ1-Konstruktion"" gehört zu den Vergleichskonstruktionen. Die Konstruktion wird formal mit einem Komparativ realisiert, hat allerdings eine superlativische Bedeutung. Wie bei anderen Vergleichskonstruktionen setzt sich auch diese aus den drei Kern-Konstruktionselementen (KE) ""Verglichenes"", ""Bezugswert"" und ""Dimension"" zusammen. Genauer wird dabei eine zu vergleichende Entität, das ""Verglichene"", hinsichtlich eines konkreten Attributs (der ""Dimension"" des Vergleichs) zu einem ""Bezugswert"" auf einer imaginären Skala in Relation gesetzt. Die ""Dimension"" benennt dabei die Skala, die dem Vergleich zugrundeliegt. Dadurch, dass das die ""Dimension"" anzeigende Adjektiv im Komparativ nicht zugleich als ""Bezugswert"" fungiert und mithin den Orientierungswert für den Vergleich markieren kann, erhält die Konstruktion die für sie spezifische metasprachliche Funktion. Ihre Funktion besteht darin, auf der durch die ""Dimension"" angezeigten imaginären Skala auf einen Wertebereich zu verweisen, der jenseits des ""Bezugswertes"" liegt, den die verwendete lexikalische Kategorie benennt: Heller als hell bedeutet demnach 'heller als der Wert, den das Adjektiv hell auf der Skala markiert'. Der angezeigte Bereich gilt in der Folge als exorbitant hoch. So wird die durch das Adjektiv kodierte Eigenschaft dem ""Verglichenen"" in einem besonders hohen Maße attestiert; so ist 'ein Licht, das heller ist als hell', besonders hell.","['Ihre Partei , die Union , wird abermals zur mit Abstand stärksten Kraft .', 'Auch von der neuen Bundesregierung dürfte in dieser Hinsicht nicht allzu viel zu erwarten sein , obwohl Deutschland mit Abstand am stärksten von Steuervermeidung betroffen ist .', 'Danach sehen die Befragten derzeit das mit Abstand größte Problem beim Plastik im Meer .', 'Doch gleichzeitig ist man noch der mit Abstand größte Emittent von klimaschädlichem CO2 – in absoluten Zahlen , nicht pro Kopf – und das Land baut wegen des hohen Energiebedarfs weiterhin Kohlekraftwerke .']","[""Wenn sie mit Abstand hinsichtlich ihrer Leistung in Bezug auf die Konkurrenz bedenken, gehört sie zu den mit Abstand erfolgreichsten Unternehmen in ihrem Bereich."", ""In Bezug auf die Umweltbelastung ist das Unternehmen mit Abstand der größte Verursacher in der Region."", ""Der Bauvorschlag sieht eine mit Abstand größte Vergrößerung des Einkaufzentrums vor."", ""Das neue Auto hat eine mit Abstand größte Reichweite im Vergleich zu seiner Vorgängerversion.""]",0.017360,0.126730,0.572808,0.532372,0.013616,0.011980
973,"Bei ""Disjunktion_Doppeltitel:XoderY"" handelt es sich um eine Konstruktion, welche in ihrer spezifischen Funktionalität ausschließlich als Titel erscheint und damit als kommunikative Ressource der geschriebenen Sprache fungiert. Als Titel bzw. Überschrift stellen Instanzen des Musters Leseanleitungen dar, deren Besonderheit darin besteht, dass sie in Form der Disjunktion zwei Möglichkeiten präsentieren, unter denen der nachfolgende Text zu lesen ist (vgl. Finkbeiner/Tienken 2018: 268). Diese metalinguistische Interpretation ergibt sich daraus, dass die Koordinationsphrase, in der der Konnektor ""oder"" mit ""Disjunkt_1"" und ""Disjunkt_2"" zwei voneinander unabhängige Phrasen verknüpft, nicht propositional im Sinne einer Alternativfrage interpretiert wird, als sei eine Wahl zwischen zwei Sachverhalten bzw. Entitäten zu treffen (im Sinne von: In diesem Text geht es entweder um Christoph Columbus oder um Die Entdeckung Amerikas), sondern vielmehr so, dass die Disjunkte zwei Formulierungsalternativen für ein- und denselben Sachverhalt bereitstellen, die als äquivalent gelten und gleichermaßen zutreffen (im Sinne von: In diesem Text geht es um Christoph Columbus oder anders gesagt um Die Entdeckung Amerikas) (vgl. Finkbeiner/Tienken 2018: 260). Neben der spezifischen Kontext-Restriktion, als Titelformat ausschließlich an die sequenzielle Position der Überschrift gebunden zu sein, ist die Kxn in dreifacher Hinsicht restringiert (vgl. Finkbeiner/Tienken 2018: 259-262): 1) Zum einen liegt eine Nicht-Gleichartigkeitsbeschränkung der Disjunkte vor, insofern diese in der Regel durch unterschiedliche syntaktische Phrasenstrukturen (z.B. EN und NP oder NP und w-VL-Satz) oder bei einer identischen Phrasenstruktur (z.B. NP und NP) durch unterschiedliche Mikrostrukturen realisiert werden (z.B. eine NP mit präpositionalem Attribut und eine NP mit Genitivattribut). ""2) Zweitens gibt es eine klare Restriktion hinsichtlich der Reihenfolge der Disjunkte: So fungiert innerhalb der Kxn das beim linearen Lesen später aufgenommene zweite Disjunkt als explizierender Zusatz zum ersten Disjunkt. Der Y-Slot zeichnet sich somit durch ein semantisches Explikationspotenzial zum X-Slot aus, was tendenziell mit einer syntaktisch größeren Komplexität von ""Disjunkt_2"" einhergeht (z.B. EN vor NP oder NP vor w-VL-Satz). ""3) Da sich die Disjunkte normalerweise auf denselben generellen Aspekt des Bezugstextes (meistens das Thema) beziehen, unterliegen sie drittens einer Äquivalenzbeschränkung. Kombinationen von Disjunkten, die auf unterschiedliche Eigenschaften des Textes bezogen sind (z.B. thematische Charakterisierung und Textsortencharakterisierung) werden von der Kxn nicht lizensiert (vgl. Der Fall Ecstasy oder Eine Essaysammlung). ""","['Pfui ist das neue Hui , stern', 'Kate ist die neue Diana', 'Rot ist das neue Schwarz .', '"" Sounds of Silence "" - Michael Frank und Thomas Heinke sind die neuen "" Simon & Garfunkel "" .']","[""Grau ist das neue Blond"", ""Weiß ist das neue Schwarz"", ""Braun ist das neue Schwarz"", ""Kürbisgelb ist das neue Grün"", ""Schwarz ist das neue Braun""]",0.055425,0.018361,0.357952,0.518681,0.007540,0.004923
976,"Bei ""Korrelation_Affirmation:WoXist, istY"" handelt es sich um eine verfestigte, nicht völlig kompositionelle und produktive Phrasem-Konstruktion (PhK) des Deutschen, die neben einem kleinen Set an usuellen Sprichwort-Realisierungen eine große Menge an okkasionellen Bildungen lizensiert. Aus syntaktischer Sicht handelt es sich um ein satzwertiges Strukturmuster der Form Wo X ist, ist Y, das aus zwei Teilsätzen (lokaler Adverbialsatz und Hauptsatz) besteht. Während mit dem Adverb ""wo"", und den beiden Verbformen ""ist"" drei Positionen lexikalisch gefüllt sind, welche im Verbund die PhK evozieren, fungieren mit X (""Entität_1"") und Y (""Entität_2"") zwei nominale Positionen als variabel, aber nicht beliebig zu besetzende Slots. Aus semantischer Sicht bringt die PhK eine Korrelation zwischen zwei Entitäten oder Sachverhalten zum Ausdruck, die einer affirmativen Existenzquantifikation entspricht: So gilt: 'Wenn es (irgendwo) X gibt, dann gibt es (dort) typischerweise auch Y' (z.B. für Wo Licht ist, ist auch Schatten: Wenn es irgendwo Licht gibt, dann muss es dort auch Schatten geben, bzw. im übertragenen Sinne: Wenn es etwas Positives gibt, dann gibt es typischerweise auch etwas Negatives) (vgl. Steyer 2012: 309).","['Berlin/Offenbach ( dpa ) - Sommer im April : Hoch «Peggy» hat Deutschland am Wochenende mit Sonne pur und sommerlich warmen Temperaturen verwöhnt .', 'Was für ein Gegensatz zu einer Verwaltungschefin wie Sabine Töpperwien , die mit gelangweilter Stimme Sachen sagt , die man nie sagen darf : "" "" Also hier ist Spannung pur "" "" - und das bei Leverkusen gegen Bochum , also bitte !', 'Das ist Fußball pur und eine besondere Atmosphäre . "" ""', 'Das ist ideologischer Klassenkampf pur .']","[""Der Gebrauch von ""pur"" in ""Tinte pur"" signalisiert die Intensivierung des Adjektivs ""tintig""."", ""Die Intensivierung von ""klar"" in ""Klarheit pur"" drückt die Intensivität der Eigenschaft ""klar"" aus."", ""Der Gebrauch von ""rein"" in ""Reinheit pur"" signalisiert die Intensivierung des Adjektivs ""reinlich""."", ""Die Intensivierung von ""schön"" in ""Schönheit pur"" drückt die Intensivität der Eigenschaft ""schön"" aus."", ""Der Gebrauch von ""schwierig"" in ""Schwierigkeit pur"" signalisiert die Intensivierung des Adjektivs ""schwierig""."", ""Die Intensivierung von ""kalt"" in ""Kaltheit pur"" drückt die Intensivität der Eigenschaft ""kalt"" aus."", ""Der Gebrauch von ""kleiner"" in ""Kleinstheit pur"" signalisiert die Intensivierung des Adjektivs ""kleiner""."", ""Die Intensivierung von ""schnell"" in ""Schneidigkeit pur"" drückt die Intensivität der Eigenschaft ""schnell"" aus."", ""Der Gebrauch von ""rein"" in ""Reinheit pur"" signalisiert die Intensivierung des Adjektivs ""reinlich""."", ""Die Intensivierung von ""kleiner"" in ""Kleinstigkeit pur"" drückt die Intensivität der Eigenschaft ""kleiner"" aus."", ""Der Gebrauch von ""schwer"" in ""Schwerigkeit pur"" signalisiert die Intensivierung des Adjektivs ""schwer""."", ""Die Intensivierung von ""klar"" in ""Klarheit pur"" drückt die Intensivität der Eigenschaft ""klar"" aus."", ""Der Gebrauch von ""kalt"" in ""Kaltheit pur"" signalisiert die Intensivierung des Adjektivs ""kalt""."", ""Die Intensivierung von ""schön"" in ""Schönheit pur"" drückt die Intensivität der Eigenschaft ""schön"" aus.', 'Der Gebrauch von ""rein"" in ""Reinheit pur"" signalisiert die Intensivierung des Adjektivs ""reinlich"".']",,,,,0.011858,0.008148
98,"Die ""Äquativ:soADJwieXP-Konstruktion"" gehört zu den Vergleichskonstruktionen und zeigt die Gleichheit zweier Werte auf einer Skala an. Das konstruktionsevozierende Element (KEE) kann entweder durch ""so"", ""genauso"", ""ebenso""oder (selten) ""gleich"" realisiert werden und gibt an, um welche Art des Vergleichs es sich handelt (hier: Gleichheit und nicht Ungleichheit). Neben dem KEE besteht der Vergleichsausdruck außerdem aus drei Kern-Konstruktionselementen (KE). Das KE ""Verglichenes"" umfasst diejenige Einheit, die im Fokus des Vergleichs steht und zu einem bereits bestehenden Wert gleichgesetzt wird (zu dem KE ""Bezugswert""). Das KE ""Dimension"" benennt dabei die Skala des Vergleichs, d.h. es gibt genauer an, in welcher Hinsicht ""Verglichenes"" und ""Bezugswert"" gleichgesetzt werden (X ist so groß wie Y vergleicht z. B. X und Y auf einer Skala in Bezug auf 'Größe').","['Der Sohn sei ständig » inmitten eines Ozeans von Menschen über Menschen , die alle laut reden und alle etwas anderes meinen .', '"" - Probleme über Probleme türmen sich in Dagmar Chidolues Kinderroman "" "" Nicht alle Engel sind aus Stein "" "" . ""', 'Fehler über Fehler : Bayern vor Aus in Champions - League', 'Fragen über Fragen .']","[""Die Kühe stehen auf dem Hof über die Hüte der Kähne"", ""Der Hase auf dem Eckmauerpfeiler über den Straßenverkehr"", ""Ein Taucher unter Wasser über einen größeren Eicheimer schwimmt"", ""Die Kinder über die Straße laufen, während sie über ihre Schulter schauen, während sie ein Lied hören""]",0.024458,0.125334,0.456819,0.524750,0.004873,0.002945


In [95]:
for i, example in examples.items():
    example.to_excel(f"{i}_shot.xlsx")