### Imports

In [1]:
import json
import random
import re

import nltk
from nltk import CFG
from nltk.parse.generate import generate

random.seed(123)

### Items Dictionary from Items Intent
Including
* item name
* slot name
* location details
* neighboring items
* content items (optional)
* adjectives
* hyperonyms

In [2]:
items_dict = {
    "astronautinnen": {
        "slot": "astronautinnen",
        "location": ["links", "oben", "in der ecke"],
        "neighbors": ["ufo", "raumschiff", "anzügen"],
        "content": [],
        "adjectives": ["3", "weiß", "weißen"],
		"hyperonyms": ["menschen", "personen", "frauen"],
    },
    "ballon": {
        "slot": "ballon",
        "location": [
            "rechts",
            "unten",
            "in der ecke",
            "am rand",
            "auf der rechten seite",
            "über",
        ],
        "neighbors": ["boot", "schiff"],
        "content": [],
        "adjectives": ["rot", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "biene": {
        "slot": "biene",
        "location": ["rechts", "am rand", "auf der rechten seite"],
        "neighbors": [],
        "content": ["streifen"],
        "adjectives": ["gelb", "gestreift"],
		"hyperonyms": ["tier", "insekt", "lebewesen"],
    },
    "boot": {
        "slot": "boot",
        "location": [
            "rechts",
            "unten",
            "in der ecke",
            "am rand",
            "auf der rechten seite",
            "unter",
            "auf",
        ],
        "neighbors": ["ballon", "wasser", "fluss", "roboter"],
        "content": [],
        "adjectives": ["grün", "lächelnd", "schwimmend", "schwimmt"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "fahrzeug"],
    },
    "buchLinksOben": {
        "slot": "buch",
        "location": ["links", "oben", "in der ecke"],
        "neighbors": ["buch", "uhr", "säulen"],
        "content": [],
        "adjectives": ["grün", "blau", "geschlossen"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "buchMitteUnten": {
        "slot": "buch",
        "location": ["in der mitte", "unten", "am rand"],
        "neighbors": ["pfeile", "tisch", "kurven"],
        "content": [],
        "adjectives": ["grün", "geschlossen", "klein"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "buchLinksObenOffen": {
        "slot": "buch",
        "location": ["links", "oben", "in der ecke"],
        "neighbors": ["buch", "uhr", "säulen"],
        "content": [],
        "adjectives": ["aufgeschlagen", "offen", "geöffnet", "klein"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "buchRechtsMitte": {
        "slot": "buch",
        "location": ["rechts", "auf der rechten seite", "unter"],
        "neighbors": ["globus", "spinne", "rauch", "mikroskop"],
        "content": [],
        "adjectives": ["aufgeschlagen", "offen", "geöffnet"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "diagramm": {
        "slot": "diagramm",
        "location": ["rechts", "oben", "am rand", "über", "neben", "an der wand"],
        "neighbors": ["mikroskop", "uhr"],
        "content": ["x", "y", "sigma", "summe", "summenzeichen", "normalverteilung", "gaußkurve", "mathe", "mathematik", "achse"],
        "adjectives": ["bunt", "schwarz", "mathematisch"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "europa": {
        "slot": "europa",
        "location": [
            "unten",
            "links",
            "auf der linken seite",
            "über",
            "unter",
            "neben",
        ],
        "neighbors": ["tisch", "schultasche"],
        "content": ["sterne", "sternen"],
        "adjectives": ["blau", "gelb"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "fff": {
        "slot": "kinder",
        "location": ["oben", "links", "hinter", "unter"],
        "neighbors": ["terminal", "konsole", "astronautinnen", "wolke"],
        "content": ["fahne"],
        "adjectives": ["grün", "2"],
		"hyperonyms": ["menschen", "personen", "kinder"],
    },
    "gleichung": {
        "slot": "gleichung",
        "location": ["unten", "rechts"],
        "neighbors": ["stift", "kolben", "chemie", "labor"],
        "content": ["x", "y", "Gleichheitszeichen"],
        "adjectives": ["weiß"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "globus": {
        "slot": "globus",
        "location": ["in der mitte", "im zentrum"],
        "neighbors": ["wolke", "treppe"],
        "content": ["sockel"],
        "adjectives": ["mittig", "zentral", "rund", "blau", "grün", "rot"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "gluehbirneObenMitteGross": {
        "slot": "glühbirne",
        "location": ["oben", "im oberen teil", "in der mitte", "neben"],
        "neighbors": ["glühbirne", "teleskop"],
        "content": [],
        "adjectives": ["gelb", "groß", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "gluehbirneObenMitteKlein": {
        "slot": "glühbirne",
        "location": ["oben", "im oberen teil", "in der mitte", "neben"],
        "neighbors": ["glühbirne", "globus"],
        "content": [],
        "adjectives": ["gelb", "klein", "rund", "drei"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "kurven": {
        "slot": "kurven",
        "location": ["unten", "links", "mittig", "links von der mitte", "in der mitte"],
        "neighbors": ["buch", "lineal", "tafel", "wolken"],
        "content": [],
        "adjectives": ["weiß", "bunt", "gelb", "rosa", "pink"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "lab": {
        "slot": "labor",
        "location": ["unten", "rechts", "am rand", "neben"],
        "neighbors": ["wasser", "boot", "ballon"],
        "content": ["terminal", "diy", "kasten"],
        "adjectives": ["eckig", "bunt", "rot"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "mikroskop": {
        "slot": "mikroskop",
        "location": ["oben", "rechts", "neben", "unter"],
        "neighbors": ["diagramm", "buch", "tisch", "pflanze", "kugeln"],
        "content": [],
        "adjectives": ["grau", "grün"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "personLinksMitte": {
        "slot": "person",
        "location": ["links", "in der mitte", "neben"],
        "neighbors": ["taube", "vogel", "wolke", "stift"],
        "content": [],
        "adjectives": ["sitzend", "kauernd", "blond", "lila"],
		"hyperonyms": ["mensch", "person"],
    },
    "personMitteMitte": {
        "slot": "person",
        "location": ["in der mitte", "im zentrum", "neben"],
        "neighbors": ["terminal", "konsole", "ordner", "kästen"],
        "content": ["kittel", "brille", "klemmbrett"],
        "adjectives": ["weiß", "grau"],
		"hyperonyms": ["mensch", "person"],
    },
    "personRechtsMitte": {
        "slot": "person",
        "location": ["in der mitte", "rechts", "neben"],
        "neighbors": ["labor", "magnet", "kolben", "sprechblase"],
        "content": ["kittel", "brille"],
        "adjectives": ["weiß", "blond", "gelb"],
		"hyperonyms": ["mensch", "person"],
    },
    "planet": {
        "slot": "planet",
        "location": [
            "oben",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["buch", "astronautinnen"],
        "content": [],
        "adjectives": ["gelb", "gold", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "raumschiff": {
        "slot": "raumschiff",
        "location": [
            "oben",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["astronautinnen", "teleskop", "glühbirne", "terminal"],
        "content": [],
        "adjectives": ["rot", "eckig"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "fahrzeug"],
    },
    "spielKonsole": {
        "slot": "spielkonsole",
        "location": ["in der mitte", "im zentrum", "neben"],
        "neighbors": ["glühbirne", "terminal", "astronautinnen", "würfel"],
        "content": ["tasten", "knöpfe"],
        "adjectives": ["eckig", "rot", "schwarz", "grau", "flach"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "stiftLinksMitte": {
        "slot": "stift",
        "location": [
            "mittig",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["person", "würfel", "tafel"],
        "content": [],
        "adjectives": ["grün", "rosa", "weiß", "spitz"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "schreibutensil"],
    },
    "stiftRechtsUnten": {
        "slot": "stift",
        "location": [
            "unten",
            "rechts",
            "auf der rechten seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["labor", "ballon", "boot", "gleichung", "konsole", "terminal"],
        "content": [],
        "adjectives": ["rot", "spitz", "rosa", "weiß"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "schreibutensil"],
    },
    "tafel": {
        "slot": "tafel",
        "location": [
            "unten",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
            "bei",
        ],
        "neighbors": ["würfel", "stift", "buch", "kurven", "europa"],
        "content": ["zwei", "vier", "komma", "punkt"],
        "adjectives": ["grün", "beschriftet", "beschrieben", "weiß"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "teleskop": {
        "slot": "teleskop",
        "location": ["am Rand", "mittig", "neben", "neben"],
        "neighbors": ["glühbirne", "raumschiff"],
        "content": [],
        "adjectives": ["rot", "blau", "rund", "mikroskopähnlich"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "terminalMitteMitte": {
        "slot": "terminal",
        "location": [
            "in der mitte",
            "im zentrum",
            "neben",
        ],
        "neighbors": [
            "globus",
            "spielkonsole",
            "glühbirne",
            "astronautinnen",
            "würfel",  
        ],
        "content": ["schrift", "hello", "world"],
        "adjectives": ["schwarz", "beschriftet", "weiß", "bunt", "grün"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "uhrLinksOben": {
        "slot": "uhr",
        "location": ["oben", "links", "auf der linken seite", "neben"],
        "neighbors": ["buch", "astronautinnen", "person", "planet",],
        "content": ["zeit"],
        "adjectives": ["gelb", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "uhrRechtsOben": {
        "slot": "uhr",
        "location": [
            "oben",
            "rechts",
            "auf der rechten seite",
            "am Rand",
            "an der Wand",
            "neben",
        ],
        "neighbors": ["diagramm", "mikroskop"],
        "content": ["zeit"],
        "adjectives": ["blau", "rund", "grün"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "wuerfel": {
        "slot": "würfel",
        "location": [
            "mittig",
            "links",
            "auf der linken seite",
            "neben",
        ],
        "neighbors": ["person", "spielkonsole", "kurven", "terminal"],
        "content": ["buchstaben", "a", "b"],
        "adjectives": ["blau", "türkis", "gelb", "lila", "bunt"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
}

### Interaction Model with detailed slot names, values, and synonyms

In [3]:
model = json.load(open('interaction_model.json', 'r', encoding='utf-8'))

In [4]:
# create a nested dictionary from interaction model slots {slot: dict of slot values: list of their synonyms}
slots = dict()
for s in model["interactionModel"]["languageModel"]["types"]:
    #print(s)
    slots[s['name']] = dict()
    for v in s['values']:
        slots[s['name']][v['name']['value']] = list()
        if 'synonyms' in v['name']:
            slots[s['name']][v['name']['value']] = v['name']['synonyms']
        #slots[s['name']] += [v['name']['value']]
    # replace ' by `
    #for slot, index in zip(slots[s['name']], range(len(slots[s['name']]))):
        #slots[s['name']][index] = slot.replace('\'', '`')
print(slots['object'])

{'other': ['Absolvent', 'Student', 'Gesicht', 'Smiley', 'Sterne', 'Stern', 'Bildschirm', 'Podest', 'Binärcode', 'Stühle', 'Stuhl', 'Seeigel', 'Mine', 'Pfeile', 'Pfeil', 'Legobaustein', 'Legostein', 'Tisch', 'ABC', 'Molekül', 'Atom', 'Schrank', 'Delfin', 'Medaille', 'Tauben', 'Taube', 'Vögel', 'Vogel', 'Pfeile', 'Pfeil', 'Regenbogen', 'Reagenzglas', 'Schultasche', 'Säulen', 'Spinne', 'Wolken', 'Wolke', 'Blumentopf', 'Pflanze', 'Treppe', 'Lineal', 'Büro', 'Schreibtisch', 'Giraffenkopf', 'Giraffe', 'Zahnrad'], 'Ding': ['Sachen', 'Sache', 'Teile', 'Gegenstände', 'Dinger', 'Dingens', 'Dings', 'Objekt', 'Gegenstand', 'Teil'], 'Uhr': [], 'Würfel': ['Buchstabenwürfel'], 'Terminal': ['Programmfenster', 'Bildschirm', 'Computerbildschirm', 'Konsole'], 'Teleskop': ['Fernrohr'], 'Tafel': ['Schultafel'], 'Stift': ['Schreibutensil', 'Buntstift'], 'Spielkonsole': ['Gameboy', 'Switch', 'Spielekonsole'], 'Raumschiff': ['Spaceshuttle', 'Flugzeug'], 'Planet': ['Saturn'], 'Person': ['Ärztin', 'Arzt', 'Inge

### Encode grammatical properties of nouns, determiners, and verbs/sentence beginnings (BOS)

In [5]:
OBJECTS = """
N[NUM=sg,CAS=?c,GEN=m] -> 'Absolvent'
N[NUM=sg,CAS=?c,GEN=m] -> 'Student'
N[NUM=sg,CAS=?c,GEN=n] -> 'Gesicht'
N[NUM=sg,CAS=?c,GEN=m] -> 'Smiley'
N[NUM=pl,CAS=?c,GEN=m] -> 'Sterne'
N[NUM=sg,CAS=?c,GEN=m] -> 'Stern'
N[NUM=sg,CAS=?c,GEN=m] -> 'Bildschirm'
N[NUM=sg,CAS=?c,GEN=n] -> 'Podest'
N[NUM=sg,CAS=?c,GEN=m] -> 'Binärcode'
N[NUM=pl,CAS=?c,GEN=m] -> 'Stühle'
N[NUM=sg,CAS=?c,GEN=m] -> 'Stuhl'
N[NUM=sg,CAS=?c,GEN=m] -> 'Seeigel'
N[NUM=sg,CAS=?c,GEN=f] -> 'Mine'
N[NUM=pl,CAS=?c,GEN=m] -> 'Pfeile'
N[NUM=sg,CAS=?c,GEN=m] -> 'Pfeil'
N[NUM=sg,CAS=?c,GEN=m] -> 'Legobaustein'
N[NUM=sg,CAS=?c,GEN=m] -> 'Legostein'
N[NUM=sg,CAS=?c,GEN=m] -> 'Tisch'
N[NUM=sg,CAS=?c,GEN=n] -> 'ABC'
N[NUM=sg,CAS=?c,GEN=n] -> 'Molekül'
N[NUM=sg,CAS=?c,GEN=n] -> 'Atom'
N[NUM=sg,CAS=?c,GEN=m] -> 'Schrank'
N[NUM=sg,CAS=?c,GEN=m] -> 'Delfin'
N[NUM=sg,CAS=?c,GEN=f] -> 'Medaille'
N[NUM=pl,CAS=?c,GEN=f] -> 'Tauben'
N[NUM=sg,CAS=?c,GEN=f] -> 'Taube'
N[NUM=pl,CAS=?c,GEN=m] -> 'Vögel'
N[NUM=sg,CAS=?c,GEN=m] -> 'Vogel'
N[NUM=pl,CAS=?c,GEN=m] -> 'Pfeile'
N[NUM=sg,CAS=?c,GEN=m] -> 'Pfeil'
N[NUM=sg,CAS=?c,GEN=m] -> 'Regenbogen'
N[NUM=sg,CAS=?c,GEN=n] -> 'Reagenzglas'
N[NUM=sg,CAS=?c,GEN=f] -> 'Schultasche'
N[NUM=pl,CAS=?c,GEN=f] -> 'Säulen'
N[NUM=sg,CAS=?c,GEN=f] -> 'Spinne'
N[NUM=pl,CAS=?c,GEN=f] -> 'Wolken'
N[NUM=sg,CAS=?c,GEN=f] -> 'Wolke'
N[NUM=sg,CAS=?c,GEN=m] -> 'Blumentopf'
N[NUM=sg,CAS=?c,GEN=f] -> 'Pflanze'
N[NUM=sg,CAS=?c,GEN=f] -> 'Treppe'
N[NUM=sg,CAS=?c,GEN=n] -> 'Lineal'
N[NUM=sg,CAS=?c,GEN=n] -> 'Büro'
N[NUM=sg,CAS=?c,GEN=m] -> 'Schreibtisch'
N[NUM=sg,CAS=?c,GEN=m] -> 'Giraffenkopf'
N[NUM=sg,CAS=?c,GEN=f] -> 'Giraffe'
N[NUM=sg,CAS=?c,GEN=n] -> 'Zahnrad'
N[NUM=sg,CAS=?c,GEN=?g] -> 'other'
N[NUM=pl,CAS=?c,GEN=f] -> 'Sachen'
N[NUM=sg,CAS=?c,GEN=f] -> 'Sache'
N[NUM=pl,CAS=?c,GEN=n] -> 'Teile'
N[NUM=pl,CAS=?c,GEN=m] -> 'Gegenstände'
N[NUM=pl,CAS=?c,GEN=n] -> 'Dinger'
N[NUM=sg,CAS=?c,GEN=n] -> 'Dingens'
N[NUM=sg,CAS=?c,GEN=n] -> 'Dings'
N[NUM=sg,CAS=?c,GEN=n] -> 'Objekt'
N[NUM=sg,CAS=?c,GEN=m] -> 'Gegenstand'
N[NUM=sg,CAS=?c,GEN=n] -> 'Teil'
N[NUM=sg,CAS=?c,GEN=n] -> 'Ding'
N[NUM=sg,CAS=?c,GEN=f] -> 'Uhr'
N[NUM=sg,CAS=?c,GEN=m] -> 'Buchstabenwürfel'
N[NUM=sg,CAS=?c,GEN=m] -> 'Würfel'
N[NUM=sg,CAS=?c,GEN=n] -> 'Programmfenster'
N[NUM=sg,CAS=?c,GEN=m] -> 'Bildschirm'
N[NUM=sg,CAS=?c,GEN=m] -> 'Computerbildschirm'
N[NUM=sg,CAS=?c,GEN=f] -> 'Konsole'
N[NUM=sg,CAS=?c,GEN=m] -> 'Terminal'
N[NUM=sg,CAS=?c,GEN=n] -> 'Fernrohr'
N[NUM=sg,CAS=?c,GEN=n] -> 'Teleskop'
N[NUM=sg,CAS=?c,GEN=f] -> 'Schultafel'
N[NUM=sg,CAS=?c,GEN=f] -> 'Tafel'
N[NUM=sg,CAS=?c,GEN=n] -> 'Schreibutensil'
N[NUM=sg,CAS=?c,GEN=m] -> 'Buntstift'
N[NUM=sg,CAS=?c,GEN=m] -> 'Stift'
N[NUM=sg,CAS=?c,GEN=m] -> 'Gameboy'
N[NUM=sg,CAS=?c,GEN=f] -> 'Switch'
N[NUM=sg,CAS=?c,GEN=f] -> 'Spielekonsole'
N[NUM=sg,CAS=?c,GEN=f] -> 'Spielkonsole'
N[NUM=sg,CAS=?c,GEN=n] -> 'Spaceshuttle'
N[NUM=sg,CAS=?c,GEN=n] -> 'Flugzeug'
N[NUM=sg,CAS=?c,GEN=n] -> 'Raumschiff'
N[NUM=sg,CAS=?c,GEN=m] -> 'Saturn'
N[NUM=sg,CAS=?c,GEN=m] -> 'Planet'
N[NUM=sg,CAS=?c,GEN=f] -> 'Ärztin'
N[NUM=sg,CAS=?c,GEN=m] -> 'Arzt'
N[NUM=sg,CAS=?c,GEN=f] -> 'Ingenieurin'
N[NUM=sg,CAS=?c,GEN=m] -> 'Ingenieur'
N[NUM=sg,CAS=?c,GEN=m] -> 'Mann'
N[NUM=sg,CAS=?c,GEN=f] -> 'Frau'
N[NUM=sg,CAS=?c,GEN=f] -> 'Wissenschaftlerin'
N[NUM=sg,CAS=?c,GEN=m] -> 'Wissenschaftler'
N[NUM=sg,CAS=?c,GEN=f] -> 'Forscherin'
N[NUM=sg,CAS=?c,GEN=m] -> 'Forscher'
N[NUM=pl,CAS=?c,GEN=f] -> 'Personen'
N[NUM=sg,CAS=?c,GEN=m] -> 'Mensch'
N[NUM=sg,CAS=?c,GEN=f] -> 'Person'
N[NUM=sg,CAS=?c,GEN=n] -> 'Teleskop'
N[NUM=sg,CAS=?c,GEN=n] -> 'Mikroskop'
N[NUM=sg,CAS=?c,GEN=m] -> 'Kasten'
N[NUM=sg,CAS=?c,GEN=n] -> 'Lab'
N[NUM=sg,CAS=?c,GEN=n] -> 'Labor'
N[NUM=pl,CAS=?c,GEN=f] -> 'Grafiken'
N[NUM=sg,CAS=?c,GEN=n] -> 'Diagramm'
N[NUM=pl,CAS=?c,GEN=f] -> 'Wellen'
N[NUM=pl,CAS=?c,GEN=f] -> 'Kurven'
N[NUM=sg,CAS=?c,GEN=f] -> 'Birne'
N[NUM=sg,CAS=?c,GEN=f] -> 'Glühbirne'
N[NUM=sg,CAS=?c,GEN=m] -> 'Screen'
N[NUM=sg,CAS=?c,GEN=f] -> 'Gleichung'
N[NUM=sg,CAS=?c,GEN=f] -> 'Demo'
N[NUM=pl,CAS=?c,GEN=f] -> 'Klimaaktivistinnen'
N[NUM=pl,CAS=?c,GEN=m] -> 'Klimaaktivisten'
N[NUM=?n,CAS=?c,GEN=?g] -> 'Fridays for Future'
N[NUM=?n,CAS=?c,GEN=?g] -> 'FFF'
N[NUM=pl,CAS=?c,GEN=n] -> 'Kinder mit Flagge'
N[NUM=pl,CAS=?c,GEN=?g] -> 'Friends For Future'
N[NUM=pl,CAS=?c,GEN=?g] -> 'Friends'
N[NUM=sg,CAS=?c,GEN=?g] -> 'Future'
N[NUM=pl,CAS=?c,GEN=n] -> 'Kinder'
N[NUM=sg,CAS=?c,GEN=f] -> 'Flagge'
N[NUM=sg,CAS=?c,GEN=f] -> 'Fahne'
N[NUM=sg,CAS=?c,GEN=f] -> 'EU'
N[NUM=sg,CAS=?c,GEN=f] -> 'Europaflagge'
N[NUM=sg,CAS=?c,GEN=n] -> 'Europa'
N[NUM=sg,CAS=?c,GEN=f] -> 'Tafel'
N[NUM=sg,CAS=?c,GEN=n] -> 'Koordinatensystem'
N[NUM=sg,CAS=?c,GEN=n] -> 'Diagramm'
N[NUM=sg,CAS=?c,GEN=n] -> 'Heft'
N[NUM=sg,CAS=?c,GEN=n] -> 'Buch'
N[NUM=sg,CAS=?c,GEN=n] -> 'Schiff'
N[NUM=sg,CAS=?c,GEN=n] -> 'Boot'
N[NUM=pl,CAS=?c,GEN=m] -> 'Drillinge'
N[NUM=pl,CAS=?c,GEN=f] -> 'Raumfahrerinnen'
N[NUM=pl,CAS=?c,GEN=f] -> 'Frauen'
N[NUM=pl,CAS=?c,GEN=f] -> 'Astronautinnen'
N[NUM=sg,CAS=?c,GEN=m] -> 'Luftballon'
N[NUM=sg,CAS=?c,GEN=m] -> 'Ball'
N[NUM=sg,CAS=?c,GEN=m] -> 'Ballon'
N[NUM=sg,CAS=?c,GEN=n] -> 'Tier'
N[NUM=sg,CAS=?c,GEN=n] -> 'Insekt'
N[NUM=sg,CAS=?c,GEN=f] -> 'Biene'
N[NUM=sg,CAS=?c,GEN=f] -> 'Weltkugel'
N[NUM=sg,CAS=?c,GEN=f] -> 'Erdkugel'
N[NUM=sg,CAS=?c,GEN=m] -> 'Globus'
"""

In [6]:
ARTICLES = """
Det[NUM=sg,CAS=nom,GEN=m] -> 'der'
Det[NUM=sg,CAS=gen,GEN=m] -> 'des'
Det[NUM=sg,CAS=dat,GEN=m] -> 'dem'
Det[NUM=sg,CAS=acc,GEN=m] -> 'den'
Det[NUM=sg,CAS=nom,GEN=f] -> 'die'
Det[NUM=sg,CAS=gen,GEN=f] -> 'der'
Det[NUM=sg,CAS=dat,GEN=f] -> 'der'
Det[NUM=sg,CAS=acc,GEN=f] -> 'die'
Det[NUM=sg,CAS=nom,GEN=n] -> 'das'
Det[NUM=sg,CAS=gen,GEN=n] -> 'des'
Det[NUM=sg,CAS=dat,GEN=n] -> 'dem'
Det[NUM=sg,CAS=acc,GEN=n] -> 'das'
Det[NUM=pl,CAS=nom,GEN=?g] -> 'die'
Det[NUM=pl,CAS=gen,GEN=?g] -> 'der'
Det[NUM=pl,CAS=dat,GEN=?g] -> 'den'
Det[NUM=pl,CAS=acc,GEN=?g] -> 'die'
"""

In [7]:
ADJECTIVE_ENDINGS = """
Adj[NUM=sg,CAS=nom,GEN=m] -> 'e'
Adj[NUM=sg,CAS=gen,GEN=m] -> 'en'
Adj[NUM=sg,CAS=dat,GEN=m] -> 'en'
Adj[NUM=sg,CAS=acc,GEN=m] -> 'en'
Adj[NUM=sg,CAS=nom,GEN=f] -> 'e'
Adj[NUM=sg,CAS=gen,GEN=f] -> 'en'
Adj[NUM=sg,CAS=dat,GEN=f] -> 'en'
Adj[NUM=sg,CAS=acc,GEN=f] -> 'e'
Adj[NUM=sg,CAS=nom,GEN=n] -> 'e'
Adj[NUM=sg,CAS=gen,GEN=n] -> 'en'
Adj[NUM=sg,CAS=dat,GEN=n] -> 'en'
Adj[NUM=sg,CAS=acc,GEN=n] -> 'e'
Adj[NUM=pl,CAS=?c,GEN=?g] -> 'en'
"""

In [8]:
BOS = """
Bos[CAS=nom] -> 'und jetzt'
Bos[CAS=acc] -> 'bitte zeig mir'
Bos[CAS=nom] -> 'das objekt ist'
Bos[CAS=nom] -> 'es ist'
Bos[CAS=acc] -> 'es gibt'
Bos[CAS=acc] -> 'zeig mal'
Bos[CAS=acc] -> 'wähl mal'
Bos[CAS=nom] -> 'das ding ist'
Bos[CAS=acc] -> 'zeich'
Bos[CAS=acc] -> 'ich nehme'
Bos[CAS=acc] -> 'bitte wähle'
Bos[CAS=acc] -> 'bitte finde'
Bos[CAS=nom] -> 'dann noch'
Bos[CAS=nom] -> 'dann'
Bos[CAS=acc] -> 'finde'
Bos[CAS=acc] -> 'wähle mal'
Bos[CAS=acc] -> 'ich sehe'
Bos[CAS=acc] -> 'nimm mal'
Bos[CAS=nom] -> 'der gegenstand ist'
Bos[CAS=acc] -> 'ich denke an'
Bos[CAS=acc] -> 'ich wähle'
Bos[CAS=acc] -> 'wähle'
Bos[CAS=acc] -> 'siehst du'
Bos[CAS=acc] -> 'zeig'
Bos[CAS=nom] -> 'als nächstes'
Bos[CAS=dat] -> 'weiter mit'
Bos[CAS=nom] -> 'bitte zeige'
Bos[CAS=nom] -> 'das nächste objekt ist'
Bos[CAS=acc] -> 'ich beschreibe'
Bos[CAS=nom] -> 'jetzt'
Bos[CAS=nom] -> 'der nächste gegenstand ist'
Bos[CAS=acc] -> 'zeich mal'
Bos[CAS=acc] -> 'du siehst'
Bos[CAS=acc] -> 'zeich ma'
Bos[CAS=acc] -> 'wähl'
Bos[CAS=acc] -> 'zeig mir'
Bos[CAS=acc] -> 'ich meine'
Bos[CAS=nom] -> 'das ist'
Bos[CAS=dat] -> 'weiter geht`s mit'
Bos[CAS=acc] -> 'nimm'
Bos[CAS=acc] -> 'bitte nimm'
"""

In [30]:
NONTERMINALS = """
S -> Bos[CAS=?c] NP[CAS=?c]
S -> Bos[CAS=?c] NP[CAS=?c] Loc
NP[CAS=?c] -> Det[CAS=?c,NUM=?n,GEN=?g] N[CAS=?c,NUM=?n,GEN=?g]"""

In [55]:
def CFG_transform(rule):
    rule = rule.replace('[', '_')
    rule = rule.replace(',', '_')
    rule = rule.replace('=', '')
    rule = rule.replace(']', '')
    rule = rule.replace('?', '')
    return rule

In [58]:
r = """
S -> NP[GEN=?g]
NP[GEN=?g] -> Det[GEN=?g] N[GEN=?g]
Det[GEN=?g] -> Det[NUM=?n,CAS=?c,GEN=?g]
N[GEN=?g] -> N[NUM=?n,CAS=?c,GEN=?g]
Det[NUM=sg,CAS=nom,GEN=m] -> 'der'
Det[NUM=sg,CAS=gen,GEN=m] -> 'des'
Det[NUM=sg,CAS=dat,GEN=m] -> 'dem'
Det[NUM=sg,CAS=acc,GEN=m] -> 'den'
Det[NUM=sg,CAS=nom,GEN=f] -> 'die'
Det[NUM=sg,CAS=gen,GEN=f] -> 'der'
Det[NUM=sg,CAS=dat,GEN=f] -> 'der'
Det[NUM=sg,CAS=acc,GEN=f] -> 'die'
N[NUM=sg,CAS=?c,GEN=m] -> 'Buntstift'
N[NUM=sg,CAS=?c,GEN=m] -> 'Stift'
N[NUM=sg,CAS=?c,GEN=m] -> 'Gameboy'
N[NUM=sg,CAS=?c,GEN=f] -> 'Flagge'
N[NUM=sg,CAS=?c,GEN=f] -> 'Fahne'
N[NUM=sg,CAS=?c,GEN=f] -> 'EU'
"""
r_list = ['% start S']
for rule in r.split('\n'):
    r_list += specify_rule(rule)
rules_cfg = [CFG_transform(r) for r in r_list]
rules = '\n'.join(rules_cfg)
fg = CFG.fromstring(rules)
print(rules)
#gram = nltk.grammar.FeatureGrammar.fromstring('\n'.join(r_list))
for sentence in generate(fg, depth=5, n=100):
    if len(sentence) >= 2:
        print(' '.join(sentence))

% start S

S -> NP_GENn
S -> NP_GENm
S -> NP_GENf
NP_GENm -> Det_GENm N_GENm
NP_GENn -> Det_GENn N_GENn
NP_GENf -> Det_GENf N_GENf
Det_GENm -> Det_NUMpl_CASdat_GENm
Det_GENm -> Det_NUMsg_CASgen_GENm
Det_GENf -> Det_NUMsg_CASdat_GENf
Det_GENm -> Det_NUMsg_CASacc_GENm
Det_GENn -> Det_NUMsg_CASdat_GENn
Det_GENf -> Det_NUMpl_CASgen_GENf
Det_GENn -> Det_NUMsg_CASgen_GENn
Det_GENf -> Det_NUMpl_CASdat_GENf
Det_GENf -> Det_NUMpl_CASnom_GENf
Det_GENn -> Det_NUMpl_CASnom_GENn
Det_GENm -> Det_NUMsg_CASnom_GENm
Det_GENn -> Det_NUMpl_CASgen_GENn
Det_GENf -> Det_NUMsg_CASacc_GENf
Det_GENn -> Det_NUMsg_CASacc_GENn
Det_GENn -> Det_NUMpl_CASdat_GENn
Det_GENm -> Det_NUMsg_CASdat_GENm
Det_GENm -> Det_NUMpl_CASnom_GENm
Det_GENn -> Det_NUMpl_CASacc_GENn
Det_GENm -> Det_NUMpl_CASgen_GENm
Det_GENf -> Det_NUMsg_CASgen_GENf
Det_GENm -> Det_NUMpl_CASacc_GENm
Det_GENf -> Det_NUMsg_CASnom_GENf
Det_GENn -> Det_NUMsg_CASnom_GENn
Det_GENf -> Det_NUMpl_CASacc_GENf
N_GENf -> N_NUMpl_CASdat_GENf
N_GENn -> N_NUMsg_CASge

In [44]:
NUM = {'sg', 'pl'}
CAS = {'nom', 'acc', 'gen', 'dat'}
GEN = {'m', 'f', 'n'}

def specify_rule(r):
    """specify feature grammar rule containing ? for all possible features and values"""
    new_rules = set([r])
    if '?g' in r:
        for g in GEN:
            new = set([rule.replace('?g', g) for rule in new_rules])
            new_rules = new_rules.union(new)  
    if '?c' in r:
        for c in CAS:
            new = set([rule.replace('?c', c) for rule in new_rules])
            new_rules = new_rules.union(new)
    if '?n' in r:
        for n in NUM:
            new = set([rule.replace('?n', n) for rule in new_rules])
            new_rules = new_rules.union(new)
    new_rules = new_rules.difference(set([rule for rule in new_rules if '?' in rule]))
    return list(new_rules)

#### Merge slots, grammatical information to feature grammar

In [45]:
def featgram(i, turn=1):
    """create a feature grammar for an item"""
    d = items_dict[i]  # load item's dict
    # overall structure: BOS + description
    rules = ["% start S"]
    # item synonyms from slot
    synonyms = slots['object'][d["slot"].capitalize()]
    # location information
    locs = d['location']  
    loc_rules = [f'Loc -> \'{l}\'' for l in locs if l != 'neben']  # ignore transitive location for now
    # non terminal rules, replace general rule by specified rules
    for r in NONTERMINALS.split('\n'):
        rules += specify_rule(r)
    # BOS, articles and adjective endings
    rules += (BOS.split('\n') + ARTICLES.split('\n') + ADJECTIVE_ENDINGS.split('\n')) 
    if turn == 1:
        # BOS + Det + dict[adjectives] + Adj(ending) + hyperonym + location
        hyps = d['hyperonyms']
        hyp_rules = [r for r in OBJECTS.split('\n') if '\'' in r and r.split('\'')[1].lower() in hyps]
        for r in hyp_rules:
            rules += specify_rule(r)
    else:
        # BOS + dict[adjectives] + Adj(ending) + slot + {bei/neben Det neighbors}
        objs = [r for r in OBJECTS.split('\n') if '\'' in r and r.split('\'')[1].lower() in d['slot']]
        for r in objs:
            rules += specify_rule(r)
    fg = nltk.grammar.FeatureGrammar.fromstring('\n'.join(rules))
    print(fg.productions())
    return fg

In [46]:
g = featgram('personRechtsMitte')

[S[] -> Bos[CAS='nom'] NP[CAS='nom'], S[] -> Bos[CAS='acc'] NP[CAS='acc'], S[] -> Bos[CAS='gen'] NP[CAS='gen'], S[] -> Bos[CAS='dat'] NP[CAS='dat'], S[] -> Bos[CAS='dat'] NP[CAS='dat'] Loc[], S[] -> Bos[CAS='gen'] NP[CAS='gen'] Loc[], S[] -> Bos[CAS='acc'] NP[CAS='acc'] Loc[], S[] -> Bos[CAS='nom'] NP[CAS='nom'] Loc[], NP[CAS='nom'] -> Det[CAS='nom', GEN='m', NUM='sg'] N[CAS='nom', GEN='m', NUM='sg'], NP[CAS='dat'] -> Det[CAS='dat', GEN='m', NUM='sg'] N[CAS='dat', GEN='m', NUM='sg'], NP[CAS='gen'] -> Det[CAS='gen', GEN='n', NUM='pl'] N[CAS='gen', GEN='n', NUM='pl'], NP[CAS='nom'] -> Det[CAS='nom', GEN='m', NUM='pl'] N[CAS='nom', GEN='m', NUM='pl'], NP[CAS='acc'] -> Det[CAS='acc', GEN='n', NUM='pl'] N[CAS='acc', GEN='n', NUM='pl'], NP[CAS='dat'] -> Det[CAS='dat', GEN='n', NUM='sg'] N[CAS='dat', GEN='n', NUM='sg'], NP[CAS='gen'] -> Det[CAS='gen', GEN='f', NUM='pl'] N[CAS='gen', GEN='f', NUM='pl'], NP[CAS='gen'] -> Det[CAS='gen', GEN='m', NUM='pl'] N[CAS='gen', GEN='m', NUM='pl'], NP[CAS=

In [49]:
for sentence in generate(g, depth=5, n=100):
    if len(sentence) >= 2:
        print(' '.join(sentence))

und jetzt der Mensch
und jetzt der Mensch
und jetzt der Mensch
und jetzt der Mensch
und jetzt der Person
und jetzt der Person
und jetzt der Person
und jetzt der Person
und jetzt des Mensch
und jetzt des Mensch
und jetzt des Mensch
und jetzt des Mensch
und jetzt des Person
und jetzt des Person
und jetzt des Person
und jetzt des Person
und jetzt dem Mensch
und jetzt dem Mensch
und jetzt dem Mensch
und jetzt dem Mensch
und jetzt dem Person
und jetzt dem Person
und jetzt dem Person
und jetzt dem Person
und jetzt den Mensch
und jetzt den Mensch
und jetzt den Mensch
und jetzt den Mensch
und jetzt den Person
und jetzt den Person
und jetzt den Person
und jetzt den Person
und jetzt die Mensch
und jetzt die Mensch
und jetzt die Mensch
und jetzt die Mensch
und jetzt die Person
und jetzt die Person
und jetzt die Person
und jetzt die Person
und jetzt der Mensch
und jetzt der Mensch
und jetzt der Mensch
und jetzt der Mensch
und jetzt der Person
und jetzt der Person
und jetzt der Person
und jetzt der

#### Generate sentence snippets from feature grammar and item information

In [20]:
# UTTERANCE STRUCTURE: {beginning} description {neighbors}
# beginning of sentence, aka verbs
BOS = []
# item description
descriptions = []
# neighboring items
neighbors = []

#### Generate sentences per turn number

In [21]:
# FIRST TURN
def first_turn_utterances(i):
    sents = list()
    random.choice(i['hyperonym'])
    return sents

In [22]:
# SECOND TURN
def second_turn_utterances(i):
    pass

In [23]:
# THIRD TURN
def third_turn_utterances(i):
    pass

In [24]:
for item in items_dict.keys():
    # utterances by turns separated by 2 blank lines
    utterances = first_turn_utterances(item) + ['\n\n'] + second_turn_utterances(item) + ['\n\n'] + third_turn_utterances(item)
    with open(f'utterances/{item}.txt', 'w', encoding='utf-8') as f:
        for u in utterances:
            f.write(u + '\n')

TypeError: string indices must be integers