### Imports

In [1]:
import json
import random
import re

import nltk
from nltk import CFG
from nltk.parse.generate import generate

random.seed(123)

### Items Dictionary from Items Intent
Including
* item name
* slot name
* location details
* neighboring items
* content items (optional)
* adjectives
* hyperonyms

In [2]:
items_dict = {
    "astronautinnen": {
        "slot": "astronautinnen",
        "location": ["links", "oben", "in der ecke"],
        "neighbors": ["ufo", "raumschiff", "anzügen"],
        "content": [],
        "adjectives": ["3", "weiß", "weißen"],
		"hyperonyms": ["menschen", "personen", "frauen"],
    },
    "ballon": {
        "slot": "ballon",
        "location": [
            "rechts",
            "unten",
            "in der ecke",
            "am rand",
            "auf der rechten seite",
            "über",
        ],
        "neighbors": ["boot", "schiff"],
        "content": [],
        "adjectives": ["rot", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "biene": {
        "slot": "biene",
        "location": ["rechts", "am rand", "auf der rechten seite"],
        "neighbors": [],
        "content": ["streifen"],
        "adjectives": ["gelb", "gestreift"],
		"hyperonyms": ["tier", "insekt", "lebewesen"],
    },
    "boot": {
        "slot": "boot",
        "location": [
            "rechts",
            "unten",
            "in der ecke",
            "am rand",
            "auf der rechten seite",
            "unter",
            "auf",
        ],
        "neighbors": ["ballon", "wasser", "fluss", "roboter"],
        "content": [],
        "adjectives": ["grün", "lächelnd", "schwimmend", "schwimmt"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "fahrzeug"],
    },
    "buchLinksOben": {
        "slot": "buch",
        "location": ["links", "oben", "in der ecke"],
        "neighbors": ["buch", "uhr", "säulen"],
        "content": [],
        "adjectives": ["grün", "blau", "geschlossen"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "buchMitteUnten": {
        "slot": "buch",
        "location": ["in der mitte", "unten", "am rand"],
        "neighbors": ["pfeile", "tisch", "kurven"],
        "content": [],
        "adjectives": ["grün", "geschlossen", "klein"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "buchLinksObenOffen": {
        "slot": "buch",
        "location": ["links", "oben", "in der ecke"],
        "neighbors": ["buch", "uhr", "säulen"],
        "content": [],
        "adjectives": ["aufgeschlagen", "offen", "geöffnet", "klein"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "buchRechtsMitte": {
        "slot": "buch",
        "location": ["rechts", "auf der rechten seite", "unter"],
        "neighbors": ["globus", "spinne", "rauch", "mikroskop"],
        "content": [],
        "adjectives": ["aufgeschlagen", "offen", "geöffnet"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "diagramm": {
        "slot": "diagramm",
        "location": ["rechts", "oben", "am rand", "über", "neben", "an der wand"],
        "neighbors": ["mikroskop", "uhr"],
        "content": ["x", "y", "sigma", "summe", "summenzeichen", "normalverteilung", "gaußkurve", "mathe", "mathematik", "achse"],
        "adjectives": ["bunt", "schwarz", "mathematisch"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "europa": {
        "slot": "europa",
        "location": [
            "unten",
            "links",
            "auf der linken seite",
            "über",
            "unter",
            "neben",
        ],
        "neighbors": ["tisch", "schultasche"],
        "content": ["sterne", "sternen"],
        "adjectives": ["blau", "gelb"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "fff": {
        "slot": "kinder",
        "location": ["oben", "links", "hinter", "unter"],
        "neighbors": ["terminal", "konsole", "astronautinnen", "wolke"],
        "content": ["fahne"],
        "adjectives": ["grün", "2"],
		"hyperonyms": ["menschen", "personen", "kinder"],
    },
    "gleichung": {
        "slot": "gleichung",
        "location": ["unten", "rechts"],
        "neighbors": ["stift", "kolben", "chemie", "labor"],
        "content": ["x", "y", "Gleichheitszeichen"],
        "adjectives": ["weiß"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "globus": {
        "slot": "globus",
        "location": ["in der mitte", "im zentrum"],
        "neighbors": ["wolke", "treppe"],
        "content": ["sockel"],
        "adjectives": ["mittig", "zentral", "rund", "blau", "grün", "rot"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "gluehbirneObenMitteGross": {
        "slot": "glühbirne",
        "location": ["oben", "im oberen teil", "in der mitte", "neben"],
        "neighbors": ["glühbirne", "teleskop"],
        "content": [],
        "adjectives": ["gelb", "groß", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "gluehbirneObenMitteKlein": {
        "slot": "glühbirne",
        "location": ["oben", "im oberen teil", "in der mitte", "neben"],
        "neighbors": ["glühbirne", "globus"],
        "content": [],
        "adjectives": ["gelb", "klein", "rund", "drei"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "kurven": {
        "slot": "kurven",
        "location": ["unten", "links", "mittig", "links von der mitte", "in der mitte"],
        "neighbors": ["buch", "lineal", "tafel", "wolken"],
        "content": [],
        "adjectives": ["weiß", "bunt", "gelb", "rosa", "pink"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "lab": {
        "slot": "labor",
        "location": ["unten", "rechts", "am rand", "neben"],
        "neighbors": ["wasser", "boot", "ballon"],
        "content": ["terminal", "diy", "kasten"],
        "adjectives": ["eckig", "bunt", "rot"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "mikroskop": {
        "slot": "mikroskop",
        "location": ["oben", "rechts", "neben", "unter"],
        "neighbors": ["diagramm", "buch", "tisch", "pflanze", "kugeln"],
        "content": [],
        "adjectives": ["grau", "grün"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "personLinksMitte": {
        "slot": "person",
        "location": ["links", "in der mitte", "neben"],
        "neighbors": ["taube", "vogel", "wolke", "stift"],
        "content": [],
        "adjectives": ["sitzend", "kauernd", "blond", "lila"],
		"hyperonyms": ["mensch", "person"],
    },
    "personMitteMitte": {
        "slot": "person",
        "location": ["in der mitte", "im zentrum", "neben"],
        "neighbors": ["terminal", "konsole", "ordner", "kästen"],
        "content": ["kittel", "brille", "klemmbrett"],
        "adjectives": ["weiß", "grau"],
		"hyperonyms": ["mensch", "person"],
    },
    "personRechtsMitte": {
        "slot": "person",
        "location": ["in der mitte", "rechts", "neben"],
        "neighbors": ["labor", "magnet", "kolben", "sprechblase"],
        "content": ["kittel", "brille"],
        "adjectives": ["weiß", "blond", "gelb"],
		"hyperonyms": ["mensch", "person"],
    },
    "planet": {
        "slot": "planet",
        "location": [
            "oben",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["buch", "astronautinnen"],
        "content": [],
        "adjectives": ["gelb", "gold", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "raumschiff": {
        "slot": "raumschiff",
        "location": [
            "oben",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["astronautinnen", "teleskop", "glühbirne", "terminal"],
        "content": [],
        "adjectives": ["rot", "eckig"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "fahrzeug"],
    },
    "spielKonsole": {
        "slot": "spielkonsole",
        "location": ["in der mitte", "im zentrum", "neben"],
        "neighbors": ["glühbirne", "terminal", "astronautinnen", "würfel"],
        "content": ["tasten", "knöpfe"],
        "adjectives": ["eckig", "rot", "schwarz", "grau", "flach"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "stiftLinksMitte": {
        "slot": "stift",
        "location": [
            "mittig",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["person", "würfel", "tafel"],
        "content": [],
        "adjectives": ["grün", "rosa", "weiß", "spitz"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "schreibutensil"],
    },
    "stiftRechtsUnten": {
        "slot": "stift",
        "location": [
            "unten",
            "rechts",
            "auf der rechten seite",
            "am Rand",
            "neben",
        ],
        "neighbors": ["labor", "ballon", "boot", "gleichung", "konsole", "terminal"],
        "content": [],
        "adjectives": ["rot", "spitz", "rosa", "weiß"],
		"hyperonyms": ["ding", "gegenstand", "objekt", "schreibutensil"],
    },
    "tafel": {
        "slot": "tafel",
        "location": [
            "unten",
            "links",
            "auf der linken seite",
            "am Rand",
            "neben",
            "bei",
        ],
        "neighbors": ["würfel", "stift", "buch", "kurven", "europa"],
        "content": ["zwei", "vier", "komma", "punkt"],
        "adjectives": ["grün", "beschriftet", "beschrieben", "weiß"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "teleskop": {
        "slot": "teleskop",
        "location": ["am Rand", "mittig", "neben", "neben"],
        "neighbors": ["glühbirne", "raumschiff"],
        "content": [],
        "adjectives": ["rot", "blau", "rund", "mikroskopähnlich"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "terminalMitteMitte": {
        "slot": "terminal",
        "location": [
            "in der mitte",
            "im zentrum",
            "neben",
        ],
        "neighbors": [
            "globus",
            "spielkonsole",
            "glühbirne",
            "astronautinnen",
            "würfel",  
        ],
        "content": ["schrift", "hello", "world"],
        "adjectives": ["schwarz", "beschriftet", "weiß", "bunt", "grün"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "uhrLinksOben": {
        "slot": "uhr",
        "location": ["oben", "links", "auf der linken seite", "neben"],
        "neighbors": ["buch", "astronautinnen", "person", "planet",],
        "content": ["zeit"],
        "adjectives": ["gelb", "rund"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "uhrRechtsOben": {
        "slot": "uhr",
        "location": [
            "oben",
            "rechts",
            "auf der rechten seite",
            "am Rand",
            "an der Wand",
            "neben",
        ],
        "neighbors": ["diagramm", "mikroskop"],
        "content": ["zeit"],
        "adjectives": ["blau", "rund", "grün"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
    "wuerfel": {
        "slot": "würfel",
        "location": [
            "mittig",
            "links",
            "auf der linken seite",
            "neben",
        ],
        "neighbors": ["person", "spielkonsole", "kurven", "terminal"],
        "content": ["buchstaben", "a", "b"],
        "adjectives": ["blau", "türkis", "gelb", "lila", "bunt"],
		"hyperonyms": ["ding", "gegenstand", "objekt"],
    },
}

### Interaction Model with detailed slot names, values, and synonyms

In [3]:
model = json.load(open('interaction_model.json', 'r', encoding='utf-8'))

In [4]:
# create a nested dictionary from interaction model slots {slot: dict of slot values: list of their synonyms}
slots = dict()
for s in model["interactionModel"]["languageModel"]["types"]:
    #print(s)
    slots[s['name']] = dict()
    for v in s['values']:
        slots[s['name']][v['name']['value']] = list()
        if 'synonyms' in v['name']:
            slots[s['name']][v['name']['value']] = v['name']['synonyms']
        #slots[s['name']] += [v['name']['value']]
    # replace ' by `
    #for slot, index in zip(slots[s['name']], range(len(slots[s['name']]))):
        #slots[s['name']][index] = slot.replace('\'', '`')
print(slots['object'])

{'other': ['Absolvent', 'Student', 'Gesicht', 'Smiley', 'Sterne', 'Stern', 'Bildschirm', 'Podest', 'Binärcode', 'Stühle', 'Stuhl', 'Seeigel', 'Mine', 'Pfeile', 'Pfeil', 'Legobaustein', 'Legostein', 'Tisch', 'ABC', 'Molekül', 'Atom', 'Schrank', 'Delfin', 'Medaille', 'Tauben', 'Taube', 'Vögel', 'Vogel', 'Pfeile', 'Pfeil', 'Regenbogen', 'Reagenzglas', 'Schultasche', 'Säulen', 'Spinne', 'Wolken', 'Wolke', 'Blumentopf', 'Pflanze', 'Treppe', 'Lineal', 'Büro', 'Schreibtisch', 'Giraffenkopf', 'Giraffe', 'Zahnrad'], 'Ding': ['Sachen', 'Sache', 'Teile', 'Gegenstände', 'Dinger', 'Dingens', 'Dings', 'Objekt', 'Gegenstand', 'Teil'], 'Uhr': [], 'Würfel': ['Buchstabenwürfel'], 'Terminal': ['Programmfenster', 'Bildschirm', 'Computerbildschirm', 'Konsole'], 'Teleskop': ['Fernrohr'], 'Tafel': ['Schultafel'], 'Stift': ['Schreibutensil', 'Buntstift'], 'Spielkonsole': ['Gameboy', 'Switch', 'Spielekonsole'], 'Raumschiff': ['Spaceshuttle', 'Flugzeug'], 'Planet': ['Saturn'], 'Person': ['Ärztin', 'Arzt', 'Inge

### Encode grammatical properties of nouns, determiners, and verbs/sentence beginnings (BOS)

In [65]:
OBJECTS = """
N[CAS=?c,NUM=sg,GEN=m] -> 'Absolvent'
N[CAS=?c,NUM=sg,GEN=m] -> 'Student'
N[CAS=?c,NUM=sg,GEN=n] -> 'Gesicht'
N[CAS=?c,NUM=sg,GEN=m] -> 'Smiley'
N[CAS=?c,NUM=pl,GEN=m] -> 'Sterne'
N[CAS=?c,NUM=sg,GEN=m] -> 'Stern'
N[CAS=?c,NUM=sg,GEN=m] -> 'Bildschirm'
N[CAS=?c,NUM=sg,GEN=n] -> 'Podest'
N[CAS=?c,NUM=sg,GEN=m] -> 'Binärcode'
N[CAS=?c,NUM=pl,GEN=m] -> 'Stühle'
N[CAS=?c,NUM=sg,GEN=m] -> 'Stuhl'
N[CAS=?c,NUM=sg,GEN=m] -> 'Seeigel'
N[CAS=?c,NUM=sg,GEN=f] -> 'Mine'
N[CAS=?c,NUM=pl,GEN=m] -> 'Pfeile'
N[CAS=?c,NUM=sg,GEN=m] -> 'Pfeil'
N[CAS=?c,NUM=sg,GEN=m] -> 'Legobaustein'
N[CAS=?c,NUM=sg,GEN=m] -> 'Legostein'
N[CAS=?c,NUM=sg,GEN=m] -> 'Tisch'
N[CAS=?c,NUM=sg,GEN=n] -> 'ABC'
N[CAS=?c,NUM=sg,GEN=n] -> 'Molekül'
N[CAS=?c,NUM=sg,GEN=n] -> 'Atom'
N[CAS=?c,NUM=sg,GEN=m] -> 'Schrank'
N[CAS=?c,NUM=sg,GEN=m] -> 'Delfin'
N[CAS=?c,NUM=sg,GEN=f] -> 'Medaille'
N[CAS=?c,NUM=pl,GEN=f] -> 'Tauben'
N[CAS=?c,NUM=sg,GEN=f] -> 'Taube'
N[CAS=?c,NUM=pl,GEN=m] -> 'Vögel'
N[CAS=?c,NUM=sg,GEN=m] -> 'Vogel'
N[CAS=?c,NUM=pl,GEN=m] -> 'Pfeile'
N[CAS=?c,NUM=sg,GEN=m] -> 'Pfeil'
N[CAS=?c,NUM=sg,GEN=m] -> 'Regenbogen'
N[CAS=?c,NUM=sg,GEN=n] -> 'Reagenzglas'
N[CAS=?c,NUM=sg,GEN=f] -> 'Schultasche'
N[CAS=?c,NUM=pl,GEN=f] -> 'Säulen'
N[CAS=?c,NUM=sg,GEN=f] -> 'Spinne'
N[CAS=?c,NUM=pl,GEN=f] -> 'Wolken'
N[CAS=?c,NUM=sg,GEN=f] -> 'Wolke'
N[CAS=?c,NUM=sg,GEN=m] -> 'Blumentopf'
N[CAS=?c,NUM=sg,GEN=f] -> 'Pflanze'
N[CAS=?c,NUM=sg,GEN=f] -> 'Treppe'
N[CAS=?c,NUM=sg,GEN=n] -> 'Lineal'
N[CAS=?c,NUM=sg,GEN=n] -> 'Büro'
N[CAS=?c,NUM=sg,GEN=m] -> 'Schreibtisch'
N[CAS=?c,NUM=sg,GEN=m] -> 'Giraffenkopf'
N[CAS=?c,NUM=sg,GEN=f] -> 'Giraffe'
N[CAS=?c,NUM=sg,GEN=n] -> 'Zahnrad'
N[CAS=?c,NUM=sg,GEN=?g] -> 'other'
N[CAS=?c,NUM=pl,GEN=f] -> 'Sachen'
N[CAS=?c,NUM=sg,GEN=f] -> 'Sache'
N[CAS=?c,NUM=pl,GEN=n] -> 'Teile'
N[CAS=?c,NUM=pl,GEN=m] -> 'Gegenstände'
N[CAS=?c,NUM=pl,GEN=n] -> 'Dinger'
N[CAS=?c,NUM=sg,GEN=n] -> 'Dingens'
N[CAS=?c,NUM=sg,GEN=n] -> 'Dings'
N[CAS=?c,NUM=sg,GEN=n] -> 'Objekt'
N[CAS=?c,NUM=sg,GEN=m] -> 'Gegenstand'
N[CAS=?c,NUM=sg,GEN=n] -> 'Teil'
N[CAS=?c,NUM=sg,GEN=n] -> 'Ding'
N[CAS=?c,NUM=sg,GEN=f] -> 'Uhr'
N[CAS=?c,NUM=sg,GEN=m] -> 'Buchstabenwürfel'
N[CAS=?c,NUM=sg,GEN=m] -> 'Würfel'
N[CAS=?c,NUM=sg,GEN=n] -> 'Programmfenster'
N[CAS=?c,NUM=sg,GEN=m] -> 'Bildschirm'
N[CAS=?c,NUM=sg,GEN=m] -> 'Computerbildschirm'
N[CAS=?c,NUM=sg,GEN=f] -> 'Konsole'
N[CAS=?c,NUM=sg,GEN=m] -> 'Terminal'
N[CAS=?c,NUM=sg,GEN=n] -> 'Fernrohr'
N[CAS=?c,NUM=sg,GEN=n] -> 'Teleskop'
N[CAS=?c,NUM=sg,GEN=f] -> 'Schultafel'
N[CAS=?c,NUM=sg,GEN=f] -> 'Tafel'
N[CAS=?c,NUM=sg,GEN=n] -> 'Schreibutensil'
N[CAS=?c,NUM=sg,GEN=m] -> 'Buntstift'
N[CAS=?c,NUM=sg,GEN=m] -> 'Stift'
N[CAS=?c,NUM=sg,GEN=m] -> 'Gameboy'
N[CAS=?c,NUM=sg,GEN=f] -> 'Switch'
N[CAS=?c,NUM=sg,GEN=f] -> 'Spielekonsole'
N[CAS=?c,NUM=sg,GEN=f] -> 'Spielkonsole'
N[CAS=?c,NUM=sg,GEN=n] -> 'Spaceshuttle'
N[CAS=?c,NUM=sg,GEN=n] -> 'Flugzeug'
N[CAS=?c,NUM=sg,GEN=n] -> 'Raumschiff'
N[CAS=?c,NUM=sg,GEN=m] -> 'Saturn'
N[CAS=?c,NUM=sg,GEN=m] -> 'Planet'
N[CAS=?c,NUM=sg,GEN=f] -> 'Ärztin'
N[CAS=?c,NUM=sg,GEN=m] -> 'Arzt'
N[CAS=?c,NUM=sg,GEN=f] -> 'Ingenieurin'
N[CAS=?c,NUM=sg,GEN=m] -> 'Ingenieur'
N[CAS=?c,NUM=sg,GEN=m] -> 'Mann'
N[CAS=?c,NUM=sg,GEN=f] -> 'Frau'
N[CAS=?c,NUM=sg,GEN=f] -> 'Wissenschaftlerin'
N[CAS=?c,NUM=sg,GEN=m] -> 'Wissenschaftler'
N[CAS=?c,NUM=sg,GEN=f] -> 'Forscherin'
N[CAS=?c,NUM=sg,GEN=m] -> 'Forscher'
N[CAS=?c,NUM=pl,GEN=f] -> 'Personen'
N[CAS=?c,NUM=sg,GEN=m] -> 'Mensch'
N[CAS=?c,NUM=sg,GEN=f] -> 'Person'
N[CAS=?c,NUM=sg,GEN=n] -> 'Teleskop'
N[CAS=?c,NUM=sg,GEN=n] -> 'Mikroskop'
N[CAS=?c,NUM=sg,GEN=m] -> 'Kasten'
N[CAS=?c,NUM=sg,GEN=n] -> 'Lab'
N[CAS=?c,NUM=sg,GEN=n] -> 'Labor'
N[CAS=?c,NUM=pl,GEN=f] -> 'Grafiken'
N[CAS=?c,NUM=sg,GEN=n] -> 'Diagramm'
N[CAS=?c,NUM=pl,GEN=f] -> 'Wellen'
N[CAS=?c,NUM=pl,GEN=f] -> 'Kurven'
N[CAS=?c,NUM=sg,GEN=f] -> 'Birne'
N[CAS=?c,NUM=sg,GEN=f] -> 'Glühbirne'
N[CAS=?c,NUM=sg,GEN=m] -> 'Screen'
N[CAS=?c,NUM=sg,GEN=f] -> 'Gleichung'
N[CAS=?c,NUM=sg,GEN=f] -> 'Demo'
N[CAS=?c,NUM=pl,GEN=f] -> 'Klimaaktivistinnen'
N[CAS=?c,NUM=pl,GEN=m] -> 'Klimaaktivisten'
N[CAS=?c,NUM=?n,GEN=?g] -> 'Fridays for Future'
N[CAS=?c,NUM=?n,GEN=?g] -> 'FFF'
N[CAS=?c,NUM=pl,GEN=n] -> 'Kinder mit Flagge'
N[CAS=?c,NUM=pl,GEN=?g] -> 'Friends For Future'
N[CAS=?c,NUM=pl,GEN=?g] -> 'Friends'
N[CAS=?c,NUM=sg,GEN=?g] -> 'Future'
N[CAS=?c,NUM=pl,GEN=n] -> 'Kinder'
N[CAS=?c,NUM=sg,GEN=f] -> 'Flagge'
N[CAS=?c,NUM=sg,GEN=f] -> 'Fahne'
N[CAS=?c,NUM=sg,GEN=f] -> 'EU'
N[CAS=?c,NUM=sg,GEN=f] -> 'Europaflagge'
N[CAS=?c,NUM=sg,GEN=n] -> 'Europa'
N[CAS=?c,NUM=sg,GEN=f] -> 'Tafel'
N[CAS=?c,NUM=sg,GEN=n] -> 'Koordinatensystem'
N[CAS=?c,NUM=sg,GEN=n] -> 'Diagramm'
N[CAS=?c,NUM=sg,GEN=n] -> 'Heft'
N[CAS=?c,NUM=sg,GEN=n] -> 'Buch'
N[CAS=?c,NUM=sg,GEN=n] -> 'Schiff'
N[CAS=?c,NUM=sg,GEN=n] -> 'Boot'
N[CAS=?c,NUM=pl,GEN=m] -> 'Drillinge'
N[CAS=?c,NUM=pl,GEN=f] -> 'Raumfahrerinnen'
N[CAS=?c,NUM=pl,GEN=f] -> 'Frauen'
N[CAS=?c,NUM=pl,GEN=f] -> 'Astronautinnen'
N[CAS=?c,NUM=sg,GEN=m] -> 'Luftballon'
N[CAS=?c,NUM=sg,GEN=m] -> 'Ball'
N[CAS=?c,NUM=sg,GEN=m] -> 'Ballon'
N[CAS=?c,NUM=sg,GEN=n] -> 'Tier'
N[CAS=?c,NUM=sg,GEN=n] -> 'Insekt'
N[CAS=?c,NUM=sg,GEN=f] -> 'Biene'
N[CAS=?c,NUM=sg,GEN=f] -> 'Weltkugel'
N[CAS=?c,NUM=sg,GEN=f] -> 'Erdkugel'
N[CAS=?c,NUM=sg,GEN=m] -> 'Globus'
"""

In [66]:
ARTICLES = """
Det[CAS=nom,NUM=sg,GEN=m] -> 'der'
Det[CAS=gen,NUM=sg,GEN=m] -> 'des'
Det[CAS=dat,NUM=sg,GEN=m] -> 'dem'
Det[CAS=acc,NUM=sg,GEN=m] -> 'den'
Det[CAS=nom,NUM=sg,GEN=f] -> 'die'
Det[CAS=gen,NUM=sg,GEN=f] -> 'der'
Det[CAS=dat,NUM=sg,GEN=f] -> 'der'
Det[CAS=acc,NUM=sg,GEN=f] -> 'die'
Det[CAS=nom,NUM=sg,GEN=n] -> 'das'
Det[CAS=gen,NUM=sg,GEN=n] -> 'des'
Det[CAS=dat,NUM=sg,GEN=n] -> 'dem'
Det[CAS=acc,NUM=sg,GEN=n] -> 'das'
Det[CAS=nom,NUM=pl,GEN=?g] -> 'die'
Det[CAS=gen,NUM=pl,GEN=?g] -> 'der'
Det[CAS=dat,NUM=pl,GEN=?g] -> 'den'
Det[CAS=acc,NUM=pl,GEN=?g] -> 'die'
"""

In [67]:
ADJECTIVE_ENDINGS = """
Adj[CAS=nom,NUM=sg,GEN=m] -> 'e'
Adj[CAS=gen,NUM=sg,GEN=m] -> 'en'
Adj[CAS=dat,NUM=sg,GEN=m] -> 'en'
Adj[CAS=acc,NUM=sg,GEN=m] -> 'en'
Adj[CAS=nom,NUM=sg,GEN=f] -> 'e'
Adj[CAS=gen,NUM=sg,GEN=f] -> 'en'
Adj[CAS=dat,NUM=sg,GEN=f] -> 'en'
Adj[CAS=acc,NUM=sg,GEN=f] -> 'e'
Adj[CAS=nom,NUM=sg,GEN=n] -> 'e'
Adj[CAS=gen,NUM=sg,GEN=n] -> 'en'
Adj[CAS=dat,NUM=sg,GEN=n] -> 'en'
Adj[CAS=acc,NUM=sg,GEN=n] -> 'e'
Adj[CAS=?c,NUM=pl,GEN=?g] -> 'en'
"""

In [68]:
BOS = """
Bos[CAS=nom] -> 'und jetzt'
Bos[CAS=acc] -> 'bitte zeig mir'
Bos[CAS=nom] -> 'das objekt ist'
Bos[CAS=nom] -> 'es ist'
Bos[CAS=acc] -> 'es gibt'
Bos[CAS=acc] -> 'zeig mal'
Bos[CAS=acc] -> 'wähl mal'
Bos[CAS=nom] -> 'das ding ist'
Bos[CAS=acc] -> 'zeich'
Bos[CAS=acc] -> 'ich nehme'
Bos[CAS=acc] -> 'bitte wähle'
Bos[CAS=acc] -> 'bitte finde'
Bos[CAS=nom] -> 'dann noch'
Bos[CAS=nom] -> 'dann'
Bos[CAS=acc] -> 'finde'
Bos[CAS=acc] -> 'wähle mal'
Bos[CAS=acc] -> 'ich sehe'
Bos[CAS=acc] -> 'nimm mal'
Bos[CAS=nom] -> 'der gegenstand ist'
Bos[CAS=acc] -> 'ich denke an'
Bos[CAS=acc] -> 'ich wähle'
Bos[CAS=acc] -> 'wähle'
Bos[CAS=acc] -> 'siehst du'
Bos[CAS=acc] -> 'zeig'
Bos[CAS=nom] -> 'als nächstes'
Bos[CAS=dat] -> 'weiter mit'
Bos[CAS=nom] -> 'bitte zeige'
Bos[CAS=nom] -> 'das nächste objekt ist'
Bos[CAS=acc] -> 'ich beschreibe'
Bos[CAS=nom] -> 'jetzt'
Bos[CAS=nom] -> 'der nächste gegenstand ist'
Bos[CAS=acc] -> 'zeich mal'
Bos[CAS=acc] -> 'du siehst'
Bos[CAS=acc] -> 'zeich ma'
Bos[CAS=acc] -> 'wähl'
Bos[CAS=acc] -> 'zeig mir'
Bos[CAS=acc] -> 'ich meine'
Bos[CAS=nom] -> 'das ist'
Bos[CAS=dat] -> 'weiter geht`s mit'
Bos[CAS=acc] -> 'nimm'
Bos[CAS=acc] -> 'bitte nimm'
"""

In [69]:
NONTERMINALS = """
S -> Bos[CAS=?c] NP[CAS=?c]
S -> Bos[CAS=?c] NP[CAS=?c] Loc
NP[CAS=?c] -> Det[CAS=?c,NUM=?n,GEN=?g] N[CAS=?c,NUM=?n,GEN=?g]"""

In [70]:
def CFG_transform(rule):
    rule = rule.replace('[', '_')
    rule = rule.replace(',', '_')
    rule = rule.replace('=', '')
    rule = rule.replace(']', '')
    rule = rule.replace('?', '')
    return rule

In [58]:
r = """
S -> NP[GEN=?g]
NP[GEN=?g] -> Det[GEN=?g] N[GEN=?g]
Det[GEN=?g] -> Det[NUM=?n,CAS=?c,GEN=?g]
N[GEN=?g] -> N[NUM=?n,CAS=?c,GEN=?g]
Det[NUM=sg,CAS=nom,GEN=m] -> 'der'
Det[NUM=sg,CAS=gen,GEN=m] -> 'des'
Det[NUM=sg,CAS=dat,GEN=m] -> 'dem'
Det[NUM=sg,CAS=acc,GEN=m] -> 'den'
Det[NUM=sg,CAS=nom,GEN=f] -> 'die'
Det[NUM=sg,CAS=gen,GEN=f] -> 'der'
Det[NUM=sg,CAS=dat,GEN=f] -> 'der'
Det[NUM=sg,CAS=acc,GEN=f] -> 'die'
N[NUM=sg,CAS=?c,GEN=m] -> 'Buntstift'
N[NUM=sg,CAS=?c,GEN=m] -> 'Stift'
N[NUM=sg,CAS=?c,GEN=m] -> 'Gameboy'
N[NUM=sg,CAS=?c,GEN=f] -> 'Flagge'
N[NUM=sg,CAS=?c,GEN=f] -> 'Fahne'
N[NUM=sg,CAS=?c,GEN=f] -> 'EU'
"""
r_list = ['% start S']
for rule in r.split('\n'):
    r_list += specify_rule(rule)
rules_cfg = [CFG_transform(r) for r in r_list]
rules = '\n'.join(rules_cfg)
fg = CFG.fromstring(rules)
print(rules)
#gram = nltk.grammar.FeatureGrammar.fromstring('\n'.join(r_list))
for sentence in generate(fg, depth=5, n=100):
    if len(sentence) >= 2:
        print(' '.join(sentence))

% start S

S -> NP_GENn
S -> NP_GENm
S -> NP_GENf
NP_GENm -> Det_GENm N_GENm
NP_GENn -> Det_GENn N_GENn
NP_GENf -> Det_GENf N_GENf
Det_GENm -> Det_NUMpl_CASdat_GENm
Det_GENm -> Det_NUMsg_CASgen_GENm
Det_GENf -> Det_NUMsg_CASdat_GENf
Det_GENm -> Det_NUMsg_CASacc_GENm
Det_GENn -> Det_NUMsg_CASdat_GENn
Det_GENf -> Det_NUMpl_CASgen_GENf
Det_GENn -> Det_NUMsg_CASgen_GENn
Det_GENf -> Det_NUMpl_CASdat_GENf
Det_GENf -> Det_NUMpl_CASnom_GENf
Det_GENn -> Det_NUMpl_CASnom_GENn
Det_GENm -> Det_NUMsg_CASnom_GENm
Det_GENn -> Det_NUMpl_CASgen_GENn
Det_GENf -> Det_NUMsg_CASacc_GENf
Det_GENn -> Det_NUMsg_CASacc_GENn
Det_GENn -> Det_NUMpl_CASdat_GENn
Det_GENm -> Det_NUMsg_CASdat_GENm
Det_GENm -> Det_NUMpl_CASnom_GENm
Det_GENn -> Det_NUMpl_CASacc_GENn
Det_GENm -> Det_NUMpl_CASgen_GENm
Det_GENf -> Det_NUMsg_CASgen_GENf
Det_GENm -> Det_NUMpl_CASacc_GENm
Det_GENf -> Det_NUMsg_CASnom_GENf
Det_GENn -> Det_NUMsg_CASnom_GENn
Det_GENf -> Det_NUMpl_CASacc_GENf
N_GENf -> N_NUMpl_CASdat_GENf
N_GENn -> N_NUMsg_CASge

In [44]:
NUM = {'sg', 'pl'}
CAS = {'nom', 'acc', 'gen', 'dat'}
GEN = {'m', 'f', 'n'}

def specify_rule(r):
    """specify feature grammar rule containing ? for all possible features and values"""
    new_rules = set([r])
    if '?g' in r:
        for g in GEN:
            new = set([rule.replace('?g', g) for rule in new_rules])
            new_rules = new_rules.union(new)  
    if '?c' in r:
        for c in CAS:
            new = set([rule.replace('?c', c) for rule in new_rules])
            new_rules = new_rules.union(new)
    if '?n' in r:
        for n in NUM:
            new = set([rule.replace('?n', n) for rule in new_rules])
            new_rules = new_rules.union(new)
    new_rules = new_rules.difference(set([rule for rule in new_rules if '?' in rule]))
    return list(new_rules)

#### Merge slots, grammatical information to feature grammar

In [71]:
def featgram(i, turn=1):
    """create a feature grammar for an item"""
    d = items_dict[i]  # load item's dict
    # overall structure: BOS + description
    rules = ["% start S"]
    # item synonyms from slot
    synonyms = slots['object'][d["slot"].capitalize()]
    # location information
    locs = d['location']  
    loc_rules = [f'Loc -> \'{l}\'' for l in locs if l != 'neben']  # ignore transitive location for now
    # non terminal rules, replace general rule by specified rules
    for r in NONTERMINALS.split('\n'):
        rules += specify_rule(r)
    # BOS, articles and adjective endings
    rules += (BOS.split('\n') + ARTICLES.split('\n') + ADJECTIVE_ENDINGS.split('\n')) 
    if turn == 1:
        # BOS + Det + dict[adjectives] + Adj(ending) + hyperonym + location
        hyps = d['hyperonyms']
        hyp_rules = [r for r in OBJECTS.split('\n') if '\'' in r and r.split('\'')[1].lower() in hyps]
        for r in hyp_rules:
            rules += specify_rule(r)
    else:
        # BOS + dict[adjectives] + Adj(ending) + slot + {bei/neben Det neighbors}
        objs = [r for r in OBJECTS.split('\n') if '\'' in r and r.split('\'')[1].lower() in d['slot']]
        for r in objs:
            rules += specify_rule(r)
    rules = [CFG_transform(r) for r in rules]
    fg = CFG.fromstring(rules)
    #fg = nltk.grammar.FeatureGrammar.fromstring('\n'.join(rules))
    print(fg.productions())
    return fg

In [72]:
g = featgram('personRechtsMitte')

[S -> Bos_CASnom NP_CASnom, S -> Bos_CASacc NP_CASacc, S -> Bos_CASgen NP_CASgen, S -> Bos_CASdat NP_CASdat, S -> Bos_CASdat NP_CASdat Loc, S -> Bos_CASgen NP_CASgen Loc, S -> Bos_CASacc NP_CASacc Loc, S -> Bos_CASnom NP_CASnom Loc, NP_CASnom -> Det_CASnom_NUMsg_GENm N_CASnom_NUMsg_GENm, NP_CASdat -> Det_CASdat_NUMsg_GENm N_CASdat_NUMsg_GENm, NP_CASgen -> Det_CASgen_NUMpl_GENn N_CASgen_NUMpl_GENn, NP_CASnom -> Det_CASnom_NUMpl_GENm N_CASnom_NUMpl_GENm, NP_CASacc -> Det_CASacc_NUMpl_GENn N_CASacc_NUMpl_GENn, NP_CASdat -> Det_CASdat_NUMsg_GENn N_CASdat_NUMsg_GENn, NP_CASgen -> Det_CASgen_NUMpl_GENf N_CASgen_NUMpl_GENf, NP_CASgen -> Det_CASgen_NUMpl_GENm N_CASgen_NUMpl_GENm, NP_CASdat -> Det_CASdat_NUMsg_GENf N_CASdat_NUMsg_GENf, NP_CASacc -> Det_CASacc_NUMsg_GENf N_CASacc_NUMsg_GENf, NP_CASgen -> Det_CASgen_NUMsg_GENn N_CASgen_NUMsg_GENn, NP_CASnom -> Det_CASnom_NUMpl_GENf N_CASnom_NUMpl_GENf, NP_CASgen -> Det_CASgen_NUMsg_GENf N_CASgen_NUMsg_GENf, NP_CASdat -> Det_CASdat_NUMpl_GENm N_CA

In [73]:
sents = set()
for sentence in generate(g, depth=5, n=10000):
    if len(sentence) >= 2:
        s = ' '.join(sentence)
        print(s)
        sents.add(s)
print(sents)

und jetzt der Mensch
und jetzt die Person
das objekt ist der Mensch
das objekt ist die Person
es ist der Mensch
es ist die Person
das ding ist der Mensch
das ding ist die Person
dann noch der Mensch
dann noch die Person
dann der Mensch
dann die Person
der gegenstand ist der Mensch
der gegenstand ist die Person
als nächstes der Mensch
als nächstes die Person
bitte zeige der Mensch
bitte zeige die Person
das nächste objekt ist der Mensch
das nächste objekt ist die Person
jetzt der Mensch
jetzt die Person
der nächste gegenstand ist der Mensch
der nächste gegenstand ist die Person
das ist der Mensch
das ist die Person
bitte zeig mir die Person
bitte zeig mir den Mensch
es gibt die Person
es gibt den Mensch
zeig mal die Person
zeig mal den Mensch
wähl mal die Person
wähl mal den Mensch
zeich die Person
zeich den Mensch
ich nehme die Person
ich nehme den Mensch
bitte wähle die Person
bitte wähle den Mensch
bitte finde die Person
bitte finde den Mensch
finde die Person
finde den Mensch
wähle 

#### Generate sentence snippets from feature grammar and item information

In [20]:
# UTTERANCE STRUCTURE: {beginning} description {neighbors}
# beginning of sentence, aka verbs
BOS = []
# item description
descriptions = []
# neighboring items
neighbors = []

#### Generate sentences per turn number

In [21]:
# FIRST TURN
def first_turn_utterances(i):
    sents = list()
    random.choice(i['hyperonym'])
    return sents

In [22]:
# SECOND TURN
def second_turn_utterances(i):
    pass

In [23]:
# THIRD TURN
def third_turn_utterances(i):
    pass

In [24]:
for item in items_dict.keys():
    # utterances by turns separated by 2 blank lines
    utterances = first_turn_utterances(item) + ['\n\n'] + second_turn_utterances(item) + ['\n\n'] + third_turn_utterances(item)
    with open(f'utterances/{item}.txt', 'w', encoding='utf-8') as f:
        for u in utterances:
            f.write(u + '\n')

TypeError: string indices must be integers