# Einfache Syntaxprüfung

Damit Programmcode vom Computer verarbeitet werden kann, muss er in Maschinensprache übersetzt werden. Als erster Schritt (Syntaktische Analyse) wird dabei die Syntax der Eingabe überprüft und strukturiert.

Am Beispiel der einfachen englischen Aussagesätze von vorhin möchten wir Euch zeigen, was ein Parser macht, nämlich die **Überprüfung der Syntax** (für uns die *Validierung eines englischen Aussagesatzes*) und die **Strukturierung in einem Syntaxbaum** (den Ihr hier als Nebenprodukt auch sehen könnt – für Euch wäre das dann eher die *Zerlegung in Subjekt, Prädikat und Objekt*).

Anhand der Beispielsätze
* Joe likes Kamala.
* Kamala likes Joe.
* She likes Donald.
* Donald likes her.
* Joe likes it.
* It likes Joe.

haben wir vorhin die folgende Grammatik definiert:

## Grammatik in [EBNF](https://de.wikipedia.org/wiki/Erweiterte_Backus-Naur-Form)
    
**sentence:** subject predicate object "."

**subject:** NAME | SUBJ_DECL

**predicate:** VERB

**object:** NAME | OBJ_DECL

**VERB:** "likes" | "sees"

**NAME:** "Joe" | "Kamala" | "Donald"

**SUBJ_DECL:** "He" | "It" | "She"

**OBJ_DECL:** "him" | "it" | "her"

Um das Beispiel laufen zu lassen wird eine Bibliothek benötigt, die für die Session installiert werden muss. Die Installation erfolgt nicht auf Euren Rechnern und ist nötig, damit der Code weiter unten funktioniert. Deshalb einfach ungeniert ausführen, es ist nachher wieder weg.

In [35]:
# Nach der ersten Ausführung die folgende Zeile auskommentieren mit #
#!pip install lark

Der folgende Code enthält das Programm. Es muss ausgeführt werden, damit Ihr Eure Sätze testen könnt.

In [1]:
# Imports
from lark import Lark, tree

# Grammar definition
grammar = """
    sentence: subject predicate object "."

    subject: NAME | SUBJ_DECL
    
    predicate: VERB
    
    object: NAME | OBJ_DECL
    
    VERB: "likes" | "sees"
    
    NAME: "Joe" | "Kamala" | "Donald"
    
    SUBJ_DECL: "He" | "It" | "She"
    
    OBJ_DECL: "him" | "it" | "her"
    
    %import common.WS
    %ignore WS
"""

# Parser definition
parser = Lark(grammar, start='sentence', ambiguity='explicit')

# Validation function
def validate_sentence(sentence):
    #user_input = input("Please enter your sentence: ")
    try:
        t = parser.parse(sentence)
    except: # Most basic exception handling as we just want to validate input
        print('Your sentence is invalid.')
        return
    print('Your sentence is valid. Your Syntax tree:')
    print(t.pretty())

Um alle Sätze mal schnell durchzuprüfen, können wir sie in einem Array speichern und dieses automatisch durchgehen:

In [2]:
sentences = ["Joe likes Kamala.", 
             "Kamala likes Joe.", 
             "She likes Donald.", 
             "Donald likes her.",
             "Joe likes it.",
             "It likes Joe."]

for sample in sentences:
    print("- Validating the following sentence: ", sample)
    validate_sentence(sample)
    

- Validating the following sentence:  Joe likes Kamala.
Your sentence is valid. Your Syntax tree:
sentence
  subject	Joe
  predicate	likes
  object	Kamala

- Validating the following sentence:  Kamala likes Joe.
Your sentence is valid. Your Syntax tree:
sentence
  subject	Kamala
  predicate	likes
  object	Joe

- Validating the following sentence:  She likes Donald.
Your sentence is valid. Your Syntax tree:
sentence
  subject	She
  predicate	likes
  object	Donald

- Validating the following sentence:  Donald likes her.
Your sentence is valid. Your Syntax tree:
sentence
  subject	Donald
  predicate	likes
  object	her

- Validating the following sentence:  Joe likes it.
Your sentence is valid. Your Syntax tree:
sentence
  subject	Joe
  predicate	likes
  object	it

- Validating the following sentence:  It likes Joe.
Your sentence is valid. Your Syntax tree:
sentence
  subject	It
  predicate	likes
  object	Joe



Nun seid Ihr dran: Wenn Ihr die folgende Zelle ausführt, werdet Ihr aufgefordert, eure eigenen Sätze einzugeben.

In der Definition der Grammatik gibt es neben dem Verb "likes" noch ein zweites Verb, "sees". Ihr könnt Die Grammatik oben auch erweitern, z.B. mit euren Namen, dann müsst Ihr die entsprechende Zelle einfach noch einmal ausführen.

Die folgende Zeile könnt Ihr beliebig oft ausführen, jeweils mit dem Play-Button oder (mit der Tastenkombination Shift und Enter).

In [3]:
user_input = input("Please enter your sentence: ")
validate_sentence(user_input)

Please enter your sentence: He likes him.
Your sentence is valid. Your Syntax tree:
sentence
  subject	He
  predicate	likes
  object	him

