In [1]:
# !pip install nltk

import nltk
from nltk import CFG
from nltk.parse.generate import generate
nltk.download('punkt')

[nltk_data] Downloading package punkt to /homes/sohawan2/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt.zip.


True

In [21]:
### 上下文无关文法示例
# 本笔记本展示了几个CFG(上下文无关文法)的实例。

In [24]:
# 算术表达式的文法
arithmetic_grammar = CFG.fromstring("""
    S -> E
    E -> E '+' T | E '-' T | T
    T -> T '*' F | T '/' F | F
    F -> '(' E ')' | 'number'
""")

print("算术文法规则：")
print(arithmetic_grammar)

算术文法规则：
Grammar with 9 productions (start state = S)
    S -> E
    E -> E '+' T
    E -> E '-' T
    E -> T
    T -> T '*' F
    T -> T '/' F
    T -> F
    F -> '(' E ')'
    F -> 'number'


In [14]:
# 简单德语句子的文法
german_grammar = CFG.fromstring("""
    S -> NP VP
    NP -> Det N | Det ADJ N
    VP -> V | V NP
    Det -> 'der' | 'die' | 'das'
    N -> 'Hund' | 'Katze' | 'Buch'
    V -> 'läuft' | 'liest' | 'schläft'
    ADJ -> 'große' | 'kleine' | 'rote'
""")

print("德语句子文法规则：")
print(german_grammar)

德语句子文法规则：
Grammar with 17 productions (start state = S)
    S -> NP VP
    NP -> Det N
    NP -> Det ADJ N
    VP -> V
    VP -> V NP
    Det -> 'der'
    Det -> 'die'
    Det -> 'das'
    N -> 'Hund'
    N -> 'Katze'
    N -> 'Buch'
    V -> 'läuft'
    V -> 'liest'
    V -> 'schläft'
    ADJ -> 'große'
    ADJ -> 'kleine'
    ADJ -> 'rote'


In [15]:
print("使用德语文法生成的示例句子：")
for sentence in generate(german_grammar, n=5):
    print(' '.join(sentence))

使用德语文法生成的示例句子：
der Hund läuft
der Hund liest
der Hund schläft
der Hund läuft der Hund
der Hund läuft der Katze


In [16]:
# 回文串文法
palindrome_grammar = CFG.fromstring("""
    S -> 'a' S 'a' | 'b' S 'b' | 'a' | 'b' | ''
""")

print("回文串文法规则：")
print(palindrome_grammar)

回文串文法规则：
Grammar with 5 productions (start state = S)
    S -> 'a' S 'a'
    S -> 'b' S 'b'
    S -> 'a'
    S -> 'b'
    S -> ''


In [17]:
from nltk import ChartParser

parser = ChartParser(german_grammar)
test_sentence = ['der', 'kleine', 'Hund', 'läuft']

print("句子语法树分析结果：", ' '.join(test_sentence))
for tree in parser.parse(test_sentence):
    tree.pretty_print()

句子语法树分析结果： der kleine Hund läuft
            S            
       _____|_________    
      NP              VP 
  ____|_________      |   
Det  ADJ        N     V  
 |    |         |     |   
der kleine     Hund läuft

