In [10]:
import nltk

sent = ['вася читает мою книгу', 'напиши какое-нибудь письмо', 'этот веселый мальчик идет', 'он любит читать всякие книги']
rules = """
        S -> NP V | NP VP | V
        NP -> ADJ N | ADJ NP | N
        VP -> V NP | V N | V 
        N -> 'вася' | 'книгу' | 'письмо' | 'мальчик' | 'он' | 'книги'
        V -> 'читает' | 'напиши' | 'идет' | 'любит' | 'читать'
        ADJ -> 'мою' | 'какое-нибудь' | 'этот' | 'веселый' | 'всякие'
""".split('\n')

grammar = nltk.CFG.fromstring('\n'.join(rules))
cp = nltk.EarleyChartParser(grammar)

### Описание шагов парсинга по алгоритму CYK:
#### шаг 1: словам присваиваются категории, указанные в грамматике (N, ADJ, V):
вася <- N
читает <- V
мою <- ADJ
книгу <- N

#### шаг 2:
по правилу NP -> ADJ N: мою книгу <- NP
по правилу NP -> N: вася <- NP

#### шаг 3:
по правилу VP -> V NP: читает мою книгу <- VP
#### шаг 4:
по правилу S -> NP VP: вася читает мою книгу <- S

In [11]:
#проверка

def print_parses(parser, sentence):
    for tree in parser.parse(sentence.split()):
        print(tree)
        print()

for el in sent:
    print_parses(cp, el)

(S (NP (ADJ этот) (NP (ADJ веселый) (N мальчик))) (V идет))

(S (NP (ADJ этот) (NP (ADJ веселый) (N мальчик))) (VP (V идет)))



In [22]:
cp_verbose = nltk.EarleyChartParser(grammar, trace=1)

for el in sent:
    print_parses(cp_verbose, el)

|.   вася  .  читает .   мою   .  книгу  .|
|[---------]         .         .         .| [0:1] 'вася'
|.         [---------]         .         .| [1:2] 'читает'
|.         .         [---------]         .| [2:3] 'мою'
|.         .         .         [---------]| [3:4] 'книгу'
|>         .         .         .         .| [0:0] S  -> * NP V
|>         .         .         .         .| [0:0] S  -> * NP VP
|>         .         .         .         .| [0:0] S  -> * V
|>         .         .         .         .| [0:0] NP -> * ADJ N
|>         .         .         .         .| [0:0] NP -> * ADJ NP
|.   напиши  .какое-нибуд.   письмо  .|
|[-----------]           .           .| [0:1] 'напиши'
|.           [-----------]           .| [1:2] 'какое-нибудь'
|.           .           [-----------]| [2:3] 'письмо'
|>           .           .           .| [0:0] S  -> * NP V
|>           .           .           .| [0:0] S  -> * NP VP
|>           .           .           .| [0:0] S  -> * V
|>           .          

### Работа с новыми словами

Морфологический анализатор можно использовать для присвоения новым словам части речи, которые станут инпутом для парсера и позволят ему парсить предложения, содержащие данные слова