# Connect and analyze text

In [3]:
from isanlp_srl_framebank.pipeline_default import PipelineDefault  

HOST = 'HOST'

ppl = PipelineDefault(address_morph=(HOST, 3333),
                      address_syntax=(HOST, 3334),
                      address_srl=(HOST, 3335))

text = 'Первый бой в рамках соглашения с DAZN Альварес проведет 15 декабря. В поединке за титул WBA во втором среднем весе он встретится с британцем Рокки Филдингом.'
res = ppl(text)

# Morphology

In [22]:
#http://universaldependencies.org/format.html
morph = res['morph']
lemma = res['lemma']
tokens = res['tokens']
sentences = res['sentences']


#POS tags and morphological annotation + LEMMA
for sent_pos, sent_morph in enumerate(morph):
    sentence_offsets = sentences[sent_pos]
    sentence_tokens = tokens[sentence_offsets.begin:sentence_offsets.end]
    for word_pos, word_morph in enumerate(sent_morph):
        print(word_morph) #POS + morph annot
        print(lemma[sent_pos][word_pos]) #Lemma
        print(sentence_tokens[word_pos].text) #Word form
        print(sentence_tokens[word_pos].begin, sentence_tokens[word_pos].end) #Word offsets in text
        print()
    break

{'fPOS': 'ADJ', 'Case': 'Acc', 'Number': 'Sing', 'Gender': 'Masc', 'Animacy': 'Inan'}
первый
Первый
0 6

{'fPOS': 'NOUN', 'Gender': 'Masc', 'Animacy': 'Inan', 'Case': 'Acc', 'Number': 'Sing'}
бой
бой
7 10

{'fPOS': 'ADP'}
в
в
11 12

{'fPOS': 'NOUN', 'Gender': 'Fem', 'Animacy': 'Inan', 'Case': 'Abl', 'Number': 'Plur'}
рамка
рамках
13 19

{'fPOS': 'NOUN', 'Gender': 'Neut', 'Animacy': 'Inan', 'Case': 'Acc', 'Number': 'Plur'}
соглашение
соглашения
20 30

{'fPOS': 'ADP'}
с
с
31 32

{}
DAZN
DAZN
33 37

{'fPOS': 'NOUN', 'Gender': 'Masc', 'Animacy': 'Anim', 'Case': 'Nom', 'Number': 'Sing'}
альварес
Альварес
38 46

{'fPOS': 'VERB', 'Tense': 'Imp', 'Number': 'Sing', 'VerbForm': 'Fin', 'Person': '3', 'Aspect': 'Perf'}
проводить
проведет
47 55

{}
15
15
56 58

{'fPOS': 'NOUN', 'Gender': 'Masc', 'Animacy': 'Inan', 'Case': 'Gen', 'Number': 'Sing'}
декабрь
декабря
59 66

{}
.
.
66 67



# Dependency tree (syntax)

In [28]:
syntax = res['syntax_dep_tree']
for sent_pos, sent_synt in enumerate(syntax):
    for word_pos, word_synt in enumerate(sent_synt):
        print('Word: %i' % word_pos)
        print('Parent: %i' % word_synt.parent)
        print('Link name: %s' % word_synt.link_name)
        print()
    break

Word: 0
Parent: 1
Link name: amod

Word: 1
Parent: 8
Link name: nsubj

Word: 2
Parent: 3
Link name: case

Word: 3
Parent: 1
Link name: nmod

Word: 4
Parent: 3
Link name: nmod

Word: 5
Parent: 6
Link name: case

Word: 6
Parent: 4
Link name: nmod

Word: 7
Parent: 6
Link name: appos

Word: 8
Parent: -1
Link name: ROOT

Word: 9
Parent: 8
Link name: nmod

Word: 10
Parent: 9
Link name: nmod

Word: 11
Parent: 8
Link name: punct



# SRL

In [63]:
srl = res['srl']
lemma = res['lemma']

for sent_pos, sent_srl in enumerate(srl):
    for event in sent_srl:
        predicate_lemma = lemma[sent_pos][event.pred[0]]
        print('Predicate: %s' % predicate_lemma)
        print('Arguments:')
        for arg in event.args:
            print('Word: %s, Tag: %s' % (lemma[sent_pos][arg.begin], arg.tag))
        print()

Predicate: проводить
Arguments:
Word: бой, Tag: агенс

Predicate: встречаться
Arguments:
Word: поединок, Tag: место
Word: он, Tag: агенс
Word: британец, Tag: контрагент

