## Tests for Parsing

In [1]:
import spacy
nlp = spacy.load('pt_core_news_sm', disable=["ner"])

from src.main02_parse_articles import parse_by_subject

In [2]:
sentence = "O menino está comendo uma maçã e a menina bebe suco."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'menino', 'slem': 'menino', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'está', 'hlem': 'estar', 'verb': 'comendo', 'vlem': 'comer', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'menino'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['estar'], ['um', 'maçã'], ['e', 'menina', 'beber', 'suco']], 'object_tags': [['AUX'], ['DET', 'NOUN'], ['CCONJ', 'NOUN', 'VERB', 'ADV']], 'full_statement': ''}
{'subject': 'menina', 'slem': 'menina', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'bebe', 'vlem': 'beber', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'menina'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['suco']], 'object_tags': [['ADV']], 'full_statement': ''}
O det DET DET [] [menino, comendo]
menino nsubj NOUN NOUN [O] [comendo]
está aux AUX AUX [] [comendo]
comendo ROOT VERB VERB [menino, está, maçã, bebe, .] []
uma det DET DET [] [maçã, comendo]
maçã obj NOUN NOUN [uma] [comendo]
e cc CCONJ CCONJ [] [bebe, comendo]


In [3]:
sentence = "O menino está comendo uma maçã e a menina não bebe suco."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'menino', 'slem': 'menino', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'está', 'hlem': 'estar', 'verb': 'comendo', 'vlem': 'comer', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'menino'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['estar'], ['um', 'maçã'], ['e', 'menina', 'não', 'beber', 'suco']], 'object_tags': [['AUX'], ['DET', 'NOUN'], ['CCONJ', 'NOUN', 'ADV', 'VERB', 'ADV']], 'full_statement': ''}
{'subject': 'menina', 'slem': 'menina', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'bebe', 'vlem': 'beber', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'menina'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['suco']], 'object_tags': [['ADV']], 'full_statement': ''}
O det DET DET [] [menino, comendo]
menino nsubj NOUN NOUN [O] [comendo]
está aux AUX AUX [] [comendo]
comendo ROOT VERB VERB [menino, está, maçã, bebe, .] []
uma det DET DET [] [maçã, comendo]
maçã obj NOUN NOUN [uma] [comendo]
e cc CCONJ CCONJ []

In [4]:
sentence = "Os funcionários devem ter pelo menos uma pausa durante a jornada de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'devem', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'funcionário'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['menos', 'um', 'pausa'], ['durante', 'o', 'jornada', 'trabalho']], 'object_tags': [['NOUN', 'DET', 'NOUN'], ['ADP', 'DET', 'NOUN', 'NOUN']], 'full_statement': ''}
Os det DET DET [] [funcionários, devem]
funcionários nsubj NOUN NOUN [Os] [devem]
devem ROOT VERB VERB [funcionários, ter] []
ter xcomp VERB VERB [pausa, jornada, .] [devem]
pelo case ADP ADP [] [menos, pausa, ter, devem]
menos nmod NOUN NOUN [pelo] [pausa, ter, devem]
uma det DET DET [] [pausa, ter, devem]
pausa obj NOUN NOUN [menos, uma] [ter, devem]
durante case ADP ADP [] [jornada, ter, devem]
a det DET DET [] [jornada, ter, devem]
jornada obl NOUN NOUN [durante, a, trabalho] [ter, devem]
de case ADP ADP [] [trabalho, jornada, ter, devem]
trabalho nmo

In [5]:
sentence = "O piso salarial vigente a partir de 01 de abril de 2010 será de 952,20 mensais."
doc = nlp(sentence)
    
sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'piso', 'slem': 'piso', 'neg': '', 'modal': 'vai', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'piso', 'salarial', 'vigente'], 'subject_tags': ['DET', 'NOUN', 'ADJ', 'ADJ'], 'object_branches': [], 'object_tags': [], 'full_statement': ''}
O det DET DET [] [piso, mensais]
piso nsubj NOUN NOUN [O, salarial, vigente] [mensais]
salarial amod ADJ ADJ [] [piso, mensais]
vigente amod ADJ ADJ [01] [piso, mensais]
a case ADP ADP [partir, de] [01, vigente, piso, mensais]
partir fixed NOUN NOUN [] [a, 01, vigente, piso, mensais]
de fixed ADP ADP [] [a, 01, vigente, piso, mensais]
01 obl NUM NUM [a, abril] [vigente, piso, mensais]
de case ADP ADP [] [abril, 01, vigente, piso, mensais]
abril nmod NOUN NOUN [de, 2010] [01, vigente, piso, mensais]
de case ADP ADP [] [2010, abril, 01, vigente, piso, mensais]
2010 nmod NUM NUM [de] [abril, 01, vigente, piso, mensais]
será cop AUX AUX [] [mensais]
de case ADP ADP 

In [6]:
sentence = "Os empregados substitutos não podem ter direito à pensão."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': 'não', 'modal': 'podem', 'mlem': 'poder', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'empregado', 'substituto'], 'subject_tags': ['DET', 'NOUN', 'ADJ'], 'object_branches': [['direito', 'pensão']], 'object_tags': [['NOUN', 'NOUN']], 'full_statement': ''}
Os det DET DET [] [empregados, podem]
empregados nsubj NOUN NOUN [Os, substitutos] [podem]
substitutos amod ADJ ADJ [] [empregados, podem]
não advmod ADV ADV [] [ter, podem]
podem ROOT VERB VERB [empregados, ter] []
ter xcomp VERB VERB [não, direito, .] [podem]
direito obj NOUN NOUN [pensão] [ter, podem]
à case ADP ADP [] [pensão, direito, ter, podem]
pensão nmod NOUN NOUN [à] [direito, ter, podem]
. punct PUNCT PUNCT [] [ter, podem]


In [7]:
sentence = "Eu tenho lido um livro."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'Eu', 'slem': 'eu', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'lido', 'vlem': 'ler', 'passive': 0, 'md': 0, 'subject_branch': ['eu'], 'subject_tags': ['PRON'], 'object_branches': [['ter'], ['um', 'livro']], 'object_tags': [['AUX'], ['DET', 'NOUN']], 'full_statement': ''}
Eu nsubj PRON PRON [] [lido]
tenho aux AUX AUX [] [lido]
lido ROOT VERB VERB [Eu, tenho, livro, .] []
um det DET DET [] [livro, lido]
livro obj NOUN NOUN [um] [lido]
. punct PUNCT PUNCT [] [lido]


In [8]:
sentence = "O livro foi lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'foi', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 0, 'subject_branch': ['o', 'livro'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['ser'], ['por', 'ela']], 'object_tags': [['AUX'], ['ADP', 'PRON']], 'full_statement': ''}
O det DET DET [] [livro, lido]
livro nsubj:pass NOUN NOUN [O] [lido]
foi aux:pass AUX AUX [] [lido]
lido ROOT VERB VERB [livro, foi, ela, .] []
por case ADP ADP [] [ela, lido]
ela obl PRON PRON [por] [lido]
. punct PUNCT PUNCT [] [lido]


In [9]:
sentence = "O livro deve ser lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': '', 'modal': 'deve', 'mlem': 'dever', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 1, 'subject_branch': ['o', 'livro'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['ser'], ['por', 'ela']], 'object_tags': [['AUX'], ['ADP', 'PRON']], 'full_statement': ''}
O det DET DET [] [livro, deve]
livro nsubj:pass NOUN NOUN [O] [deve]
deve ROOT VERB VERB [livro, lido] []
ser aux:pass AUX AUX [] [lido, deve]
lido xcomp VERB VERB [ser, ela, .] [deve]
por case ADP ADP [] [ela, lido, deve]
ela obl PRON PRON [por] [lido, deve]
. punct PUNCT PUNCT [] [lido, deve]


In [10]:
sentence = "O livro não deveria ter sido lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': 'não', 'modal': 'deveria', 'mlem': 'dever', 'helping_verb': 'ter', 'hlem': 'ter', 'verb': 'lido', 'vlem': 'ler', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'livro'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['ter'], ['ser'], ['por', 'ela']], 'object_tags': [['AUX'], ['AUX'], ['ADP', 'PRON']], 'full_statement': ''}
O det DET DET [] [livro, deveria]
livro nsubj:pass NOUN NOUN [O] [deveria]
não advmod ADV ADV [] [lido, deveria]
deveria ROOT VERB VERB [livro, lido] []
ter aux AUX AUX [] [lido, deveria]
sido aux:pass AUX AUX [] [lido, deveria]
lido xcomp VERB VERB [não, ter, sido, ela, .] [deveria]
por case ADP ADP [] [ela, lido, deveria]
ela obl PRON PRON [por] [lido, deveria]
. punct PUNCT PUNCT [] [lido, deveria]


In [11]:
sentence = "Um intervalo é permitido aos funcionários."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'intervalo', 'slem': 'intervalo', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'é', 'hlem': 'ser', 'verb': 'permitido', 'vlem': 'permitir', 'passive': 1, 'md': 0, 'subject_branch': ['um', 'intervalo'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['ser'], ['a o', 'funcionário']], 'object_tags': [['AUX'], ['ADP', 'NOUN']], 'full_statement': ''}
Um det DET DET [] [intervalo, permitido]
intervalo nsubj:pass NOUN NOUN [Um] [permitido]
é aux:pass AUX AUX [] [permitido]
permitido ROOT VERB VERB [intervalo, é, funcionários, .] []
aos case ADP ADP [] [funcionários, permitido]
funcionários obl NOUN NOUN [aos] [permitido]
. punct PUNCT PUNCT [] [permitido]


Possible changes?

In [12]:
sentence = "Os funcionários estão proibidos de comer no local de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'estão', 'vlem': 'estar', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'funcionário'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [], 'object_tags': [], 'full_statement': ''}
Os funcionários det DET DET [] [funcionários, proibidos]
funcionários proibidos nsubj NOUN NOUN [Os] [proibidos]
estão proibidos cop AUX AUX [] [proibidos]
proibidos proibidos ROOT ADJ ADJ [funcionários, estão, comer, .] []
de comer mark SCONJ SCONJ [] [comer, proibidos]
comer proibidos xcomp VERB VERB [de, local] [proibidos]
no local case ADP ADP [] [local, comer, proibidos]
local comer obl NOUN NOUN [no, trabalho] [comer, proibidos]
de trabalho case ADP ADP [] [trabalho, local, comer, proibidos]
trabalho local nmod NOUN NOUN [de] [local, comer, proibidos]
. proibidos punct PUNCT PUNCT [] [proibidos]


In [13]:
sentence = "Os funcionários devem ter pelo menos uma pausa durante a jornada de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'devem', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'funcionário'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['menos', 'um', 'pausa'], ['durante', 'o', 'jornada', 'trabalho']], 'object_tags': [['NOUN', 'DET', 'NOUN'], ['ADP', 'DET', 'NOUN', 'NOUN']], 'full_statement': ''}
Os det DET DET [] [funcionários, devem]
funcionários nsubj NOUN NOUN [Os] [devem]
devem ROOT VERB VERB [funcionários, ter] []
ter xcomp VERB VERB [pausa, jornada, .] [devem]
pelo case ADP ADP [] [menos, pausa, ter, devem]
menos nmod NOUN NOUN [pelo] [pausa, ter, devem]
uma det DET DET [] [pausa, ter, devem]
pausa obj NOUN NOUN [menos, uma] [ter, devem]
durante case ADP ADP [] [jornada, ter, devem]
a det DET DET [] [jornada, ter, devem]
jornada obl NOUN NOUN [durante, a, trabalho] [ter, devem]
de case ADP ADP [] [trabalho, jornada, ter, devem]
trabalho nmo

In [14]:
sentence = "Na hipótese da ocorrência de rescisão do contrato de trabalho, qualquer que seja a causa, em existindo horas a crédito do EMPREGADO, estas serão pagas pela EMPREGADORA como horas extraordinárias, acrescidas dos adicionais previstos na Convenção Coletiva de Trabalho juntamente com as demais verbas rescisórias."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'estas', 'slem': 'este', 'neg': '', 'modal': 'vão', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'serão', 'vlem': 'ser', 'passive': 0, 'md': 1, 'subject_branch': ['este'], 'subject_tags': ['PRON'], 'object_branches': [], 'object_tags': [], 'full_statement': ''}
Na case ADP ADP [] [hipótese, pagas]
hipótese obl NOUN NOUN [Na, ocorrência, ,, causa] [pagas]
da case ADP ADP [] [ocorrência, hipótese, pagas]
ocorrência nmod NOUN NOUN [da, rescisão] [hipótese, pagas]
de case ADP ADP [] [rescisão, ocorrência, hipótese, pagas]
rescisão nmod NOUN NOUN [de, contrato] [ocorrência, hipótese, pagas]
do case ADP ADP [] [contrato, rescisão, ocorrência, hipótese, pagas]
contrato nmod NOUN NOUN [do, trabalho] [rescisão, ocorrência, hipótese, pagas]
de case ADP ADP [] [trabalho, contrato, rescisão, ocorrência, hipótese, pagas]
trabalho nmod NOUN NOUN [de] [contrato, rescisão, ocorrência, hipótese, pagas]
, punct PUNCT PUNCT [] [hipótese, pagas]
qualquer det DET DET [] [que, causa, hi

In [15]:
sentence = "A CEEE-D aplicará sobre a matriz salarial, já reajustada com o índice de 4,18, o percentual de 1,4, a título de ganho real."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'CEEE-D', 'slem': 'ceee-d', 'neg': '', 'modal': 'vai', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'aplicará', 'vlem': 'aplicar', 'passive': 0, 'md': 1, 'subject_branch': ['o'], 'subject_tags': ['DET'], 'object_branches': [['sobre', 'o', 'matriz', 'salarial', 'reajustar', 'percentual'], ['a', 'título', 'ganho']], 'object_tags': [['ADP', 'DET', 'NOUN', 'ADJ', 'VERB', 'NOUN'], ['ADP', 'NOUN', 'NOUN']], 'full_statement': ''}
A det DET DET [] [CEEE-D, aplicará]
CEEE-D nsubj NOUN NOUN [A] [aplicará]
aplicará ROOT VERB VERB [CEEE-D, matriz, título, .] []
sobre case ADP ADP [] [matriz, aplicará]
a det DET DET [] [matriz, aplicará]
matriz obj NOUN NOUN [sobre, a, salarial, reajustada, percentual] [aplicará]
salarial amod ADJ ADJ [] [matriz, aplicará]
, punct PUNCT PUNCT [] [reajustada, matriz, aplicará]
já advmod ADV ADV [] [reajustada, matriz, aplicará]
reajustada acl VERB VERB [,, já, índice] [matriz, aplicará]
com case ADP ADP [] [índice, reajustada, matriz, aplicará]


In [16]:
sentence = "Os funcionários têm que trabalhar pelo menos 5 horas por dia."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'têm_que', 'mlem': 'ter_que', 'helping_verb': '', 'hlem': '', 'verb': 'trabalhar', 'vlem': 'trabalhar', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'funcionário'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['ter'], ['que'], ['menos', 'hora', 'dia']], 'object_tags': [['AUX'], ['SCONJ'], ['NOUN', 'NOUN', 'NOUN']], 'full_statement': ''}
Os funcionários det DET DET [] [funcionários, trabalhar]
funcionários trabalhar nsubj NOUN NOUN [Os] [trabalhar]
têm trabalhar aux AUX AUX [] [trabalhar]
que trabalhar mark SCONJ SCONJ [] [trabalhar]
trabalhar trabalhar ROOT VERB VERB [funcionários, têm, que, horas, .] []
pelo menos case ADP ADP [] [menos, horas, trabalhar]
menos horas nmod NOUN NOUN [pelo] [horas, trabalhar]
5 horas nummod NUM NUM [] [horas, trabalhar]
horas trabalhar obl NOUN NOUN [menos, 5, dia] [trabalhar]
por dia case ADP ADP [] [dia, horas, trabalhar]
dia horas nmod NOUN NOUN [por] [horas, trabalhar]

In [17]:
sentence = "Os funcionários que trabalham em período integral precisam receber a promessa de benefícios de creche."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'precisam', 'vlem': 'precisar', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'funcionário', 'trabalhar'], 'subject_tags': ['DET', 'NOUN', 'VERB'], 'object_branches': [['receber', 'promessa']], 'object_tags': [['VERB', 'NOUN']], 'full_statement': ''}
Os funcionários det DET DET [] [funcionários, precisam]
funcionários precisam nsubj NOUN NOUN [Os, trabalham] [precisam]
que trabalham nsubj PRON PRON [] [trabalham, funcionários, precisam]
trabalham funcionários acl:relcl VERB VERB [que, período] [funcionários, precisam]
em período case ADP ADP [] [período, trabalham, funcionários, precisam]
período trabalham obl NOUN NOUN [em, integral] [trabalham, funcionários, precisam]
integral período amod ADJ ADJ [] [período, trabalham, funcionários, precisam]
precisam precisam ROOT VERB VERB [funcionários, receber, .] []
receber precisam xcomp VERB VERB [promessa] [precisa

In [18]:
sentence = "Fica garantida ao aposentado a inscrição de novos beneficiários a ele vinculado."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])


{'subject': 'inscrição', 'slem': 'inscrição', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'Fica', 'vlem': 'ficar', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'inscrição', 'beneficiário', 'ele'], 'subject_tags': ['DET', 'NOUN', 'NOUN', 'PRON'], 'object_branches': [['garantido', 'aposentado']], 'object_tags': [['ADJ', 'NOUN']], 'full_statement': ''}
Fica Fica ROOT VERB VERB [garantida, inscrição, .] []
garantida Fica xcomp ADJ ADJ [aposentado] [Fica]
ao aposentado mark ADP ADP [] [aposentado, garantida, Fica]
aposentado garantida obl NOUN NOUN [ao] [garantida, Fica]
a inscrição det DET DET [] [inscrição, Fica]
inscrição Fica nsubj NOUN NOUN [a, beneficiários, ele] [Fica]
de beneficiários case ADP ADP [] [beneficiários, inscrição, Fica]
novos beneficiários amod ADJ ADJ [] [beneficiários, inscrição, Fica]
beneficiários inscrição nmod NOUN NOUN [de, novos] [inscrição, Fica]
a ele case ADP ADP [] [ele, inscrição, Fica]
ele inscrição nmod PRON PRON [a, vinc

In [19]:
sentence = "Fica ainda assegurado, para os empregados, aposentados e pensionistas a eles vinculados, o atual sistema de concessão e custeio dos medicamentos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'sistema', 'slem': 'sistema', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'Fica', 'hlem': 'ficar', 'verb': 'assegurado', 'vlem': 'assegurar', 'passive': 1, 'md': 0, 'subject_branch': ['o', 'atual', 'sistema', 'concessão'], 'subject_tags': ['DET', 'ADJ', 'NOUN', 'NOUN'], 'object_branches': [['ainda']], 'object_tags': [['ADV']], 'full_statement': ''}
Fica Fica ROOT VERB VERB [assegurado, empregados, sistema, .] []
ainda assegurado advmod ADV ADV [] [assegurado, Fica]
assegurado Fica xcomp VERB VERB [ainda, ,] [Fica]
, assegurado punct PUNCT PUNCT [] [assegurado, Fica]
para empregados case ADP ADP [] [empregados, Fica]
os empregados det DET DET [] [empregados, Fica]
empregados Fica obl NOUN NOUN [para, os, aposentados, pensionistas] [Fica]
, aposentados punct PUNCT PUNCT [] [aposentados, empregados, Fica]
aposentados empregados conj NOUN NOUN [,] [empregados, Fica]
e pensionistas cc CCONJ CCONJ [] [pensionistas, empregados, Fica]
pensionistas empregados conj NOUN NOUN 

In [20]:
sentence = "Os funcionários não recebem transporte."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'recebem', 'vlem': 'receber', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'funcionário'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['transporte']], 'object_tags': [['NOUN']], 'full_statement': ''}
Os funcionários det DET DET [] [funcionários, recebem]
funcionários recebem nsubj NOUN NOUN [Os] [recebem]
não recebem advmod ADV ADV [] [recebem]
recebem recebem ROOT VERB VERB [funcionários, não, transporte, .] []
transporte recebem obj NOUN NOUN [] [recebem]
. recebem punct PUNCT PUNCT [] [recebem]


In [21]:
sentence = "O descanso já se compreende no salário mensal."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'descanso', 'slem': 'descanso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'se', 'hlem': 'se', 'verb': 'compreende', 'vlem': 'compreender', 'passive': 1, 'md': 0, 'subject_branch': ['o', 'descanso'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['já'], ['se'], ['em o', 'salário', 'mensal']], 'object_tags': [['ADV'], ['PRON'], ['ADP', 'NOUN', 'ADJ']], 'full_statement': ''}
O det DET DET [] [descanso, compreende]
descanso nsubj NOUN NOUN [O] [compreende]
já advmod ADV ADV [] [compreende]
se expl PRON PRON [] [compreende]
compreende ROOT VERB VERB [descanso, já, se, salário, .] []
no case ADP ADP [] [salário, compreende]
salário obj NOUN NOUN [no, mensal] [compreende]
mensal amod ADJ ADJ [] [salário, compreende]
. punct PUNCT PUNCT [] [compreende]


In [22]:
sentence = "Ficam excluídas desta penalidade as cláusulas que já possuam cominações específicas."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'cláusulas', 'slem': 'cláusula', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'Ficam', 'hlem': 'ficam', 'verb': 'excluídas', 'vlem': 'excluír', 'passive': 1, 'md': 0, 'subject_branch': ['o', 'cláusula', 'possuar'], 'subject_tags': ['DET', 'NOUN', 'VERB'], 'object_branches': [['de este', 'penalidade']], 'object_tags': [['ADP', 'NOUN']], 'full_statement': ''}
Ficam ROOT VERB VERB [excluídas, cláusulas, .] []
excluídas xcomp VERB VERB [penalidade] [Ficam]
desta case ADP ADP [] [penalidade, excluídas, Ficam]
penalidade obl NOUN NOUN [desta] [excluídas, Ficam]
as det DET DET [] [cláusulas, Ficam]
cláusulas nsubj NOUN NOUN [as, possuam] [Ficam]
que nsubj PRON PRON [] [possuam, cláusulas, Ficam]
já advmod ADV ADV [] [possuam, cláusulas, Ficam]
possuam acl:relcl VERB VERB [que, já, cominações] [cláusulas, Ficam]
cominações obj NOUN NOUN [específicas] [possuam, cláusulas, Ficam]
específicas amod ADJ ADJ [] [cominações, possuam, cláusulas, Ficam]
. punct PUNCT PUNCT [] [Ficam]

In [23]:
sentence = "O empregado que viajar à serviço, fora da região metropolitana, em viagens nacionais ou internacionais, estará coberto por seguro de vida especialmente adotado para cada viagem, a partir da saída e retorno a São Paulo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregado', 'slem': 'empregado', 'neg': '', 'modal': 'vai', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'estará', 'vlem': 'estar', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'empregado', 'viajar'], 'subject_tags': ['DET', 'NOUN', 'VERB'], 'object_branches': [], 'object_tags': [], 'full_statement': ''}
O det DET DET [] [empregado, coberto]
empregado nsubj:pass NOUN NOUN [O, viajar] [coberto]
que nsubj PRON PRON [] [viajar, empregado, coberto]
viajar acl:relcl VERB VERB [que, serviço, ,, fora, ,, viagens, ,] [empregado, coberto]
à case ADP ADP [] [serviço, viajar, empregado, coberto]
serviço obl NOUN NOUN [à] [viajar, empregado, coberto]
, punct PUNCT PUNCT [] [viajar, empregado, coberto]
fora advmod ADV ADV [região] [viajar, empregado, coberto]
da case ADP ADP [] [região, fora, viajar, empregado, coberto]
região obl NOUN NOUN [da, metropolitana] [fora, viajar, empregado, coberto]
metropolitana amod ADJ ADJ [] [região, fora, viajar, empregado, coberto]
, punct 

In [24]:
sentence = "Não se aplica a garantia da letra B supra, quando o substituído estiver sob amparo da Previdência Social."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'se', 'slem': 'se', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'aplica', 'vlem': 'aplicar', 'passive': 0, 'md': 0, 'subject_branch': ['se'], 'subject_tags': ['PRON'], 'object_branches': [['o', 'garantia', 'letra'], ['quando', 'substituir', 'estar', 'sob', 'amparo', 'previdência']], 'object_tags': [['DET', 'NOUN', 'NOUN'], ['ADV', 'NOUN', 'AUX', 'ADP', 'NOUN', 'PROPN']], 'full_statement': ''}
{'subject': 'substituído', 'slem': 'substituir', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'estiver', 'vlem': 'estar', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'substituir'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [], 'object_tags': [], 'full_statement': ''}
Não aplica advmod ADV ADV [] [aplica]
se aplica nsubj PRON PRON [] [aplica]
aplica aplica ROOT VERB VERB [Não, se, garantia, amparo, .] []
a garantia det DET DET [] [garantia, aplica]
garantia aplica obj NOUN NOUN [a, letra] [aplica]
da letra ca

In [25]:
sentence = "A empresa acordante fica responsável pelo pagamento das 44 horas semanais de trabalho e do repouso semanal remunerado."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'fica', 'vlem': 'ficar', 'passive': 0, 'md': 0, 'subject_branch': ['o', 'empresa'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['acordante'], ['responsável', 'pagamento']], 'object_tags': [['ADJ'], ['ADJ', 'NOUN']], 'full_statement': ''}
A empresa det DET DET [] [empresa, fica]
empresa fica nsubj NOUN NOUN [A] [fica]
acordante fica advmod ADJ ADJ [] [fica]
fica fica ROOT VERB VERB [empresa, acordante, responsável, .] []
responsável fica xcomp ADJ ADJ [pagamento] [fica]
pelo pagamento case ADP ADP [] [pagamento, responsável, fica]
pagamento responsável obl NOUN NOUN [pelo, horas] [responsável, fica]
das horas case ADP ADP [] [horas, pagamento, responsável, fica]
44 horas nummod NUM NUM [] [horas, pagamento, responsável, fica]
horas pagamento nmod NOUN NOUN [das, 44, semanais, trabalho] [pagamento, responsável, fica]
semanais horas amod ADJ ADJ [] [horas, pagame

In [26]:
# 2009_01_01__2009_040120
sentence = "Aos trabalhadores do sexo feminino, a empresa compromete-se a cumprir o disposto no Artigo 389."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'se', 'hlem': 'se', 'verb': 'compromete', 'vlem': 'comprometar', 'passive': 1, 'md': 0, 'subject_branch': ['o', 'empresa'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['a o', 'trabalhador', 'sexo'], ['a', 'cumprir', 'disposto']], 'object_tags': [['ADP', 'NOUN', 'NOUN'], ['SCONJ', 'VERB', 'NOUN']], 'full_statement': ''}
Aos trabalhadores case ADP ADP [] [trabalhadores, compromete-se]
trabalhadores compromete-se obl NOUN NOUN [Aos, sexo] [compromete-se]
do sexo case ADP ADP [] [sexo, trabalhadores, compromete-se]
sexo trabalhadores nmod NOUN NOUN [do, feminino] [trabalhadores, compromete-se]
feminino sexo amod ADJ ADJ [] [sexo, trabalhadores, compromete-se]
, compromete-se punct PUNCT PUNCT [] [compromete-se]
a empresa det DET DET [] [empresa, compromete-se]
empresa compromete-se nsubj NOUN NOUN [a] [compromete-se]
compromete-se compromete-se ROOT VERB VERB [trabalhadores, ,, empresa, 

In [27]:
sentence = "Os trabalhadores menores reger-se-ão pelo Artigo 413, Item I da CLT, comprometendo-se a empresa a cumprir o disposto no Capítulo IV."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'trabalhadores', 'slem': 'trabalhador', 'neg': '', 'modal': 'vão', 'mlem': 'ir', 'helping_verb': 'se', 'hlem': 'se', 'verb': 'reger', 'vlem': 'reger', 'passive': 1, 'md': 1, 'subject_branch': ['o', 'trabalhador', 'menores'], 'subject_tags': ['DET', 'NOUN', 'ADJ'], 'object_branches': [['por o', 'artigo', 'item'], ['empresa']], 'object_tags': [['ADP', 'PROPN', 'PROPN'], ['NOUN']], 'full_statement': ''}
Os trabalhadores det DET DET [] [trabalhadores, reger-se-ão]
trabalhadores reger-se-ão nsubj NOUN NOUN [Os, menores] [reger-se-ão]
menores trabalhadores amod ADJ ADJ [] [trabalhadores, reger-se-ão]
reger-se-ão reger-se-ão ROOT VERB VERB [trabalhadores, Artigo, comprometendo-se, .] []
pelo Artigo case ADP ADP [] [Artigo, reger-se-ão]
Artigo reger-se-ão obl PROPN PROPN [pelo, 413, Item] [reger-se-ão]
413 Artigo nummod NUM NUM [] [Artigo, reger-se-ão]
, Item punct PUNCT PUNCT [] [Item, Artigo, reger-se-ão]
Item Artigo appos PROPN PROPN [,, I, CLT, ,] [Artigo, reger-se-ão]
I Item f

In [28]:
sentence = "Os empregados não ficam subordinados às condições e horários constantes dos Anexos I a X."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': 'ficam', 'hlem': 'ficar', 'verb': 'subordinados', 'vlem': 'subordinado', 'passive': 1, 'md': 0, 'subject_branch': ['o', 'empregado'], 'subject_tags': ['DET', 'NOUN'], 'object_branches': [['a o', 'condição'], ['e', 'horário', 'constante']], 'object_tags': [['ADP', 'NOUN'], ['CCONJ', 'NOUN', 'ADJ']], 'full_statement': ''}
Os empregados det DET DET [] [empregados, ficam]
empregados ficam nsubj NOUN NOUN [Os] [ficam]
não ficam advmod ADV ADV [] [ficam]
ficam ficam ROOT VERB VERB [empregados, não, subordinados, X.] []
subordinados ficam xcomp VERB VERB [condições, horários] [ficam]
às condições case ADP ADP [] [condições, subordinados, ficam]
condições subordinados obl NOUN NOUN [às] [subordinados, ficam]
e horários cc CCONJ CCONJ [] [horários, subordinados, ficam]
horários subordinados conj NOUN NOUN [e, constantes] [subordinados, ficam]
constantes horários amod ADJ ADJ [Anexos] [horários,

In [29]:
sentence = "Fica estabelecido que o pagamento do adicional de periculosidade aos empregados da empresa relacionada acima será devido de forma proporcional."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'pagamento', 'slem': 'pagamento', 'neg': '', 'modal': 'vai', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'pagamento', 'adicional'], 'subject_tags': ['DET', 'NOUN', 'NOUN'], 'object_branches': [], 'object_tags': [], 'full_statement': ''}
Fica estabelecido aux VERB VERB [] [estabelecido]
estabelecido estabelecido ROOT VERB VERB [Fica, devido, .] []
que devido mark SCONJ SCONJ [] [devido, estabelecido]
o pagamento det DET DET [] [pagamento, devido, estabelecido]
pagamento devido nsubj NOUN NOUN [o, adicional] [devido, estabelecido]
do adicional case ADP ADP [] [adicional, pagamento, devido, estabelecido]
adicional pagamento nmod NOUN NOUN [do, periculosidade] [pagamento, devido, estabelecido]
de periculosidade case ADP ADP [] [periculosidade, adicional, pagamento, devido, estabelecido]
periculosidade adicional nmod NOUN NOUN [de, empregados] [adicional, pagamento, devido, estabelecido]
aos empregad

In [30]:
sentence = "A Conab estenderá a função de encarregados de depósito para as unidades operacionais que comprovadamente necessitem de tal função para melhorar o desempenho de suas atividades."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'Conab', 'slem': 'conab', 'neg': '', 'modal': 'vai', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'estenderá', 'vlem': 'estender', 'passive': 0, 'md': 1, 'subject_branch': ['o', 'conab'], 'subject_tags': ['DET', 'PROPN'], 'object_branches': [['o', 'função', 'encarregado', 'unidade']], 'object_tags': [['DET', 'NOUN', 'VERB', 'NOUN']], 'full_statement': ''}
A Conab det DET DET [] [Conab, estenderá]
Conab estenderá nsubj PROPN PROPN [A] [estenderá]
estenderá estenderá ROOT VERB VERB [Conab, função, .] []
a função det DET DET [] [função, estenderá]
função estenderá obj NOUN NOUN [a, encarregados, unidades] [estenderá]
de encarregados case ADP ADP [] [encarregados, função, estenderá]
encarregados função nmod VERB VERB [de, depósito] [função, estenderá]
de depósito case ADP ADP [] [depósito, encarregados, função, estenderá]
depósito encarregados nmod NOUN NOUN [de] [encarregados, função, estenderá]
para unidades case ADP ADP [] [unidades, função, estenderá]
as unidades d