## Tests for Parsing

In [48]:
import sys
sys.path.append('..')

import spacy
nlp = spacy.load('pt_core_news_lg', disable=["ner"])

from src.main02_parse_articles import parse_by_subject

In [49]:
sentence = "O menino está comendo uma maçã e a menina bebe suco."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'menino', 'slem': 'menino', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'está', 'hlem': 'estar', 'verb': 'comendo', 'vlem': 'comer', 'passive': 0, 'md': 0}
{'subject': 'menina', 'slem': 'menina', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'bebe', 'vlem': 'beber', 'passive': 0, 'md': 0}
O det DET DET [] [menino, comendo]
menino nsubj NOUN NOUN [O] [comendo]
está aux AUX AUX [] [comendo]
comendo ROOT VERB VERB [menino, está, maçã, bebe, .] []
uma det DET DET [] [maçã, comendo]
maçã obj NOUN NOUN [uma] [comendo]
e cc CCONJ CCONJ [] [bebe, comendo]
a det DET DET [] [menina, bebe, comendo]
menina nsubj NOUN NOUN [a] [bebe, comendo]
bebe conj VERB VERB [e, menina, suco] [comendo]
suco obj NOUN NOUN [] [bebe, comendo]
. punct PUNCT PUNCT [] [comendo]


In [50]:
sentence = "O menino está comendo uma maçã e a menina não bebe suco."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'menino', 'slem': 'menino', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'está', 'hlem': 'estar', 'verb': 'comendo', 'vlem': 'comer', 'passive': 0, 'md': 0}
{'subject': 'menina', 'slem': 'menina', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'bebe', 'vlem': 'beber', 'passive': 0, 'md': 0}
O det DET DET [] [menino, comendo]
menino nsubj NOUN NOUN [O] [comendo]
está aux AUX AUX [] [comendo]
comendo ROOT VERB VERB [menino, está, maçã, bebe, .] []
uma det DET DET [] [maçã, comendo]
maçã obj NOUN NOUN [uma] [comendo]
e cc CCONJ CCONJ [] [bebe, comendo]
a det DET DET [] [menina, bebe, comendo]
menina nsubj NOUN NOUN [a] [bebe, comendo]
não advmod ADV ADV [] [bebe, comendo]
bebe conj VERB VERB [e, menina, não, suco] [comendo]
suco obj NOUN NOUN [] [bebe, comendo]
. punct PUNCT PUNCT [] [comendo]


In [51]:
sentence = "Os funcionários devem ter pelo menos uma pausa durante a jornada de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'devem', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1}
Os det DET DET [] [funcionários, devem]
funcionários nsubj NOUN NOUN [Os] [devem]
devem ROOT VERB VERB [funcionários, ter] []
ter xcomp VERB VERB [pausa, jornada, .] [devem]
pelo case ADP ADP [] [menos, pausa, ter, devem]
menos nmod NOUN NOUN [pelo] [pausa, ter, devem]
uma det DET DET [] [pausa, ter, devem]
pausa obj NOUN NOUN [menos, uma] [ter, devem]
durante case ADP ADP [] [jornada, ter, devem]
a det DET DET [] [jornada, ter, devem]
jornada obl NOUN NOUN [durante, a, trabalho] [ter, devem]
de case ADP ADP [] [trabalho, jornada, ter, devem]
trabalho nmod NOUN NOUN [de] [jornada, ter, devem]
. punct PUNCT PUNCT [] [ter, devem]


In [52]:
sentence = "O piso salarial vigente a partir de 01 de abril de 2010 será de 952,20 mensais."
doc = nlp(sentence)
    
sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'piso', 'slem': 'piso', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1}
O det DET DET [] [piso, 952,20]
piso nsubj NOUN NOUN [O, salarial, vigente] [952,20]
salarial amod ADJ ADJ [] [piso, 952,20]
vigente amod ADJ ADJ [01] [piso, 952,20]
a case ADP ADP [partir, de] [01, vigente, piso, 952,20]
partir fixed NOUN NOUN [] [a, 01, vigente, piso, 952,20]
de fixed ADP ADP [] [a, 01, vigente, piso, 952,20]
01 obl NUM NUM [a, abril] [vigente, piso, 952,20]
de case ADP ADP [] [abril, 01, vigente, piso, 952,20]
abril nmod NOUN NOUN [de, 2010] [01, vigente, piso, 952,20]
de case ADP ADP [] [2010, abril, 01, vigente, piso, 952,20]
2010 nmod NUM NUM [de] [abril, 01, vigente, piso, 952,20]
será cop AUX AUX [] [952,20]
de case ADP ADP [] [952,20]
952,20 ROOT NUM NUM [piso, será, de, mensais, .] []
mensais amod ADJ ADJ [] [952,20]
. punct PUNCT PUNCT [] [952,20]


In [53]:
sentence = "Os empregados substitutos não podem ter direito à pensão."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': 'não', 'modal': 'podem', 'mlem': 'poder', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1}
Os det DET DET [] [empregados, podem]
empregados nsubj NOUN NOUN [Os, substitutos] [podem]
substitutos amod NOUN NOUN [] [empregados, podem]
não advmod ADV ADV [] [ter, podem]
podem ROOT VERB VERB [empregados, ter] []
ter xcomp VERB VERB [não, direito, pensão, .] [podem]
direito obj NOUN NOUN [] [ter, podem]
à case ADP ADP [] [pensão, ter, podem]
pensão obl NOUN NOUN [à] [ter, podem]
. punct PUNCT PUNCT [] [ter, podem]


In [54]:
sentence = "Eu tenho lido um livro."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'Eu', 'slem': 'eu', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'tenho', 'hlem': 'ter', 'verb': 'lido', 'vlem': 'ler', 'passive': 0, 'md': 0}
Eu lido nsubj PRON PRON [] [lido]
tenho lido aux AUX AUX [] [lido]
lido lido ROOT VERB VERB [Eu, tenho, livro, .] []
um livro det DET DET [] [livro, lido]
livro lido obj NOUN NOUN [um] [lido]
. lido punct PUNCT PUNCT [] [lido]


In [55]:
sentence = "O livro foi lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'foi', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 0}
O det DET DET [] [livro, lido]
livro nsubj:pass NOUN NOUN [O] [lido]
foi aux:pass AUX AUX [] [lido]
lido ROOT VERB VERB [livro, foi, ela, .] []
por case ADP ADP [] [ela, lido]
ela obl:agent PRON PRON [por] [lido]
. punct PUNCT PUNCT [] [lido]


In [56]:
sentence = "O livro deve ser lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': '', 'modal': 'deve', 'mlem': 'dever', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 1}
O det DET DET [] [livro, deve]
livro nsubj:pass NOUN NOUN [O] [deve]
deve ROOT VERB VERB [livro, lido] []
ser aux:pass AUX AUX [] [lido, deve]
lido xcomp VERB VERB [ser, ela, .] [deve]
por case ADP ADP [] [ela, lido, deve]
ela obl:agent PRON PRON [por] [lido, deve]
. punct PUNCT PUNCT [] [lido, deve]


In [57]:
sentence = "O livro não deveria ter sido lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': 'não', 'modal': 'deveria', 'mlem': 'dever', 'helping_verb': 'sido', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 1}
O livro det DET DET [] [livro, deveria]
livro deveria nsubj:pass NOUN NOUN [O] [deveria]
não lido advmod ADV ADV [] [lido, deveria]
deveria deveria ROOT VERB VERB [livro, lido] []
ter lido aux AUX AUX [] [lido, deveria]
sido lido aux:pass AUX AUX [] [lido, deveria]
lido deveria xcomp VERB VERB [não, ter, sido, ela, .] [deveria]
por ela case ADP ADP [] [ela, lido, deveria]
ela lido obl:agent PRON PRON [por] [lido, deveria]
. lido punct PUNCT PUNCT [] [lido, deveria]


In [58]:
sentence = "Um intervalo é permitido aos funcionários."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'intervalo', 'slem': 'intervalo', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'é', 'hlem': 'ser', 'verb': 'permitido', 'vlem': 'permitir', 'passive': 1, 'md': 0}
Um intervalo det DET DET [] [intervalo, permitido]
intervalo permitido nsubj:pass NOUN NOUN [Um] [permitido]
é permitido aux:pass AUX AUX [] [permitido]
permitido permitido ROOT VERB VERB [intervalo, é, funcionários, .] []
aos funcionários case ADP ADP [] [funcionários, permitido]
funcionários permitido obl NOUN NOUN [aos] [permitido]
. permitido punct PUNCT PUNCT [] [permitido]


In [59]:
sentence = "Os funcionários estão proibidos de comer no local de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'estão', 'vlem': 'estar', 'passive': 0, 'md': 0}
Os funcionários det DET DET [] [funcionários, proibidos]
funcionários proibidos nsubj NOUN NOUN [Os] [proibidos]
estão proibidos cop AUX AUX [] [proibidos]
proibidos proibidos ROOT VERB VERB [funcionários, estão, comer, .] []
de comer mark SCONJ SCONJ [] [comer, proibidos]
comer proibidos xcomp VERB VERB [de, local] [proibidos]
no local case ADP ADP [] [local, comer, proibidos]
local comer obl NOUN NOUN [no, trabalho] [comer, proibidos]
de trabalho case ADP ADP [] [trabalho, local, comer, proibidos]
trabalho local nmod NOUN NOUN [de] [local, comer, proibidos]
. proibidos punct PUNCT PUNCT [] [proibidos]


In [60]:
sentence = "Os funcionários devem ter pelo menos uma pausa durante a jornada de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'devem', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1}
Os funcionários det DET DET [] [funcionários, devem]
funcionários devem nsubj NOUN NOUN [Os] [devem]
devem devem ROOT VERB VERB [funcionários, ter] []
ter devem xcomp VERB VERB [pausa, jornada, .] [devem]
pelo menos case ADP ADP [] [menos, pausa, ter, devem]
menos pausa nmod NOUN NOUN [pelo] [pausa, ter, devem]
uma pausa det DET DET [] [pausa, ter, devem]
pausa ter obj NOUN NOUN [menos, uma] [ter, devem]
durante jornada case ADP ADP [] [jornada, ter, devem]
a jornada det DET DET [] [jornada, ter, devem]
jornada ter obl NOUN NOUN [durante, a, trabalho] [ter, devem]
de trabalho case ADP ADP [] [trabalho, jornada, ter, devem]
trabalho jornada nmod NOUN NOUN [de] [jornada, ter, devem]
. ter punct PUNCT PUNCT [] [ter, devem]


In [61]:
sentence = "Na hipótese da ocorrência de rescisão do contrato de trabalho, qualquer que seja a causa, em existindo horas a crédito do EMPREGADO, estas serão pagas pela EMPREGADORA como horas extraordinárias, acrescidas dos adicionais previstos na Convenção Coletiva de Trabalho juntamente com as demais verbas rescisórias."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'estas', 'slem': 'este', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'serão', 'hlem': 'ser', 'verb': 'pagas', 'vlem': 'pagas', 'passive': 1, 'md': 1}
Na case ADP ADP [] [hipótese, pagas]
hipótese obl NOUN NOUN [Na, ocorrência, ,, causa] [pagas]
da case ADP ADP [] [ocorrência, hipótese, pagas]
ocorrência nmod NOUN NOUN [da, rescisão] [hipótese, pagas]
de case ADP ADP [] [rescisão, ocorrência, hipótese, pagas]
rescisão nmod NOUN NOUN [de, contrato] [ocorrência, hipótese, pagas]
do case ADP ADP [] [contrato, rescisão, ocorrência, hipótese, pagas]
contrato nmod NOUN NOUN [do, trabalho] [rescisão, ocorrência, hipótese, pagas]
de case ADP ADP [] [trabalho, contrato, rescisão, ocorrência, hipótese, pagas]
trabalho nmod NOUN NOUN [de] [contrato, rescisão, ocorrência, hipótese, pagas]
, punct PUNCT PUNCT [] [hipótese, pagas]
qualquer det DET DET [] [que, causa, hipótese, pagas]
que mark PRON PRON [qualquer] [causa, hipótese, pagas]
seja cop VERB VERB [] [causa, hipótese, p

In [62]:
sentence = "A CEEE-D aplicará sobre a matriz salarial, já reajustada com o índice de 4,18, o percentual de 1,4, a título de ganho real."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'CEEE-D', 'slem': 'ceee-d', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'aplicará', 'vlem': 'aplicar', 'passive': 0, 'md': 1}
A det DET DET [] [CEEE-D, aplicará]
CEEE-D nsubj PROPN PROPN [A] [aplicará]
aplicará ROOT VERB VERB [CEEE-D, matriz, percentual, .] []
sobre case ADP ADP [] [matriz, aplicará]
a det DET DET [] [matriz, aplicará]
matriz obj NOUN NOUN [sobre, a, salarial, reajustada] [aplicará]
salarial amod ADJ ADJ [] [matriz, aplicará]
, punct PUNCT PUNCT [] [reajustada, matriz, aplicará]
já advmod ADV ADV [] [reajustada, matriz, aplicará]
reajustada acl VERB VERB [,, já, índice, ,] [matriz, aplicará]
com case ADP ADP [] [índice, reajustada, matriz, aplicará]
o det DET DET [] [índice, reajustada, matriz, aplicará]
índice obl NOUN NOUN [com, o, 4,18] [reajustada, matriz, aplicará]
de case ADP ADP [] [4,18, índice, reajustada, matriz, aplicará]
4,18 nmod NUM NUM [de] [índice, reajustada, matriz, aplicará]
, punct PUNCT PUNCT [] [reajus

In [63]:
sentence = "Os funcionários têm que trabalhar pelo menos 5 horas por dia."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'têm que', 'mlem': 'ter que', 'helping_verb': '', 'hlem': '', 'verb': 'trabalhar', 'vlem': 'trabalhar', 'passive': 0, 'md': 1}
Os funcionários det DET DET [] [funcionários, trabalhar]
funcionários trabalhar nsubj NOUN NOUN [Os] [trabalhar]
têm trabalhar aux AUX AUX [] [trabalhar]
que trabalhar mark SCONJ SCONJ [] [trabalhar]
trabalhar trabalhar ROOT VERB VERB [funcionários, têm, que, horas, .] []
pelo menos case ADP ADP [] [menos, horas, trabalhar]
menos horas nmod NOUN NOUN [pelo] [horas, trabalhar]
5 horas nummod NUM NUM [] [horas, trabalhar]
horas trabalhar obl NOUN NOUN [menos, 5, dia] [trabalhar]
por dia case ADP ADP [] [dia, horas, trabalhar]
dia horas nmod NOUN NOUN [por] [horas, trabalhar]
. trabalhar punct PUNCT PUNCT [] [trabalhar]


In [64]:
sentence = "Os funcionários que trabalham em período integral precisam receber a promessa de benefícios de creche."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'precisam', 'vlem': 'precisar', 'passive': 0, 'md': 0}
Os funcionários det DET DET [] [funcionários, precisam]
funcionários precisam nsubj NOUN NOUN [Os, trabalham] [precisam]
que trabalham nsubj PRON PRON [] [trabalham, funcionários, precisam]
trabalham funcionários acl:relcl VERB VERB [que, período] [funcionários, precisam]
em período case ADP ADP [] [período, trabalham, funcionários, precisam]
período trabalham obl NOUN NOUN [em, integral] [trabalham, funcionários, precisam]
integral período amod ADJ ADJ [] [período, trabalham, funcionários, precisam]
precisam precisam ROOT VERB VERB [funcionários, receber, .] []
receber precisam xcomp VERB VERB [promessa] [precisam]
a promessa det DET DET [] [promessa, receber, precisam]
promessa receber obj NOUN NOUN [a, benefícios] [receber, precisam]
de benefícios case ADP ADP [] [benefícios, promessa, receber, precisam]

In [65]:
sentence = "Fica garantida ao aposentado a inscrição de novos beneficiários a ele vinculado."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])


{'subject': 'inscrição', 'slem': 'inscrição', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'Fica', 'vlem': 'ficar', 'passive': 0, 'md': 0}
Fica Fica ROOT VERB VERB [garantida, aposentado, inscrição, .] []
garantida Fica xcomp ADJ ADJ [] [Fica]
ao aposentado case ADP ADP [] [aposentado, Fica]
aposentado Fica obl NOUN NOUN [ao] [Fica]
a inscrição det DET DET [] [inscrição, Fica]
inscrição Fica nsubj NOUN NOUN [a, beneficiários] [Fica]
de beneficiários case ADP ADP [] [beneficiários, inscrição, Fica]
novos beneficiários amod ADJ ADJ [] [beneficiários, inscrição, Fica]
beneficiários inscrição nmod NOUN NOUN [de, novos, ele] [inscrição, Fica]
a ele case ADP ADP [] [ele, beneficiários, inscrição, Fica]
ele beneficiários nmod PRON PRON [a, vinculado] [beneficiários, inscrição, Fica]
vinculado ele acl VERB VERB [] [ele, beneficiários, inscrição, Fica]
. Fica punct PUNCT PUNCT [] [Fica]


In [66]:
sentence = "Fica ainda assegurado, para os empregados, aposentados e pensionistas a eles vinculados, o atual sistema de concessão e custeio dos medicamentos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'sistema', 'slem': 'sistema', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'Fica', 'hlem': 'ficar', 'verb': 'assegurado', 'vlem': 'assegurar', 'passive': 1, 'md': 0}
Fica Fica ROOT VERB VERB [assegurado, sistema, .] []
ainda assegurado advmod ADV ADV [] [assegurado, Fica]
assegurado Fica xcomp VERB VERB [ainda, ,, empregados] [Fica]
, assegurado punct PUNCT PUNCT [] [assegurado, Fica]
para empregados case ADP ADP [] [empregados, assegurado, Fica]
os empregados det DET DET [] [empregados, assegurado, Fica]
empregados assegurado obl NOUN NOUN [para, os, aposentados, pensionistas, eles] [assegurado, Fica]
, aposentados punct PUNCT PUNCT [] [aposentados, empregados, assegurado, Fica]
aposentados empregados conj NOUN NOUN [,] [empregados, assegurado, Fica]
e pensionistas cc CCONJ CCONJ [] [pensionistas, empregados, assegurado, Fica]
pensionistas empregados conj NOUN NOUN [e] [empregados, assegurado, Fica]
a eles case ADP ADP [] [eles, empregados, assegurado, Fica]
eles em

In [67]:
sentence = "Os funcionários não recebem transporte."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'recebem', 'vlem': 'receber', 'passive': 0, 'md': 0}
Os funcionários det DET DET [] [funcionários, recebem]
funcionários recebem nsubj NOUN NOUN [Os] [recebem]
não recebem advmod ADV ADV [] [recebem]
recebem recebem ROOT VERB VERB [funcionários, não, transporte, .] []
transporte recebem obj NOUN NOUN [] [recebem]
. recebem punct PUNCT PUNCT [] [recebem]


In [68]:
sentence = "O descanso já se compreende no salário mensal."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'descanso', 'slem': 'descanso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'compreende', 'vlem': 'compreender', 'passive': 0, 'md': 0}
{'subject': 'se', 'slem': 'se', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'compreende', 'vlem': 'compreender', 'passive': 0, 'md': 0}
O det DET DET [] [descanso, compreende]
descanso nsubj NOUN NOUN [O] [compreende]
já advmod ADV ADV [] [compreende]
se nsubj PRON PRON [] [compreende]
compreende ROOT VERB VERB [descanso, já, se, salário, .] []
no case ADP ADP [] [salário, compreende]
salário obj NOUN NOUN [no, mensal] [compreende]
mensal amod ADJ ADJ [] [salário, compreende]
. punct PUNCT PUNCT [] [compreende]


In [69]:
sentence = "Ficam excluídas desta penalidade as cláusulas que já possuam cominações específicas."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'cláusulas', 'slem': 'cláusula', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'Ficam', 'hlem': 'ficar', 'verb': 'excluídas', 'vlem': 'excluír', 'passive': 1, 'md': 0}
Ficam ROOT VERB VERB [excluídas, cláusulas, .] []
excluídas xcomp VERB VERB [penalidade] [Ficam]
desta case ADP ADP [] [penalidade, excluídas, Ficam]
penalidade obl NOUN NOUN [desta] [excluídas, Ficam]
as det DET DET [] [cláusulas, Ficam]
cláusulas nsubj NOUN NOUN [as, possuam] [Ficam]
que nsubj PRON PRON [] [possuam, cláusulas, Ficam]
já advmod ADV ADV [] [possuam, cláusulas, Ficam]
possuam acl:relcl VERB VERB [que, já, cominações] [cláusulas, Ficam]
cominações obj NOUN NOUN [específicas] [possuam, cláusulas, Ficam]
específicas amod ADJ ADJ [] [cominações, possuam, cláusulas, Ficam]
. punct PUNCT PUNCT [] [Ficam]


In [70]:
sentence = "O empregado que viajar à serviço, fora da região metropolitana, em viagens nacionais ou internacionais, estará coberto por seguro de vida especialmente adotado para cada viagem, a partir da saída e retorno a São Paulo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

O det DET DET [] [empregado]
empregado ROOT NOUN NOUN [O, viajar, coberto, .] []
que nsubj PRON PRON [] [viajar, empregado]
viajar acl:relcl VERB VERB [que, serviço, ,, fora] [empregado]
à case ADP ADP [] [serviço, viajar, empregado]
serviço obl NOUN NOUN [à] [viajar, empregado]
, punct PUNCT PUNCT [] [viajar, empregado]
fora advmod ADV ADV [região] [viajar, empregado]
da case ADP ADP [] [região, fora, viajar, empregado]
região obl NOUN NOUN [da, metropolitana] [fora, viajar, empregado]
metropolitana amod ADJ ADJ [] [região, fora, viajar, empregado]
, punct PUNCT PUNCT [] [viagens, coberto, empregado]
em case ADP ADP [] [viagens, coberto, empregado]
viagens obl NOUN NOUN [,, em, nacionais] [coberto, empregado]
nacionais amod ADJ ADJ [internacionais] [viagens, coberto, empregado]
ou cc CCONJ CCONJ [] [internacionais, nacionais, viagens, coberto, empregado]
internacionais conj ADJ ADJ [ou] [nacionais, viagens, coberto, empregado]
, punct PUNCT PUNCT [] [coberto, empregado]
estará cop AUX

In [71]:
sentence = "Não se aplica a garantia da letra B supra, quando o substituído estiver sob amparo da Previdência Social."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'se', 'slem': 'se', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'aplica', 'vlem': 'aplicar', 'passive': 0, 'md': 0}
{'subject': 'substituído', 'slem': 'substituir', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'estiver', 'vlem': 'estar', 'passive': 0, 'md': 0}
Não aplica advmod ADV ADV [] [aplica]
se aplica nsubj PRON PRON [] [aplica]
aplica aplica ROOT VERB VERB [Não, se, garantia, supra, amparo, .] []
a garantia det DET DET [] [garantia, aplica]
garantia aplica obj NOUN NOUN [a, letra] [aplica]
da letra case ADP ADP [] [letra, garantia, aplica]
letra garantia nmod NOUN NOUN [da, B] [garantia, aplica]
B letra flat:name PROPN PROPN [] [letra, garantia, aplica]
supra aplica dep PROPN PROPN [] [aplica]
, amparo punct PUNCT PUNCT [] [amparo, aplica]
quando amparo advmod ADV ADV [] [amparo, aplica]
o substituído det PRON PRON [] [substituído, amparo, aplica]
substituído amparo nsubj VERB VERB [o] [amparo, aplica]

In [72]:
sentence = "A empresa acordante fica responsável pelo pagamento das 44 horas semanais de trabalho e do repouso semanal remunerado."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'fica', 'vlem': 'ficar', 'passive': 0, 'md': 0}
A empresa det DET DET [] [empresa, fica]
empresa fica nsubj NOUN NOUN [A, acordante] [fica]
acordante empresa amod ADJ ADJ [] [empresa, fica]
fica fica ROOT VERB VERB [empresa, responsável, .] []
responsável fica xcomp ADJ ADJ [pagamento] [fica]
pelo pagamento case ADP ADP [] [pagamento, responsável, fica]
pagamento responsável obl NOUN NOUN [pelo, horas] [responsável, fica]
das horas case ADP ADP [] [horas, pagamento, responsável, fica]
44 horas nummod NUM NUM [] [horas, pagamento, responsável, fica]
horas pagamento nmod NOUN NOUN [das, 44, semanais, trabalho, repouso] [pagamento, responsável, fica]
semanais horas amod ADJ ADJ [] [horas, pagamento, responsável, fica]
de trabalho case ADP ADP [] [trabalho, horas, pagamento, responsável, fica]
trabalho horas nmod NOUN NOUN [de] [horas, pagamento, responsável, fica]
e repous

In [73]:
sentence = "Aos trabalhadores do sexo feminino, a empresa compromete-se a cumprir o disposto no Artigo 389."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': 'se', 'verb': 'compromete-se', 'vlem': 'comprometir', 'passive': 1, 'md': 0}
Aos trabalhadores case ADP ADP [] [trabalhadores, compromete-se]
trabalhadores compromete-se obl NOUN NOUN [Aos, sexo, ,] [compromete-se]
do sexo case ADP ADP [] [sexo, trabalhadores, compromete-se]
sexo trabalhadores nmod NOUN NOUN [do, feminino] [trabalhadores, compromete-se]
feminino sexo amod ADJ ADJ [] [sexo, trabalhadores, compromete-se]
, trabalhadores punct PUNCT PUNCT [] [trabalhadores, compromete-se]
a empresa det DET DET [] [empresa, compromete-se]
empresa compromete-se nsubj NOUN NOUN [a] [compromete-se]
compromete-se compromete-se ROOT VERB VERB [trabalhadores, empresa, cumprir, .] []
a cumprir mark SCONJ SCONJ [] [cumprir, compromete-se]
cumprir compromete-se xcomp VERB VERB [a, disposto] [compromete-se]
o disposto det DET DET [] [disposto, cumprir, compromete-se]
disposto cumprir obj NOUN NO

In [74]:
sentence = "Os trabalhadores menores reger-se-ão pelo Artigo 413, Item I da CLT, comprometendo-se a empresa a cumprir o disposto no Capítulo IV."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'trabalhadores', 'slem': 'trabalhador', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': 'se', 'verb': 'reger-se-ão', 'vlem': 'reger', 'passive': 1, 'md': 1}
Os trabalhadores det DET DET [] [trabalhadores, reger-se-ão]
trabalhadores reger-se-ão nsubj NOUN NOUN [Os, menores] [reger-se-ão]
menores trabalhadores amod ADJ ADJ [] [trabalhadores, reger-se-ão]
reger-se-ão reger-se-ão ROOT VERB VERB [trabalhadores, Artigo, comprometendo-se, .] []
pelo Artigo case ADP ADP [] [Artigo, reger-se-ão]
Artigo reger-se-ão obl NOUN NOUN [pelo, 413, Item] [reger-se-ão]
413 Artigo nummod NUM NUM [] [Artigo, reger-se-ão]
, Item punct PUNCT PUNCT [] [Item, Artigo, reger-se-ão]
Item Artigo appos PROPN PROPN [,, I, CLT, ,] [Artigo, reger-se-ão]
I Item flat:name PROPN PROPN [] [Item, Artigo, reger-se-ão]
da CLT case ADP ADP [] [CLT, Item, Artigo, reger-se-ão]
CLT Item nmod PROPN PROPN [da] [Item, Artigo, reger-se-ão]
, Item punct PUNCT PUNCT [] [Item, Artigo, reger-se-ão]
comprome

In [75]:
sentence = "Os empregados não ficam subordinados às condições e horários constantes dos Anexos I a X."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': 'ficam', 'hlem': 'ficar', 'verb': 'subordinados', 'vlem': 'subordinar', 'passive': 1, 'md': 0}
Os empregados det DET DET [] [empregados, ficam]
empregados ficam nsubj NOUN NOUN [Os] [ficam]
não ficam advmod ADV ADV [] [ficam]
ficam ficam ROOT VERB VERB [empregados, não, subordinados] []
subordinados ficam xcomp VERB VERB [condições] [ficam]
às condições case ADP ADP [] [condições, subordinados, ficam]
condições subordinados obl NOUN NOUN [às, horários] [subordinados, ficam]
e horários cc CCONJ CCONJ [] [horários, condições, subordinados, ficam]
horários condições conj NOUN NOUN [e, constantes, Anexos] [condições, subordinados, ficam]
constantes horários amod ADJ ADJ [] [horários, condições, subordinados, ficam]
dos Anexos case ADP ADP [] [Anexos, horários, condições, subordinados, ficam]
Anexos horários nmod PROPN PROPN [dos] [horários, condições, subordinados, ficam]
I I ROOT PROPN PR

In [76]:
sentence = "Fica estabelecido que o pagamento do adicional de periculosidade aos empregados da empresa relacionada acima será devido de forma proporcional."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'pagamento', 'slem': 'pagamento', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'será', 'hlem': 'ser', 'verb': 'devido', 'vlem': 'devido', 'passive': 1, 'md': 1}
Fica Fica ROOT VERB VERB [estabelecido, devido, .] []
estabelecido Fica xcomp ADJ ADJ [] [Fica]
que devido mark SCONJ SCONJ [] [devido, Fica]
o pagamento det DET DET [] [pagamento, devido, Fica]
pagamento devido nsubj NOUN NOUN [o, adicional] [devido, Fica]
do adicional case ADP ADP [] [adicional, pagamento, devido, Fica]
adicional pagamento nmod NOUN NOUN [do, periculosidade] [pagamento, devido, Fica]
de periculosidade case ADP ADP [] [periculosidade, adicional, pagamento, devido, Fica]
periculosidade adicional nmod NOUN NOUN [de, empregados] [adicional, pagamento, devido, Fica]
aos empregados case ADP ADP [] [empregados, periculosidade, adicional, pagamento, devido, Fica]
empregados periculosidade nmod NOUN NOUN [aos, empresa] [periculosidade, adicional, pagamento, devido, Fica]
da empresa case ADP ADP []

In [77]:
sentence = "A Conab estenderá a função de encarregados de depósito para as unidades operacionais que comprovadamente necessitem de tal função para melhorar o desempenho de suas atividades."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'Conab', 'slem': 'conab', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'estenderá', 'vlem': 'estender', 'passive': 0, 'md': 1}
A Conab det DET DET [] [Conab, estenderá]
Conab estenderá nsubj PROPN PROPN [A] [estenderá]
estenderá estenderá ROOT VERB VERB [Conab, função, necessitem, .] []
a função det DET DET [] [função, estenderá]
função estenderá obj NOUN NOUN [a, encarregados, unidades] [estenderá]
de encarregados case ADP ADP [] [encarregados, função, estenderá]
encarregados função nmod NOUN NOUN [de, depósito] [função, estenderá]
de depósito case ADP ADP [] [depósito, encarregados, função, estenderá]
depósito encarregados nmod NOUN NOUN [de] [encarregados, função, estenderá]
para unidades case ADP ADP [] [unidades, função, estenderá]
as unidades det DET DET [] [unidades, função, estenderá]
unidades função nmod NOUN NOUN [para, as, operacionais] [função, estenderá]
operacionais unidades amod ADJ ADJ [] [unidades, função, estenderá]
que nec

In [78]:
sentence = "Se efetivado na empresa, após a conclusão do aprendizado e inexistindo vaga na função para a qual recebeu treinamento, o mesmo poderá ser aproveitado em função compatível, percebendo o menor salário dessa função."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'mesmo', 'slem': 'mesmo', 'neg': '', 'modal': 'poderá', 'mlem': 'poder', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'aproveitado', 'vlem': 'aproveitar', 'passive': 1, 'md': 1}
Se efetivado mark SCONJ SCONJ [] [efetivado, poderá]
efetivado poderá advcl VERB VERB [Se, empresa, conclusão, inexistindo] [poderá]
na empresa case ADP ADP [] [empresa, efetivado, poderá]
empresa efetivado obl NOUN NOUN [na] [efetivado, poderá]
, conclusão punct PUNCT PUNCT [] [conclusão, efetivado, poderá]
após conclusão case ADP ADP [] [conclusão, efetivado, poderá]
a conclusão det DET DET [] [conclusão, efetivado, poderá]
conclusão efetivado obl NOUN NOUN [,, após, a, aprendizado] [efetivado, poderá]
do aprendizado case ADP ADP [] [aprendizado, conclusão, efetivado, poderá]
aprendizado conclusão nmod NOUN NOUN [do] [conclusão, efetivado, poderá]
e inexistindo cc CCONJ CCONJ [] [inexistindo, efetivado, poderá]
inexistindo efetivado conj VERB VERB [e, vaga, função] [efetivado, poderá]
vaga inexis

In [79]:
sentence = "Este benefício também será devido aos empregados do sexo masculino, que detenham a posse e guarda legal dos filhos e desde que vivam separados da mãe, o que deverá ser comprovado quando do requerimento do benefício, através de documentação legal."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'benefício', 'slem': 'benefício', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1}
Este benefício det DET DET [] [benefício, devido]
benefício devido nsubj NOUN NOUN [Este] [devido]
também devido advmod ADV ADV [] [devido]
será devido cop AUX AUX [] [devido]
devido devido ROOT ADV ADV [benefício, também, será, empregados, ,, .] []
aos empregados case ADP ADP [] [empregados, devido]
empregados devido obl NOUN NOUN [aos, sexo, detenham] [devido]
do sexo case ADP ADP [] [sexo, empregados, devido]
sexo empregados nmod NOUN NOUN [do, masculino] [empregados, devido]
masculino sexo amod PROPN PROPN [] [sexo, empregados, devido]
, devido punct PUNCT PUNCT [] [devido]
que detenham nsubj PRON PRON [] [detenham, empregados, devido]
detenham empregados acl:relcl VERB VERB [que, posse, guarda, vivam, ,, o] [empregados, devido]
a posse det DET DET [] [posse, detenham, empregados, devido]
posse detenham obj NOUN NO

In [80]:
sentence = "Com a finalidade de permitir a realização do pagamento dos salários dentro dos prazos legais, ou mesmo antes, quando for o caso, a empresa poderá efetuar o fechamento do cartão de ponto antes do final do mês."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': 'poderá', 'mlem': 'poder', 'helping_verb': '', 'hlem': '', 'verb': 'efetuar', 'vlem': 'efetuar', 'passive': 0, 'md': 1}
Com finalidade case ADP ADP [] [finalidade, efetuar, poderá]
a finalidade det DET DET [] [finalidade, efetuar, poderá]
finalidade efetuar obl NOUN NOUN [Com, a, permitir] [efetuar, poderá]
de permitir mark SCONJ SCONJ [] [permitir, finalidade, efetuar, poderá]
permitir finalidade acl VERB VERB [de, realização] [finalidade, efetuar, poderá]
a realização det DET DET [] [realização, permitir, finalidade, efetuar, poderá]
realização permitir obj NOUN NOUN [a, pagamento, dentro] [permitir, finalidade, efetuar, poderá]
do pagamento case ADP ADP [] [pagamento, realização, permitir, finalidade, efetuar, poderá]
pagamento realização nmod NOUN NOUN [do, salários] [realização, permitir, finalidade, efetuar, poderá]
dos salários case ADP ADP [] [salários, pagamento, realização, permitir, finalidade, efetuar, poderá]
sa

In [81]:
sentence = "As horas não trabalhadas serão lançadas no Banco de Horas como débito."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'horas', 'slem': 'hora', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'serão', 'hlem': 'ser', 'verb': 'lançadas', 'vlem': 'lançar', 'passive': 1, 'md': 1}
As horas det DET DET [] [horas, lançadas]
horas lançadas nsubj:pass NOUN NOUN [As, trabalhadas] [lançadas]
não trabalhadas advmod ADV ADV [] [trabalhadas, horas, lançadas]
trabalhadas horas acl VERB VERB [não] [horas, lançadas]
serão lançadas aux:pass AUX AUX [] [lançadas]
lançadas lançadas ROOT VERB VERB [horas, serão, Banco, débito, .] []
no Banco case ADP ADP [] [Banco, lançadas]
Banco lançadas obl PROPN PROPN [no, Horas] [lançadas]
de Horas case ADP ADP [] [Horas, Banco, lançadas]
Horas Banco nmod NOUN NOUN [de] [Banco, lançadas]
como débito case ADP ADP [] [débito, lançadas]
débito lançadas obl NOUN NOUN [como] [lançadas]
. lançadas punct PUNCT PUNCT [] [lançadas]


In [82]:
sentence = "Os atestados médicos somente serão aceitos se emitidos por médico do trabalho contratado pela Empresa."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'atestados', 'slem': 'atestado', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'serão', 'hlem': 'ser', 'verb': 'aceitos', 'vlem': 'aceitos', 'passive': 1, 'md': 1}
Os atestados det DET DET [] [atestados, aceitos]
atestados aceitos nsubj:pass NOUN NOUN [Os, médicos] [aceitos]
médicos atestados amod NOUN NOUN [] [atestados, aceitos]
somente aceitos advmod ADV ADV [] [aceitos]
serão aceitos aux:pass AUX AUX [] [aceitos]
aceitos aceitos ROOT VERB VERB [atestados, somente, serão, emitidos, .] []
se emitidos mark SCONJ SCONJ [] [emitidos, aceitos]
emitidos aceitos xcomp VERB VERB [se, médico] [aceitos]
por médico case ADP ADP [] [médico, emitidos, aceitos]
médico emitidos obl:agent NOUN NOUN [por, trabalho] [emitidos, aceitos]
do trabalho case ADP ADP [] [trabalho, médico, emitidos, aceitos]
trabalho médico nmod NOUN NOUN [do, contratado] [médico, emitidos, aceitos]
contratado trabalho acl VERB VERB [Empresa] [trabalho, médico, emitidos, aceitos]
pela Empresa case ADP ADP

In [83]:
sentence = "O pagamento, caso seja devido, será realizado na mesma data que os demais empregados ativos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'pagamento', 'slem': 'pagamento', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'será', 'hlem': 'ser', 'verb': 'realizado', 'vlem': 'realizar', 'passive': 1, 'md': 1}
O pagamento det DET DET [] [pagamento, realizado]
pagamento realizado nsubj:pass NOUN NOUN [O, ,] [realizado]
, pagamento punct PUNCT PUNCT [] [pagamento, realizado]
caso realizado mark SCONJ SCONJ [seja, devido] [realizado]
seja caso cc VERB VERB [] [caso, realizado]
devido caso fixed ADV ADV [,] [caso, realizado]
, devido punct PUNCT PUNCT [] [devido, caso, realizado]
será realizado aux:pass AUX AUX [] [realizado]
realizado realizado ROOT VERB VERB [pagamento, caso, será, data, empregados, .] []
na data case ADP ADP [] [data, realizado]
mesma data amod ADJ ADJ [] [data, realizado]
data realizado obl NOUN NOUN [na, mesma] [realizado]
que empregados mark PRON PRON [] [empregados, realizado]
os empregados det DET DET [] [empregados, realizado]
demais empregados det DET DET [] [empregados, realizado]
emp

In [84]:
sentence = "Ficará acordado que tanto as mulheres quantos os homens trabalharão no máximo 2 e na hipótese de trabalharem 2 domingos no mês, os mesmos terão que ser alternados e não consecutivos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'homens', 'slem': 'homem', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'trabalharão', 'vlem': 'trabalhar', 'passive': 0, 'md': 1}
{'subject': 'mesmos', 'slem': 'mesmo', 'neg': '', 'modal': 'terão que', 'mlem': 'ter que', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'alternados', 'vlem': 'alternar', 'passive': 1, 'md': 1}
Ficará acordado aux AUX AUX [] [acordado]
acordado acordado ROOT VERB VERB [Ficará, mulheres, .] []
que mulheres mark SCONJ SCONJ [] [mulheres, acordado]
tanto mulheres advmod ADV ADV [] [mulheres, acordado]
as mulheres det DET DET [] [mulheres, acordado]
mulheres acordado csubj NOUN NOUN [que, tanto, as, trabalharão] [acordado]
quantos trabalharão obj PRON PRON [] [trabalharão, mulheres, acordado]
os homens det DET DET [] [homens, trabalharão, mulheres, acordado]
homens trabalharão nsubj NOUN NOUN [os] [trabalharão, mulheres, acordado]
trabalharão mulheres acl:relcl VERB VERB [quantos, homens, máximo, hipótese] [mulheres,

In [85]:
sentence = "Durante o período de safra, aos empregados, CATADORES DE CANA, seja qual for o critério da respectiva remuneração, será assegurado, como mínima, o valor da diária estipulada conforme os critérios da cláusula terceira com o adicional de 20."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'critério', 'slem': 'critério', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'seja', 'vlem': 'ser', 'passive': 0, 'md': 0}
{'subject': 'valor', 'slem': 'valor', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'será', 'hlem': 'ser', 'verb': 'assegurado', 'vlem': 'assegurar', 'passive': 1, 'md': 1}
Durante período case ADP ADP [] [período, qual, assegurado]
o período det DET DET [] [período, qual, assegurado]
período qual obl NOUN NOUN [Durante, o, safra, ,, empregados] [qual, assegurado]
de safra case ADP ADP [] [safra, período, qual, assegurado]
safra período nmod NOUN NOUN [de] [período, qual, assegurado]
, período punct PUNCT PUNCT [] [período, qual, assegurado]
aos empregados case ADP ADP [] [empregados, período, qual, assegurado]
empregados período nmod NOUN NOUN [aos, CATADORES] [período, qual, assegurado]
, CATADORES punct PUNCT PUNCT [] [CATADORES, empregados, período, qual, assegurado]
CATADORES empregados appos PROPN PROPN [,, C

In [86]:
sentence = "Os empregados irão participar dos custos da assistência médica conforme tabela abaixo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'irão', 'hlem': 'ir', 'verb': 'participar', 'vlem': 'participar', 'passive': 0, 'md': 1}
Os empregados det DET DET [] [empregados, participar]
empregados participar nsubj NOUN NOUN [Os] [participar]
irão participar aux AUX AUX [] [participar]
participar participar ROOT VERB VERB [empregados, irão, custos, tabela, .] []
dos custos case ADP ADP [] [custos, participar]
custos participar obj NOUN NOUN [dos, assistência] [participar]
da assistência case ADP ADP [] [assistência, custos, participar]
assistência custos nmod NOUN NOUN [da, médica] [custos, participar]
médica assistência amod ADJ ADJ [] [assistência, custos, participar]
conforme tabela mark SCONJ SCONJ [] [tabela, participar]
tabela participar advcl NOUN NOUN [conforme, abaixo] [participar]
abaixo tabela advmod ADV ADV [] [tabela, participar]
. participar punct PUNCT PUNCT [] [participar]


In [87]:
sentence = "Quando houver prestação de horas extras, após excedidos 45 minutos, o empregador fornecerá lanche ao empregado; havendo impossibilidade ou desinteresse, pagará ao empregado o equivalente a 3 do piso salarial."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregador', 'slem': 'empregador', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'fornecerá', 'vlem': 'fornecer', 'passive': 0, 'md': 1}
Quando houver mark SCONJ SCONJ [] [houver, fornecerá]
houver fornecerá advcl VERB VERB [Quando, prestação, ,, minutos, ,] [fornecerá]
prestação houver obj NOUN NOUN [horas] [houver, fornecerá]
de horas case ADP ADP [] [horas, prestação, houver, fornecerá]
horas prestação nmod NOUN NOUN [de, extras] [prestação, houver, fornecerá]
extras horas amod ADJ ADJ [] [horas, prestação, houver, fornecerá]
, houver punct PUNCT PUNCT [] [houver, fornecerá]
após excedidos mark SCONJ SCONJ [] [excedidos, minutos, houver, fornecerá]
excedidos minutos acl VERB VERB [após] [minutos, houver, fornecerá]
45 minutos nummod NUM NUM [] [minutos, houver, fornecerá]
minutos houver obj NOUN NOUN [excedidos, 45] [houver, fornecerá]
, houver punct PUNCT PUNCT [] [houver, fornecerá]
o empregador det DET DET [] [empregador, fornecerá]
em

In [88]:
sentence = "A empresa terá que fazer os descontos dos convênios firmados com o SINTRACOMRRE/PA, em folha de pagamento aprovado em assembléia geral, e repassará para o mesmo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': 'terá que', 'mlem': 'ter que', 'helping_verb': '', 'hlem': '', 'verb': 'fazer', 'vlem': 'fazer', 'passive': 0, 'md': 1}
A empresa det DET DET [] [empresa, fazer]
empresa fazer nsubj NOUN NOUN [A] [fazer]
terá fazer aux AUX AUX [] [fazer]
que fazer mark SCONJ SCONJ [] [fazer]
fazer fazer ROOT VERB VERB [empresa, terá, que, descontos, repassará, .] []
os descontos det DET DET [] [descontos, fazer]
descontos fazer obj NOUN NOUN [os, convênios, firmados] [fazer]
dos convênios case ADP ADP [] [convênios, descontos, fazer]
convênios descontos nmod NOUN NOUN [dos] [descontos, fazer]
firmados descontos acl VERB VERB [SINTRACOMRRE, ,, folha] [descontos, fazer]
com SINTRACOMRRE case ADP ADP [] [SINTRACOMRRE, firmados, descontos, fazer]
o SINTRACOMRRE det DET DET [] [SINTRACOMRRE, firmados, descontos, fazer]
SINTRACOMRRE firmados obl PROPN PROPN [com, o, /, PA] [firmados, descontos, fazer]
/ SINTRACOMRRE nmod ADP ADP [] [SINTRACOMRRE, 

In [89]:
sentence = "A motociclista gestante afastada em licença maternidade terá garantida a manutenção no emprego pelo prazo de 60 dias a contar do término da licença maternidade, ressalvado o caso de demissão por justa causa, mediante a abertura do inquérito para a apuração da falta grave ou a pedido."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'motociclista', 'slem': 'motociclista', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'terá', 'vlem': 'ter', 'passive': 0, 'md': 1}
{'subject': 'caso', 'slem': 'caso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'ressalvado', 'vlem': 'ressalvar', 'passive': 0, 'md': 0}
A motociclista det DET DET [] [motociclista, terá, ressalvado]
motociclista terá nsubj NOUN NOUN [A, gestante, afastada] [terá, ressalvado]
gestante motociclista amod ADJ ADJ [] [motociclista, terá, ressalvado]
afastada motociclista acl VERB VERB [licença] [motociclista, terá, ressalvado]
em licença case ADP ADP [] [licença, afastada, motociclista, terá, ressalvado]
licença afastada obl NOUN NOUN [em, maternidade] [afastada, motociclista, terá, ressalvado]
maternidade licença amod NOUN NOUN [] [licença, afastada, motociclista, terá, ressalvado]
terá ressalvado ccomp AUX AUX [motociclista, garantida, manutenção, contar] [ressalvado]
garantida terá

In [90]:
sentence = "A empresa poderá a critério próprio, não descontar atraso superior a 15 minutos semanais, desde que o atraso seja justificado e não seja o empregado contumaz."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': 'poderá', 'mlem': 'poder', 'helping_verb': '', 'hlem': '', 'verb': 'critério', 'vlem': 'critério', 'passive': 0, 'md': 1}
{'subject': 'atraso', 'slem': 'atraso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'seja', 'hlem': 'ser', 'verb': 'justificado', 'vlem': 'justificar', 'passive': 1, 'md': 0}
A empresa det DET DET [] [empresa, poderá]
empresa poderá nsubj NOUN NOUN [A] [poderá]
poderá poderá ROOT VERB VERB [empresa, critério] []
a critério case ADP ADP [] [critério, poderá]
critério poderá xcomp NOUN NOUN [a, próprio, descontar, .] [poderá]
próprio critério amod ADJ ADJ [] [critério, poderá]
, descontar punct PUNCT PUNCT [] [descontar, critério, poderá]
não descontar advmod ADV ADV [] [descontar, critério, poderá]
descontar critério advcl VERB VERB [,, não, atraso, ,, justificado] [critério, poderá]
atraso descontar obj NOUN NOUN [superior] [descontar, critério, poderá]
superior atraso amod ADJ ADJ [minutos] [atra

In [91]:
sentence = "Qualquer dúvida ou divergência na aplicação do presente acordo deverá as partes obrigatoriamente travar negociação, na busca de conciliação, para somente após, caso não ocorra entendimento, ingressar em juízo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'dúvida', 'slem': 'dúvida', 'neg': '', 'modal': 'deverá', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'travar', 'vlem': 'travar', 'passive': 0, 'md': 1}
{'subject': 'partes', 'slem': 'parte', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'travar', 'vlem': 'travar', 'passive': 0, 'md': 0}
Qualquer dúvida det DET DET [] [dúvida, deverá]
dúvida deverá nsubj NOUN NOUN [Qualquer, divergência, aplicação] [deverá]
ou divergência cc CCONJ CCONJ [] [divergência, dúvida, deverá]
divergência dúvida conj NOUN NOUN [ou] [dúvida, deverá]
na aplicação case ADP ADP [] [aplicação, dúvida, deverá]
aplicação dúvida nmod NOUN NOUN [na, acordo] [dúvida, deverá]
do acordo case ADP ADP [] [acordo, aplicação, dúvida, deverá]
presente acordo amod ADJ ADJ [] [acordo, aplicação, dúvida, deverá]
acordo aplicação nmod NOUN NOUN [do, presente] [aplicação, dúvida, deverá]
deverá deverá ROOT VERB VERB [dúvida, travar] []
as partes det DET DET [] [partes, travar, 

In [92]:
sentence = "Se rescindido o contrato de trabalho, a empregada deverá, se for o caso, avisar o empregador do seu estado de gestação, devendo comprová-lo dentro do prazo de 60 dias a partir da notificação da dispensa."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregada', 'slem': 'empregada', 'neg': '', 'modal': 'deverá', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'avisar', 'vlem': 'avisar', 'passive': 0, 'md': 1}
{'subject': 'caso', 'slem': 'caso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'for', 'vlem': 'ir', 'passive': 0, 'md': 0}
Se rescindido mark SCONJ SCONJ [] [rescindido, deverá]
rescindido deverá advcl VERB VERB [Se, contrato, ,] [deverá]
o contrato det DET DET [] [contrato, rescindido, deverá]
contrato rescindido obj NOUN NOUN [o, trabalho] [rescindido, deverá]
de trabalho case ADP ADP [] [trabalho, contrato, rescindido, deverá]
trabalho contrato nmod NOUN NOUN [de] [contrato, rescindido, deverá]
, rescindido punct PUNCT PUNCT [] [rescindido, deverá]
a empregada det DET DET [] [empregada, deverá]
empregada deverá nsubj NOUN NOUN [a] [deverá]
deverá deverá ROOT VERB VERB [rescindido, empregada, avisar] []
, avisar punct PUNCT PUNCT [] [avisar, deverá]
se for mark SCONJ SCO

In [93]:
sentence = "No caso de indenização, o empregado fará jus a 1/12 avos a mais nas verbas rescisórias."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregado', 'slem': 'empregado', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'fará', 'vlem': 'fazer', 'passive': 0, 'md': 1}
No caso case ADP ADP [] [caso, fará]
caso fará obl NOUN NOUN [No, indenização, ,] [fará]
de indenização case ADP ADP [] [indenização, caso, fará]
indenização caso nmod NOUN NOUN [de] [caso, fará]
, caso punct PUNCT PUNCT [] [caso, fará]
o empregado det DET DET [] [empregado, fará]
empregado fará nsubj NOUN NOUN [o] [fará]
fará fará ROOT VERB VERB [caso, empregado, jus, .] []
jus fará obj NOUN NOUN [avos, verbas] [fará]
a avos case ADP ADP [] [avos, jus, fará]
1/12 avos nummod NUM NUM [] [avos, jus, fará]
avos jus nmod NOUN NOUN [a, 1/12] [jus, fará]
a mais case ADP ADP [] [mais, verbas, jus, fará]
mais verbas advmod ADV ADV [a] [verbas, jus, fará]
nas verbas case ADP ADP [] [verbas, jus, fará]
verbas jus nmod NOUN NOUN [mais, nas, rescisórias] [jus, fará]
rescisórias verbas amod ADJ ADJ [] [verbas, jus, fará]
. fará 

In [94]:
text = "empregado, empregados, empregada, empregadas, empregador, empregadores, empregadora, empregadoras"
doc = nlp(text)

lemmas = [token.lemma_ for token in doc if not token.is_punct]
print(lemmas)

['empregado', 'empregado', 'empregado', 'empregar', 'empregador', 'empregador', 'empregador', 'empregadora']
