## Tests for Parsing

In [95]:
import sys
sys.path.append('..')

import spacy
nlp = spacy.load('pt_core_news_sm', disable=["ner"])

from src.main02_parse_articles import parse_by_subject

In [96]:
sentence = "O menino está comendo uma maçã e a menina bebe suco."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'menino', 'slem': 'menino', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'está', 'hlem': 'estar', 'verb': 'comendo', 'vlem': 'comer', 'passive': 0, 'md': 0}
{'subject': 'menina', 'slem': 'menina', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'bebe', 'vlem': 'beber', 'passive': 0, 'md': 0}
O det DET DET [] [menino, comendo]
menino nsubj NOUN NOUN [O] [comendo]
está aux AUX AUX [] [comendo]
comendo ROOT VERB VERB [menino, está, maçã, bebe, .] []
uma det DET DET [] [maçã, comendo]
maçã obj NOUN NOUN [uma] [comendo]
e cc CCONJ CCONJ [] [bebe, comendo]
a det DET DET [] [menina, bebe, comendo]
menina nsubj NOUN NOUN [a] [bebe, comendo]
bebe conj VERB VERB [e, menina, suco] [comendo]
suco advmod ADV ADV [] [bebe, comendo]
. punct PUNCT PUNCT [] [comendo]


In [97]:
sentence = "O menino está comendo uma maçã e a menina não bebe suco."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'menino', 'slem': 'menino', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'está', 'hlem': 'estar', 'verb': 'comendo', 'vlem': 'comer', 'passive': 0, 'md': 0}
{'subject': 'menina', 'slem': 'menina', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'bebe', 'vlem': 'beber', 'passive': 0, 'md': 0}
O det DET DET [] [menino, comendo]
menino nsubj NOUN NOUN [O] [comendo]
está aux AUX AUX [] [comendo]
comendo ROOT VERB VERB [menino, está, maçã, bebe, .] []
uma det DET DET [] [maçã, comendo]
maçã obj NOUN NOUN [uma] [comendo]
e cc CCONJ CCONJ [] [bebe, comendo]
a det DET DET [] [menina, bebe, comendo]
menina nsubj NOUN NOUN [a] [bebe, comendo]
não advmod ADV ADV [] [bebe, comendo]
bebe conj VERB VERB [e, menina, não, suco] [comendo]
suco advmod ADV ADV [] [bebe, comendo]
. punct PUNCT PUNCT [] [comendo]


In [98]:
sentence = "Os funcionários devem ter pelo menos uma pausa durante a jornada de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'devem', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1}
Os det DET DET [] [funcionários, devem]
funcionários nsubj NOUN NOUN [Os] [devem]
devem ROOT VERB VERB [funcionários, ter] []
ter xcomp VERB VERB [pausa, jornada, .] [devem]
pelo case ADP ADP [] [menos, pausa, ter, devem]
menos nmod NOUN NOUN [pelo] [pausa, ter, devem]
uma det DET DET [] [pausa, ter, devem]
pausa obj NOUN NOUN [menos, uma] [ter, devem]
durante case ADP ADP [] [jornada, ter, devem]
a det DET DET [] [jornada, ter, devem]
jornada obl NOUN NOUN [durante, a, trabalho] [ter, devem]
de case ADP ADP [] [trabalho, jornada, ter, devem]
trabalho nmod NOUN NOUN [de] [jornada, ter, devem]
. punct PUNCT PUNCT [] [ter, devem]


In [99]:
sentence = "O piso salarial vigente a partir de 01 de abril de 2010 será de 952,20 mensais."
doc = nlp(sentence)
    
sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'piso', 'slem': 'piso', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1}
O det DET DET [] [piso, mensais]
piso nsubj NOUN NOUN [O, salarial, vigente] [mensais]
salarial amod ADJ ADJ [] [piso, mensais]
vigente amod ADJ ADJ [01] [piso, mensais]
a case ADP ADP [partir, de] [01, vigente, piso, mensais]
partir fixed NOUN NOUN [] [a, 01, vigente, piso, mensais]
de fixed ADP ADP [] [a, 01, vigente, piso, mensais]
01 obl NUM NUM [a, abril] [vigente, piso, mensais]
de case ADP ADP [] [abril, 01, vigente, piso, mensais]
abril nmod NOUN NOUN [de, 2010] [01, vigente, piso, mensais]
de case ADP ADP [] [2010, abril, 01, vigente, piso, mensais]
2010 nmod NUM NUM [de] [abril, 01, vigente, piso, mensais]
será cop AUX AUX [] [mensais]
de case ADP ADP [] [mensais]
952,20 nummod NUM NUM [] [mensais]
mensais ROOT NOUN NOUN [piso, será, de, 952,20, .] []
. punct PUNCT PUNCT [] [mensais]


In [100]:
sentence = "Os empregados substitutos não podem ter direito à pensão."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': 'não', 'modal': 'podem', 'mlem': 'poder', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1}
Os det DET DET [] [empregados, podem]
empregados nsubj NOUN NOUN [Os, substitutos] [podem]
substitutos amod ADJ ADJ [] [empregados, podem]
não advmod ADV ADV [] [ter, podem]
podem ROOT VERB VERB [empregados, ter] []
ter xcomp VERB VERB [não, direito, .] [podem]
direito obj NOUN NOUN [pensão] [ter, podem]
à case ADP ADP [] [pensão, direito, ter, podem]
pensão nmod NOUN NOUN [à] [direito, ter, podem]
. punct PUNCT PUNCT [] [ter, podem]


In [143]:
sentence = "Eu tenho lido um livro."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'Eu', 'slem': 'eu', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'tenho', 'hlem': 'ter', 'verb': 'lido', 'vlem': 'ler', 'passive': 0, 'md': 0}
Eu lido nsubj PRON PRON [] [lido]
tenho lido aux AUX AUX [] [lido]
lido lido ROOT VERB VERB [Eu, tenho, livro, .] []
um livro det DET DET [] [livro, lido]
livro lido obj NOUN NOUN [um] [lido]
. lido punct PUNCT PUNCT [] [lido]


In [102]:
sentence = "O livro foi lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'foi', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 0}
O det DET DET [] [livro, lido]
livro nsubj:pass NOUN NOUN [O] [lido]
foi aux:pass AUX AUX [] [lido]
lido ROOT VERB VERB [livro, foi, ela, .] []
por case ADP ADP [] [ela, lido]
ela obl PRON PRON [por] [lido]
. punct PUNCT PUNCT [] [lido]


In [103]:
sentence = "O livro deve ser lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': '', 'modal': 'deve', 'mlem': 'dever', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 1}
O det DET DET [] [livro, deve]
livro nsubj:pass NOUN NOUN [O] [deve]
deve ROOT VERB VERB [livro, lido] []
ser aux:pass AUX AUX [] [lido, deve]
lido xcomp VERB VERB [ser, ela, .] [deve]
por case ADP ADP [] [ela, lido, deve]
ela obl PRON PRON [por] [lido, deve]
. punct PUNCT PUNCT [] [lido, deve]


In [104]:
sentence = "O livro não deveria ter sido lido por ela."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'livro', 'slem': 'livro', 'neg': 'não', 'modal': 'deveria', 'mlem': 'dever', 'helping_verb': 'sido', 'hlem': 'ser', 'verb': 'lido', 'vlem': 'ler', 'passive': 1, 'md': 1}
O livro det DET DET [] [livro, deveria]
livro deveria nsubj:pass NOUN NOUN [O] [deveria]
não lido advmod ADV ADV [] [lido, deveria]
deveria deveria ROOT VERB VERB [livro, lido] []
ter lido aux AUX AUX [] [lido, deveria]
sido lido aux:pass AUX AUX [] [lido, deveria]
lido deveria xcomp VERB VERB [não, ter, sido, ela, .] [deveria]
por ela case ADP ADP [] [ela, lido, deveria]
ela lido obl PRON PRON [por] [lido, deveria]
. lido punct PUNCT PUNCT [] [lido, deveria]


In [105]:
sentence = "Um intervalo é permitido aos funcionários."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'intervalo', 'slem': 'intervalo', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'é', 'hlem': 'ser', 'verb': 'permitido', 'vlem': 'permitir', 'passive': 1, 'md': 0}
Um intervalo det DET DET [] [intervalo, permitido]
intervalo permitido nsubj:pass NOUN NOUN [Um] [permitido]
é permitido aux:pass AUX AUX [] [permitido]
permitido permitido ROOT VERB VERB [intervalo, é, funcionários, .] []
aos funcionários case ADP ADP [] [funcionários, permitido]
funcionários permitido obl NOUN NOUN [aos] [permitido]
. permitido punct PUNCT PUNCT [] [permitido]


In [106]:
sentence = "Os funcionários estão proibidos de comer no local de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'estão', 'vlem': 'estar', 'passive': 0, 'md': 0}
Os funcionários det DET DET [] [funcionários, proibidos]
funcionários proibidos nsubj NOUN NOUN [Os] [proibidos]
estão proibidos cop AUX AUX [] [proibidos]
proibidos proibidos ROOT ADJ ADJ [funcionários, estão, comer, .] []
de comer mark SCONJ SCONJ [] [comer, proibidos]
comer proibidos xcomp VERB VERB [de, local] [proibidos]
no local case ADP ADP [] [local, comer, proibidos]
local comer obl NOUN NOUN [no, trabalho] [comer, proibidos]
de trabalho case ADP ADP [] [trabalho, local, comer, proibidos]
trabalho local nmod NOUN NOUN [de] [local, comer, proibidos]
. proibidos punct PUNCT PUNCT [] [proibidos]


In [107]:
sentence = "Os funcionários devem ter pelo menos uma pausa durante a jornada de trabalho."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'devem', 'mlem': 'dever', 'helping_verb': '', 'hlem': '', 'verb': 'ter', 'vlem': 'ter', 'passive': 0, 'md': 1}
Os funcionários det DET DET [] [funcionários, devem]
funcionários devem nsubj NOUN NOUN [Os] [devem]
devem devem ROOT VERB VERB [funcionários, ter] []
ter devem xcomp VERB VERB [pausa, jornada, .] [devem]
pelo menos case ADP ADP [] [menos, pausa, ter, devem]
menos pausa nmod NOUN NOUN [pelo] [pausa, ter, devem]
uma pausa det DET DET [] [pausa, ter, devem]
pausa ter obj NOUN NOUN [menos, uma] [ter, devem]
durante jornada case ADP ADP [] [jornada, ter, devem]
a jornada det DET DET [] [jornada, ter, devem]
jornada ter obl NOUN NOUN [durante, a, trabalho] [ter, devem]
de trabalho case ADP ADP [] [trabalho, jornada, ter, devem]
trabalho jornada nmod NOUN NOUN [de] [jornada, ter, devem]
. ter punct PUNCT PUNCT [] [ter, devem]


In [108]:
sentence = "Na hipótese da ocorrência de rescisão do contrato de trabalho, qualquer que seja a causa, em existindo horas a crédito do EMPREGADO, estas serão pagas pela EMPREGADORA como horas extraordinárias, acrescidas dos adicionais previstos na Convenção Coletiva de Trabalho juntamente com as demais verbas rescisórias."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'estas', 'slem': 'este', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'serão', 'vlem': 'ser', 'passive': 1, 'md': 1}
Na case ADP ADP [] [hipótese, pagas]
hipótese obl NOUN NOUN [Na, ocorrência, ,, causa] [pagas]
da case ADP ADP [] [ocorrência, hipótese, pagas]
ocorrência nmod NOUN NOUN [da, rescisão] [hipótese, pagas]
de case ADP ADP [] [rescisão, ocorrência, hipótese, pagas]
rescisão nmod NOUN NOUN [de, contrato] [ocorrência, hipótese, pagas]
do case ADP ADP [] [contrato, rescisão, ocorrência, hipótese, pagas]
contrato nmod NOUN NOUN [do, trabalho] [rescisão, ocorrência, hipótese, pagas]
de case ADP ADP [] [trabalho, contrato, rescisão, ocorrência, hipótese, pagas]
trabalho nmod NOUN NOUN [de] [contrato, rescisão, ocorrência, hipótese, pagas]
, punct PUNCT PUNCT [] [hipótese, pagas]
qualquer det DET DET [] [que, causa, hipótese, pagas]
que nsubj PRON PRON [qualquer, acrescidas] [causa, hipótese, pagas]
seja cop VERB VERB [] [causa, hipótese

In [109]:
sentence = "A CEEE-D aplicará sobre a matriz salarial, já reajustada com o índice de 4,18, o percentual de 1,4, a título de ganho real."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'CEEE-D', 'slem': 'ceee-d', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'aplicará', 'vlem': 'aplicar', 'passive': 0, 'md': 1}
A det DET DET [] [CEEE-D, aplicará]
CEEE-D nsubj NOUN NOUN [A] [aplicará]
aplicará ROOT VERB VERB [CEEE-D, matriz, título, .] []
sobre case ADP ADP [] [matriz, aplicará]
a det DET DET [] [matriz, aplicará]
matriz obj NOUN NOUN [sobre, a, salarial, reajustada, percentual] [aplicará]
salarial amod ADJ ADJ [] [matriz, aplicará]
, punct PUNCT PUNCT [] [reajustada, matriz, aplicará]
já advmod ADV ADV [] [reajustada, matriz, aplicará]
reajustada acl VERB VERB [,, já, índice] [matriz, aplicará]
com case ADP ADP [] [índice, reajustada, matriz, aplicará]
o det DET DET [] [índice, reajustada, matriz, aplicará]
índice obj NOUN NOUN [com, o, 4,18] [reajustada, matriz, aplicará]
de case ADP ADP [] [4,18, índice, reajustada, matriz, aplicará]
4,18 nmod NUM NUM [de] [índice, reajustada, matriz, aplicará]
, punct PUNCT PUNCT [] [per

In [110]:
sentence = "Os funcionários têm que trabalhar pelo menos 5 horas por dia."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': 'têm que', 'mlem': 'ter que', 'helping_verb': '', 'hlem': '', 'verb': 'trabalhar', 'vlem': 'trabalhar', 'passive': 0, 'md': 1}
Os funcionários det DET DET [] [funcionários, trabalhar]
funcionários trabalhar nsubj NOUN NOUN [Os] [trabalhar]
têm trabalhar aux AUX AUX [] [trabalhar]
que trabalhar mark SCONJ SCONJ [] [trabalhar]
trabalhar trabalhar ROOT VERB VERB [funcionários, têm, que, horas, .] []
pelo menos case ADP ADP [] [menos, horas, trabalhar]
menos horas nmod NOUN NOUN [pelo] [horas, trabalhar]
5 horas nummod NUM NUM [] [horas, trabalhar]
horas trabalhar obl NOUN NOUN [menos, 5, dia] [trabalhar]
por dia case ADP ADP [] [dia, horas, trabalhar]
dia horas nmod NOUN NOUN [por] [horas, trabalhar]
. trabalhar punct PUNCT PUNCT [] [trabalhar]


In [111]:
sentence = "Os funcionários que trabalham em período integral precisam receber a promessa de benefícios de creche."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'precisam', 'vlem': 'precisar', 'passive': 0, 'md': 0}
Os funcionários det DET DET [] [funcionários, precisam]
funcionários precisam nsubj NOUN NOUN [Os, trabalham] [precisam]
que trabalham nsubj PRON PRON [] [trabalham, funcionários, precisam]
trabalham funcionários acl:relcl VERB VERB [que, período] [funcionários, precisam]
em período case ADP ADP [] [período, trabalham, funcionários, precisam]
período trabalham obl NOUN NOUN [em, integral] [trabalham, funcionários, precisam]
integral período amod ADJ ADJ [] [período, trabalham, funcionários, precisam]
precisam precisam ROOT VERB VERB [funcionários, receber, .] []
receber precisam xcomp VERB VERB [promessa] [precisam]
a promessa det DET DET [] [promessa, receber, precisam]
promessa receber obj NOUN NOUN [a, benefícios] [receber, precisam]
de benefícios case ADP ADP [] [benefícios, promessa, receber, precisam]

In [112]:
sentence = "Fica garantida ao aposentado a inscrição de novos beneficiários a ele vinculado."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])


{'subject': 'inscrição', 'slem': 'inscrição', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'Fica', 'vlem': 'ficar', 'passive': 0, 'md': 0}
Fica Fica ROOT VERB VERB [garantida, inscrição, .] []
garantida Fica xcomp ADJ ADJ [aposentado] [Fica]
ao aposentado mark ADP ADP [] [aposentado, garantida, Fica]
aposentado garantida obl NOUN NOUN [ao] [garantida, Fica]
a inscrição det DET DET [] [inscrição, Fica]
inscrição Fica nsubj NOUN NOUN [a, beneficiários, ele] [Fica]
de beneficiários case ADP ADP [] [beneficiários, inscrição, Fica]
novos beneficiários amod ADJ ADJ [] [beneficiários, inscrição, Fica]
beneficiários inscrição nmod NOUN NOUN [de, novos] [inscrição, Fica]
a ele case ADP ADP [] [ele, inscrição, Fica]
ele inscrição nmod PRON PRON [a, vinculado] [inscrição, Fica]
vinculado ele acl VERB VERB [] [ele, inscrição, Fica]
. Fica punct PUNCT PUNCT [] [Fica]


In [113]:
sentence = "Fica ainda assegurado, para os empregados, aposentados e pensionistas a eles vinculados, o atual sistema de concessão e custeio dos medicamentos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'sistema', 'slem': 'sistema', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'Fica', 'hlem': 'ficar', 'verb': 'assegurado', 'vlem': 'assegurar', 'passive': 1, 'md': 0}
Fica Fica ROOT VERB VERB [assegurado, empregados, sistema, .] []
ainda assegurado advmod ADV ADV [] [assegurado, Fica]
assegurado Fica xcomp VERB VERB [ainda, ,] [Fica]
, assegurado punct PUNCT PUNCT [] [assegurado, Fica]
para empregados case ADP ADP [] [empregados, Fica]
os empregados det DET DET [] [empregados, Fica]
empregados Fica obl NOUN NOUN [para, os, aposentados, pensionistas] [Fica]
, aposentados punct PUNCT PUNCT [] [aposentados, empregados, Fica]
aposentados empregados conj NOUN NOUN [,] [empregados, Fica]
e pensionistas cc CCONJ CCONJ [] [pensionistas, empregados, Fica]
pensionistas empregados conj NOUN NOUN [e, eles] [empregados, Fica]
a eles case ADP ADP [] [eles, pensionistas, empregados, Fica]
eles pensionistas nmod PRON PRON [a, vinculados] [pensionistas, empregados, Fica]
vinculados el

In [114]:
sentence = "Os funcionários não recebem transporte."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'funcionários', 'slem': 'funcionário', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'recebem', 'vlem': 'receber', 'passive': 0, 'md': 0}
Os funcionários det DET DET [] [funcionários, recebem]
funcionários recebem nsubj NOUN NOUN [Os] [recebem]
não recebem advmod ADV ADV [] [recebem]
recebem recebem ROOT VERB VERB [funcionários, não, transporte, .] []
transporte recebem obj NOUN NOUN [] [recebem]
. recebem punct PUNCT PUNCT [] [recebem]


In [115]:
sentence = "O descanso já se compreende no salário mensal."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'descanso', 'slem': 'descanso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'se', 'hlem': 'se', 'verb': 'compreende', 'vlem': 'compreender', 'passive': 1, 'md': 0}
O det DET DET [] [descanso, compreende]
descanso nsubj NOUN NOUN [O] [compreende]
já advmod ADV ADV [] [compreende]
se expl PRON PRON [] [compreende]
compreende ROOT VERB VERB [descanso, já, se, salário, .] []
no case ADP ADP [] [salário, compreende]
salário obj NOUN NOUN [no, mensal] [compreende]
mensal amod ADJ ADJ [] [salário, compreende]
. punct PUNCT PUNCT [] [compreende]


In [116]:
sentence = "Ficam excluídas desta penalidade as cláusulas que já possuam cominações específicas."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'cláusulas', 'slem': 'cláusula', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'Ficam', 'hlem': 'ficam', 'verb': 'excluídas', 'vlem': 'excluír', 'passive': 1, 'md': 0}
Ficam ROOT VERB VERB [excluídas, cláusulas, .] []
excluídas xcomp VERB VERB [penalidade] [Ficam]
desta case ADP ADP [] [penalidade, excluídas, Ficam]
penalidade obl NOUN NOUN [desta] [excluídas, Ficam]
as det DET DET [] [cláusulas, Ficam]
cláusulas nsubj NOUN NOUN [as, possuam] [Ficam]
que nsubj PRON PRON [] [possuam, cláusulas, Ficam]
já advmod ADV ADV [] [possuam, cláusulas, Ficam]
possuam acl:relcl VERB VERB [que, já, cominações] [cláusulas, Ficam]
cominações obj NOUN NOUN [específicas] [possuam, cláusulas, Ficam]
específicas amod ADJ ADJ [] [cominações, possuam, cláusulas, Ficam]
. punct PUNCT PUNCT [] [Ficam]


In [117]:
sentence = "O empregado que viajar à serviço, fora da região metropolitana, em viagens nacionais ou internacionais, estará coberto por seguro de vida especialmente adotado para cada viagem, a partir da saída e retorno a São Paulo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregado', 'slem': 'empregado', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'estará', 'vlem': 'estar', 'passive': 1, 'md': 1}
O det DET DET [] [empregado, coberto]
empregado nsubj:pass NOUN NOUN [O, viajar] [coberto]
que nsubj PRON PRON [] [viajar, empregado, coberto]
viajar acl:relcl VERB VERB [que, serviço, ,, fora, ,, viagens, ,] [empregado, coberto]
à case ADP ADP [] [serviço, viajar, empregado, coberto]
serviço obl NOUN NOUN [à] [viajar, empregado, coberto]
, punct PUNCT PUNCT [] [viajar, empregado, coberto]
fora advmod ADV ADV [região] [viajar, empregado, coberto]
da case ADP ADP [] [região, fora, viajar, empregado, coberto]
região obl NOUN NOUN [da, metropolitana] [fora, viajar, empregado, coberto]
metropolitana amod ADJ ADJ [] [região, fora, viajar, empregado, coberto]
, punct PUNCT PUNCT [] [viajar, empregado, coberto]
em case ADP ADP [] [viagens, viajar, empregado, coberto]
viagens obl NOUN NOUN [em, nacionais] [viajar, empregad

In [118]:
sentence = "Não se aplica a garantia da letra B supra, quando o substituído estiver sob amparo da Previdência Social."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'se', 'slem': 'se', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'aplica', 'vlem': 'aplicar', 'passive': 0, 'md': 0}
{'subject': 'substituído', 'slem': 'substituir', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'estiver', 'vlem': 'estar', 'passive': 0, 'md': 0}
Não aplica advmod ADV ADV [] [aplica]
se aplica nsubj PRON PRON [] [aplica]
aplica aplica ROOT VERB VERB [Não, se, garantia, amparo, .] []
a garantia det DET DET [] [garantia, aplica]
garantia aplica obj NOUN NOUN [a, letra] [aplica]
da letra case ADP ADP [] [letra, garantia, aplica]
letra garantia nmod NOUN NOUN [da, B, supra] [garantia, aplica]
B letra flat:name PROPN PROPN [] [letra, garantia, aplica]
supra letra amod NOUN NOUN [] [letra, garantia, aplica]
, amparo punct PUNCT PUNCT [] [amparo, aplica]
quando amparo advmod ADV ADV [] [amparo, aplica]
o substituído det DET DET [] [substituído, amparo, aplica]
substituído amparo nsubj NOUN NOUN [o] [am

In [119]:
sentence = "A empresa acordante fica responsável pelo pagamento das 44 horas semanais de trabalho e do repouso semanal remunerado."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'fica', 'vlem': 'ficar', 'passive': 0, 'md': 0}
A empresa det DET DET [] [empresa, fica]
empresa fica nsubj NOUN NOUN [A] [fica]
acordante fica advmod ADJ ADJ [] [fica]
fica fica ROOT VERB VERB [empresa, acordante, responsável, .] []
responsável fica xcomp ADJ ADJ [pagamento] [fica]
pelo pagamento case ADP ADP [] [pagamento, responsável, fica]
pagamento responsável obl NOUN NOUN [pelo, horas] [responsável, fica]
das horas case ADP ADP [] [horas, pagamento, responsável, fica]
44 horas nummod NUM NUM [] [horas, pagamento, responsável, fica]
horas pagamento nmod NOUN NOUN [das, 44, semanais, trabalho] [pagamento, responsável, fica]
semanais horas amod ADJ ADJ [] [horas, pagamento, responsável, fica]
de trabalho case ADP ADP [] [trabalho, horas, pagamento, responsável, fica]
trabalho horas nmod NOUN NOUN [de, repouso] [horas, pagamento, responsável, fica]
e repouso cc CCONJ

In [120]:
sentence = "Aos trabalhadores do sexo feminino, a empresa compromete-se a cumprir o disposto no Artigo 389."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': 'se', 'verb': 'compromete-se', 'vlem': 'comprometar', 'passive': 1, 'md': 0}
Aos trabalhadores case ADP ADP [] [trabalhadores, compromete-se]
trabalhadores compromete-se obl NOUN NOUN [Aos, sexo] [compromete-se]
do sexo case ADP ADP [] [sexo, trabalhadores, compromete-se]
sexo trabalhadores nmod NOUN NOUN [do, feminino] [trabalhadores, compromete-se]
feminino sexo amod ADJ ADJ [] [sexo, trabalhadores, compromete-se]
, compromete-se punct PUNCT PUNCT [] [compromete-se]
a empresa det DET DET [] [empresa, compromete-se]
empresa compromete-se nsubj NOUN NOUN [a] [compromete-se]
compromete-se compromete-se ROOT VERB VERB [trabalhadores, ,, empresa, cumprir, .] []
a cumprir mark SCONJ SCONJ [] [cumprir, compromete-se]
cumprir compromete-se xcomp VERB VERB [a, disposto] [compromete-se]
o disposto det DET DET [] [disposto, cumprir, compromete-se]
disposto cumprir obj NOUN NOUN [o, Artigo] 

In [121]:
sentence = "Os trabalhadores menores reger-se-ão pelo Artigo 413, Item I da CLT, comprometendo-se a empresa a cumprir o disposto no Capítulo IV."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'trabalhadores', 'slem': 'trabalhador', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': 'se', 'verb': 'reger-se-ão', 'vlem': 'reger', 'passive': 1, 'md': 1}
Os trabalhadores det DET DET [] [trabalhadores, reger-se-ão]
trabalhadores reger-se-ão nsubj NOUN NOUN [Os, menores] [reger-se-ão]
menores trabalhadores amod ADJ ADJ [] [trabalhadores, reger-se-ão]
reger-se-ão reger-se-ão ROOT VERB VERB [trabalhadores, Artigo, comprometendo-se, .] []
pelo Artigo case ADP ADP [] [Artigo, reger-se-ão]
Artigo reger-se-ão obl PROPN PROPN [pelo, 413, Item] [reger-se-ão]
413 Artigo nummod NUM NUM [] [Artigo, reger-se-ão]
, Item punct PUNCT PUNCT [] [Item, Artigo, reger-se-ão]
Item Artigo appos PROPN PROPN [,, I, CLT, ,] [Artigo, reger-se-ão]
I Item flat:name PROPN PROPN [] [Item, Artigo, reger-se-ão]
da CLT case ADP ADP [] [CLT, Item, Artigo, reger-se-ão]
CLT Item nmod PROPN PROPN [da] [Item, Artigo, reger-se-ão]
, Item punct PUNCT PUNCT [] [Item, Artigo, reger-se-ão]
compro

In [122]:
sentence = "Os empregados não ficam subordinados às condições e horários constantes dos Anexos I a X."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': 'ficam', 'hlem': 'ficar', 'verb': 'subordinados', 'vlem': 'subordinado', 'passive': 1, 'md': 0}
Os empregados det DET DET [] [empregados, ficam]
empregados ficam nsubj NOUN NOUN [Os] [ficam]
não ficam advmod ADV ADV [] [ficam]
ficam ficam ROOT VERB VERB [empregados, não, subordinados, X.] []
subordinados ficam xcomp VERB VERB [condições, horários] [ficam]
às condições case ADP ADP [] [condições, subordinados, ficam]
condições subordinados obl NOUN NOUN [às] [subordinados, ficam]
e horários cc CCONJ CCONJ [] [horários, subordinados, ficam]
horários subordinados conj NOUN NOUN [e, constantes] [subordinados, ficam]
constantes horários amod ADJ ADJ [Anexos] [horários, subordinados, ficam]
dos Anexos case ADP ADP [] [Anexos, constantes, horários, subordinados, ficam]
Anexos constantes nmod PROPN PROPN [dos, I] [constantes, horários, subordinados, ficam]
I Anexos flat:name PROPN PROPN [] [An

In [123]:
sentence = "Fica estabelecido que o pagamento do adicional de periculosidade aos empregados da empresa relacionada acima será devido de forma proporcional."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'pagamento', 'slem': 'pagamento', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1}
Fica estabelecido aux VERB VERB [] [estabelecido]
estabelecido estabelecido ROOT VERB VERB [Fica, devido, .] []
que devido mark SCONJ SCONJ [] [devido, estabelecido]
o pagamento det DET DET [] [pagamento, devido, estabelecido]
pagamento devido nsubj NOUN NOUN [o, adicional] [devido, estabelecido]
do adicional case ADP ADP [] [adicional, pagamento, devido, estabelecido]
adicional pagamento nmod NOUN NOUN [do, periculosidade] [pagamento, devido, estabelecido]
de periculosidade case ADP ADP [] [periculosidade, adicional, pagamento, devido, estabelecido]
periculosidade adicional nmod NOUN NOUN [de, empregados] [adicional, pagamento, devido, estabelecido]
aos empregados case ADP ADP [] [empregados, periculosidade, adicional, pagamento, devido, estabelecido]
empregados periculosidade nmod NOUN NOUN [aos, empresa] [periculosi

In [124]:
sentence = "A Conab estenderá a função de encarregados de depósito para as unidades operacionais que comprovadamente necessitem de tal função para melhorar o desempenho de suas atividades."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'Conab', 'slem': 'conab', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'estenderá', 'vlem': 'estender', 'passive': 0, 'md': 1}
A Conab det DET DET [] [Conab, estenderá]
Conab estenderá nsubj PROPN PROPN [A] [estenderá]
estenderá estenderá ROOT VERB VERB [Conab, função, .] []
a função det DET DET [] [função, estenderá]
função estenderá obj NOUN NOUN [a, encarregados, unidades] [estenderá]
de encarregados case ADP ADP [] [encarregados, função, estenderá]
encarregados função nmod VERB VERB [de, depósito] [função, estenderá]
de depósito case ADP ADP [] [depósito, encarregados, função, estenderá]
depósito encarregados nmod NOUN NOUN [de] [encarregados, função, estenderá]
para unidades case ADP ADP [] [unidades, função, estenderá]
as unidades det DET DET [] [unidades, função, estenderá]
unidades função nmod NOUN NOUN [para, as, operacionais, necessitem] [função, estenderá]
operacionais unidades amod ADJ ADJ [] [unidades, função, estenderá]
que nec

In [125]:
sentence = "Se efetivado na empresa, após a conclusão do aprendizado e inexistindo vaga na função para a qual recebeu treinamento, o mesmo poderá ser aproveitado em função compatível, percebendo o menor salário dessa função."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'mesmo', 'slem': 'mesmo', 'neg': '', 'modal': 'poderá', 'mlem': 'poder', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'aproveitado', 'vlem': 'aproveitar', 'passive': 1, 'md': 1}
Se efetivado mark SCONJ SCONJ [] [efetivado, aproveitado, poderá]
efetivado aproveitado advcl VERB VERB [Se, empresa, ,, conclusão, inexistindo] [aproveitado, poderá]
na empresa case ADP ADP [] [empresa, efetivado, aproveitado, poderá]
empresa efetivado obl NOUN NOUN [na] [efetivado, aproveitado, poderá]
, efetivado punct PUNCT PUNCT [] [efetivado, aproveitado, poderá]
após conclusão case ADP ADP [] [conclusão, efetivado, aproveitado, poderá]
a conclusão det DET DET [] [conclusão, efetivado, aproveitado, poderá]
conclusão efetivado obl NOUN NOUN [após, a, aprendizado] [efetivado, aproveitado, poderá]
do aprendizado case ADP ADP [] [aprendizado, conclusão, efetivado, aproveitado, poderá]
aprendizado conclusão nmod NOUN NOUN [do] [conclusão, efetivado, aproveitado, poderá]
e inexistindo cc CCONJ CCON

In [126]:
sentence = "Este benefício também será devido aos empregados do sexo masculino, que detenham a posse e guarda legal dos filhos e desde que vivam separados da mãe, o que deverá ser comprovado quando do requerimento do benefício, através de documentação legal."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'benefício', 'slem': 'benefício', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'será', 'vlem': 'ser', 'passive': 0, 'md': 1}
Este benefício det DET DET [] [benefício, devido]
benefício devido nsubj NOUN NOUN [Este] [devido]
também devido advmod ADV ADV [] [devido]
será devido cop AUX AUX [] [devido]
devido devido ROOT ADV ADV [benefício, também, será, empregados, .] []
aos empregados case ADP ADP [] [empregados, devido]
empregados devido obl NOUN NOUN [aos, sexo, detenham] [devido]
do sexo case ADP ADP [] [sexo, empregados, devido]
sexo empregados nmod NOUN NOUN [do, masculino] [empregados, devido]
masculino sexo amod ADJ ADJ [] [sexo, empregados, devido]
, detenham punct PUNCT PUNCT [] [detenham, empregados, devido]
que detenham nsubj PRON PRON [] [detenham, empregados, devido]
detenham empregados acl:relcl VERB VERB [,, que, posse, guarda, vivam] [empregados, devido]
a posse det DET DET [] [posse, detenham, empregados, devido]
posse detenh

In [127]:
sentence = "Com a finalidade de permitir a realização do pagamento dos salários dentro dos prazos legais, ou mesmo antes, quando for o caso, a empresa poderá efetuar o fechamento do cartão de ponto antes do final do mês."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': 'poderá', 'mlem': 'poder', 'helping_verb': '', 'hlem': '', 'verb': 'efetuar', 'vlem': 'efetuar', 'passive': 0, 'md': 1}
Com finalidade case ADP ADP [] [finalidade]
a finalidade det DET DET [] [finalidade]
finalidade finalidade ROOT NOUN NOUN [Com, a, permitir, poderá, .] []
de permitir mark SCONJ SCONJ [] [permitir, finalidade]
permitir finalidade acl VERB VERB [de, realização] [finalidade]
a realização det DET DET [] [realização, permitir, finalidade]
realização permitir obj NOUN NOUN [a, pagamento, dentro] [permitir, finalidade]
do pagamento case ADP ADP [] [pagamento, realização, permitir, finalidade]
pagamento realização nmod NOUN NOUN [do, salários] [realização, permitir, finalidade]
dos salários case ADP ADP [] [salários, pagamento, realização, permitir, finalidade]
salários pagamento nmod NOUN NOUN [dos] [pagamento, realização, permitir, finalidade]
dentro realização advmod ADV ADV [prazos] [realização, permitir, fina

In [128]:
sentence = "As horas não trabalhadas serão lançadas no Banco de Horas como débito."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'horas', 'slem': 'hora', 'neg': 'não', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'trabalhadas', 'vlem': 'trabalhar', 'passive': 1, 'md': 0}
{'subject': 'trabalhadas', 'slem': 'trabalhar', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'serão', 'hlem': 'ser', 'verb': 'lançadas', 'vlem': 'lançar', 'passive': 1, 'md': 1}
As horas det DET DET [] [horas, trabalhadas, lançadas]
horas trabalhadas nsubj:pass NOUN NOUN [As] [trabalhadas, lançadas]
não trabalhadas advmod ADV ADV [] [trabalhadas, lançadas]
trabalhadas lançadas nsubj:pass ADJ ADJ [horas, não] [lançadas]
serão lançadas aux:pass AUX AUX [] [lançadas]
lançadas lançadas ROOT VERB VERB [trabalhadas, serão, Banco, débito, .] []
no Banco case ADP ADP [] [Banco, lançadas]
Banco lançadas obl PROPN PROPN [no, Horas] [lançadas]
de Horas case ADP ADP [] [Horas, Banco, lançadas]
Horas Banco nmod PROPN PROPN [de] [Banco, lançadas]
como débito case ADP ADP [] [débito, lançadas]
débito lançadas obl NOUN N

In [129]:
sentence = "Os atestados médicos somente serão aceitos se emitidos por médico do trabalho contratado pela Empresa."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'médicos', 'slem': 'médico', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'serão', 'vlem': 'ser', 'passive': 1, 'md': 1}
Os médicos det DET DET [] [médicos, aceitos]
atestados médicos amod ADJ ADJ [] [médicos, aceitos]
médicos aceitos nsubj:pass NOUN NOUN [Os, atestados] [aceitos]
somente aceitos advmod ADV ADV [] [aceitos]
serão aceitos cop AUX AUX [] [aceitos]
aceitos aceitos ROOT NOUN NOUN [médicos, somente, serão, emitidos, .] []
se emitidos expl SCONJ SCONJ [] [emitidos, aceitos]
emitidos aceitos xcomp VERB VERB [se, médico] [aceitos]
por médico case ADP ADP [] [médico, emitidos, aceitos]
médico emitidos obl NOUN NOUN [por, trabalho] [emitidos, aceitos]
do trabalho case ADP ADP [] [trabalho, médico, emitidos, aceitos]
trabalho médico nmod NOUN NOUN [do, contratado] [médico, emitidos, aceitos]
contratado trabalho acl VERB VERB [Empresa] [trabalho, médico, emitidos, aceitos]
pela Empresa case ADP ADP [] [Empresa, contratado, trabalho, méd

In [130]:
sentence = "O pagamento, caso seja devido, será realizado na mesma data que os demais empregados ativos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'pagamento', 'slem': 'pagamento', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'será', 'hlem': 'ser', 'verb': 'realizado', 'vlem': 'realizar', 'passive': 1, 'md': 1}
O pagamento det DET DET [] [pagamento, realizado]
pagamento realizado nsubj:pass NOUN NOUN [O, ,] [realizado]
, pagamento punct PUNCT PUNCT [] [pagamento, realizado]
caso seja mark SCONJ SCONJ [] [seja, realizado]
seja realizado aux:pass AUX AUX [caso] [realizado]
devido realizado advmod ADV ADV [,] [realizado]
, devido punct PUNCT PUNCT [] [devido, realizado]
será realizado aux:pass AUX AUX [] [realizado]
realizado realizado ROOT VERB VERB [pagamento, seja, devido, será, data, empregados, .] []
na data case ADP ADP [] [data, realizado]
mesma data amod ADJ ADJ [] [data, realizado]
data realizado obl NOUN NOUN [na, mesma] [realizado]
que empregados mark SCONJ SCONJ [] [empregados, realizado]
os empregados det DET DET [] [empregados, realizado]
demais empregados det DET DET [] [empregados, realizado]
emp

In [131]:
sentence = "Ficará acordado que tanto as mulheres quantos os homens trabalharão no máximo 2 e na hipótese de trabalharem 2 domingos no mês, os mesmos terão que ser alternados e não consecutivos."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'mulheres', 'slem': 'mulher', 'neg': '', 'modal': 'terão que', 'mlem': 'ter que', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'alternados', 'vlem': 'alternar', 'passive': 1, 'md': 1}
{'subject': 'homens', 'slem': 'homem', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'trabalharão', 'vlem': 'trabalhar', 'passive': 0, 'md': 1}
{'subject': 'mesmos', 'slem': 'mesmo', 'neg': '', 'modal': 'terão que', 'mlem': 'ter que', 'helping_verb': 'ser', 'hlem': 'ser', 'verb': 'alternados', 'vlem': 'alternar', 'passive': 1, 'md': 1}
Ficará acordado aux AUX AUX [] [acordado]
acordado acordado ROOT VERB VERB [Ficará, alternados, .] []
que alternados mark SCONJ SCONJ [] [alternados, acordado]
tanto mulheres advmod ADV ADV [] [mulheres, alternados, acordado]
as mulheres det DET DET [] [mulheres, alternados, acordado]
mulheres alternados nsubj NOUN NOUN [tanto, as, trabalharão] [alternados, acordado]
quantos trabalharão obj PRON PRON [] [trabalharão, mulheres, al

In [132]:
sentence = "Durante o período de safra, aos empregados, CATADORES DE CANA, seja qual for o critério da respectiva remuneração, será assegurado, como mínima, o valor da diária estipulada conforme os critérios da cláusula terceira com o adicional de 20."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'critério', 'slem': 'critério', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'seja', 'vlem': 'ser', 'passive': 0, 'md': 0}
{'subject': 'valor', 'slem': 'valor', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'será', 'hlem': 'ser', 'verb': 'assegurado', 'vlem': 'assegurar', 'passive': 1, 'md': 1}
Durante período case ADP ADP [] [período, assegurado]
o período det DET DET [] [período, assegurado]
período assegurado obl NOUN NOUN [Durante, o, safra, ,, empregados, qual] [assegurado]
de safra case ADP ADP [] [safra, período, assegurado]
safra período nmod NOUN NOUN [de] [período, assegurado]
, período punct PUNCT PUNCT [] [período, assegurado]
aos empregados case ADP ADP [] [empregados, período, assegurado]
empregados período nmod NOUN NOUN [aos, CATADORES] [período, assegurado]
, CATADORES punct PUNCT PUNCT [] [CATADORES, empregados, período, assegurado]
CATADORES empregados conj NOUN NOUN [,, DE, CANA, ,] [empregados, período, assegurado]

In [133]:
sentence = "Os empregados irão participar dos custos da assistência médica conforme tabela abaixo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregados', 'slem': 'empregado', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'irão', 'hlem': 'ir', 'verb': 'participar', 'vlem': 'participar', 'passive': 0, 'md': 1}
Os empregados det DET DET [] [empregados, participar]
empregados participar nsubj NOUN NOUN [Os] [participar]
irão participar aux AUX AUX [] [participar]
participar participar ROOT VERB VERB [empregados, irão, custos, .] []
dos custos case ADP ADP [] [custos, participar]
custos participar obj NOUN NOUN [dos, assistência] [participar]
da assistência case ADP ADP [] [assistência, custos, participar]
assistência custos nmod NOUN NOUN [da, médica, tabela] [custos, participar]
médica assistência amod ADJ ADJ [] [assistência, custos, participar]
conforme tabela case ADP ADP [] [tabela, assistência, custos, participar]
tabela assistência nmod NOUN NOUN [conforme, abaixo] [assistência, custos, participar]
abaixo tabela advmod ADV ADV [] [tabela, assistência, custos, participar]
. participar punct PUNCT PUNC

In [134]:
sentence = "Quando houver prestação de horas extras, após excedidos 45 minutos, o empregador fornecerá lanche ao empregado; havendo impossibilidade ou desinteresse, pagará ao empregado o equivalente a 3 do piso salarial."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'minutos', 'slem': 'minuto', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'excedidos', 'vlem': 'excedir', 'passive': 1, 'md': 0}
{'subject': 'empregador', 'slem': 'empregador', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'fornecerá', 'vlem': 'fornecer', 'passive': 0, 'md': 1}
Quando houver mark SCONJ SCONJ [] [houver, fornecerá, lanche]
houver fornecerá advcl VERB VERB [Quando, prestação, ,] [fornecerá, lanche]
prestação houver obj NOUN NOUN [horas] [houver, fornecerá, lanche]
de horas case ADP ADP [] [horas, prestação, houver, fornecerá, lanche]
horas prestação nmod NOUN NOUN [de, extras] [prestação, houver, fornecerá, lanche]
extras horas amod ADJ ADJ [] [horas, prestação, houver, fornecerá, lanche]
, houver punct PUNCT PUNCT [] [houver, fornecerá, lanche]
após excedidos case ADP ADP [] [excedidos, fornecerá, lanche]
excedidos fornecerá obl VERB VERB [após, minutos, ,] [fornecerá, lanche]
45 minutos nummod N

In [135]:
sentence = "A empresa terá que fazer os descontos dos convênios firmados com o SINTRACOMRRE/PA, em folha de pagamento aprovado em assembléia geral, e repassará para o mesmo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': 'terá que', 'mlem': 'ter que', 'helping_verb': '', 'hlem': '', 'verb': 'fazer', 'vlem': 'fazer', 'passive': 0, 'md': 1}
A empresa det DET DET [] [empresa, fazer]
empresa fazer nsubj NOUN NOUN [A] [fazer]
terá fazer aux AUX AUX [] [fazer]
que fazer mark SCONJ SCONJ [] [fazer]
fazer fazer ROOT VERB VERB [empresa, terá, que, descontos, repassará, .] []
os descontos det DET DET [] [descontos, fazer]
descontos fazer obj NOUN NOUN [os, convênios] [fazer]
dos convênios case ADP ADP [] [convênios, descontos, fazer]
convênios descontos nmod NOUN NOUN [dos, firmados] [descontos, fazer]
firmados convênios acl VERB VERB [SINTRACOMRRE] [convênios, descontos, fazer]
com SINTRACOMRRE case ADP ADP [] [SINTRACOMRRE, firmados, convênios, descontos, fazer]
o SINTRACOMRRE det DET DET [] [SINTRACOMRRE, firmados, convênios, descontos, fazer]
SINTRACOMRRE firmados obl PROPN PROPN [com, o, PA, folha] [firmados, convênios, descontos, fazer]
/ PA pun

In [136]:
sentence = "A motociclista gestante afastada em licença maternidade terá garantida a manutenção no emprego pelo prazo de 60 dias a contar do término da licença maternidade, ressalvado o caso de demissão por justa causa, mediante a abertura do inquérito para a apuração da falta grave ou a pedido."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'motociclista', 'slem': 'motociclista', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': 'terá', 'hlem': 'ter', 'verb': 'garantida', 'vlem': 'garantido', 'passive': 0, 'md': 1}
A motociclista det DET DET [] [motociclista, garantida]
motociclista garantida nsubj NOUN NOUN [A, afastada, maternidade] [garantida]
gestante afastada advmod ADV ADV [] [afastada, motociclista, garantida]
afastada motociclista acl VERB VERB [gestante, licença] [motociclista, garantida]
em licença case ADP ADP [] [licença, afastada, motociclista, garantida]
licença afastada obl NOUN NOUN [em] [afastada, motociclista, garantida]
maternidade motociclista conj NOUN NOUN [] [motociclista, garantida]
terá garantida aux AUX AUX [] [garantida]
garantida garantida ROOT VERB VERB [motociclista, terá, manutenção, prazo, contar, .] []
a manutenção det DET DET [] [manutenção, garantida]
manutenção garantida obj NOUN NOUN [a, emprego] [garantida]
no emprego case ADP ADP [] [emprego, manutenção, garantida]
em

In [137]:
sentence = "A empresa poderá a critério próprio, não descontar atraso superior a 15 minutos semanais, desde que o atraso seja justificado e não seja o empregado contumaz."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empresa', 'slem': 'empresa', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'poderá', 'vlem': 'poder', 'passive': 0, 'md': 1}
{'subject': 'atraso', 'slem': 'atraso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': 'seja', 'hlem': 'ser', 'verb': 'justificado', 'vlem': 'justificar', 'passive': 1, 'md': 0}
A empresa det DET DET [] [empresa, poderá]
empresa poderá nsubj NOUN NOUN [A] [poderá]
poderá poderá ROOT VERB VERB [empresa, critério, descontar, .] []
a critério case ADP ADP [] [critério, poderá]
critério poderá obj NOUN NOUN [a, próprio] [poderá]
próprio critério amod ADJ ADJ [] [critério, poderá]
, descontar punct PUNCT PUNCT [] [descontar, poderá]
não descontar advmod ADV ADV [] [descontar, poderá]
descontar poderá advcl VERB VERB [,, não, atraso, ,, justificado] [poderá]
atraso descontar obj NOUN NOUN [superior] [descontar, poderá]
superior atraso amod ADJ ADJ [minutos] [atraso, descontar, poderá]
a minutos case ADP ADP [] [minutos,

In [138]:
sentence = "Qualquer dúvida ou divergência na aplicação do presente acordo deverá as partes obrigatoriamente travar negociação, na busca de conciliação, para somente após, caso não ocorra entendimento, ingressar em juízo."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'dúvida', 'slem': 'dúvida', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'deverá', 'vlem': 'dever', 'passive': 0, 'md': 1}
Qualquer dúvida det DET DET [] [dúvida, deverá]
dúvida deverá nsubj NOUN NOUN [Qualquer, divergência, aplicação] [deverá]
ou divergência cc CCONJ CCONJ [] [divergência, dúvida, deverá]
divergência dúvida conj VERB VERB [ou] [dúvida, deverá]
na aplicação case ADP ADP [] [aplicação, dúvida, deverá]
aplicação dúvida nmod NOUN NOUN [na, acordo] [dúvida, deverá]
do acordo case ADP ADP [] [acordo, aplicação, dúvida, deverá]
presente acordo amod ADJ ADJ [] [acordo, aplicação, dúvida, deverá]
acordo aplicação nmod NOUN NOUN [do, presente] [aplicação, dúvida, deverá]
deverá deverá ROOT VERB VERB [dúvida, partes, .] []
as partes det DET DET [] [partes, deverá]
partes deverá obj NOUN NOUN [as, travar] [deverá]
obrigatoriamente travar advmod ADV ADV [] [travar, partes, deverá]
travar partes acl VERB VERB [obrigatoriamente, negociaçã

In [139]:
sentence = "Se rescindido o contrato de trabalho, a empregada deverá, se for o caso, avisar o empregador do seu estado de gestação, devendo comprová-lo dentro do prazo de 60 dias a partir da notificação da dispensa."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregada', 'slem': 'empregada', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'deverá', 'vlem': 'dever', 'passive': 0, 'md': 1}
{'subject': 'caso', 'slem': 'caso', 'neg': '', 'modal': '', 'mlem': '', 'helping_verb': '', 'hlem': '', 'verb': 'for', 'vlem': 'ir', 'passive': 0, 'md': 0}
Se rescindido mark SCONJ SCONJ [] [rescindido, deverá]
rescindido deverá advcl VERB VERB [Se, contrato, ,] [deverá]
o contrato det DET DET [] [contrato, rescindido, deverá]
contrato rescindido obj NOUN NOUN [o, trabalho] [rescindido, deverá]
de trabalho case ADP ADP [] [trabalho, contrato, rescindido, deverá]
trabalho contrato nmod NOUN NOUN [de] [contrato, rescindido, deverá]
, rescindido punct PUNCT PUNCT [] [rescindido, deverá]
a empregada det DET DET [] [empregada, deverá]
empregada deverá nsubj NOUN NOUN [a] [deverá]
deverá deverá ROOT VERB VERB [rescindido, empregada, for, .] []
, for punct PUNCT PUNCT [] [for, deverá]
se for mark SCONJ SCONJ [] [for, deve

In [140]:
sentence = "No caso de indenização, o empregado fará jus a 1/12 avos a mais nas verbas rescisórias."
doc = nlp(sentence)

sent_statements = parse_by_subject(doc, nlp)
for data in sent_statements:
    print(data)

for token in doc:
    print(token.text, token.head, token.dep_, token.tag_, token.pos_, \
          [children for children in token.children], [ancestors for ancestors in token.ancestors])

{'subject': 'empregado', 'slem': 'empregado', 'neg': '', 'modal': '', 'mlem': 'ir', 'helping_verb': '', 'hlem': '', 'verb': 'fará', 'vlem': 'fazer', 'passive': 0, 'md': 1}
No caso case ADP ADP [] [caso, fará]
caso fará obl NOUN NOUN [No, indenização, ,] [fará]
de indenização case ADP ADP [] [indenização, caso, fará]
indenização caso nmod NOUN NOUN [de] [caso, fará]
, caso punct PUNCT PUNCT [] [caso, fará]
o empregado det DET DET [] [empregado, fará]
empregado fará nsubj NOUN NOUN [o] [fará]
fará fará ROOT VERB VERB [caso, empregado, jus, 1/12, verbas, .] []
jus fará obj NOUN NOUN [] [fará]
a 1/12 case ADP ADP [] [1/12, fará]
1/12 fará obl PROPN PROPN [a, avos, mais] [fará]
avos 1/12 amod ADJ ADJ [] [1/12, fará]
a mais case ADP ADP [] [mais, 1/12, fará]
mais 1/12 advmod ADV ADV [a] [1/12, fará]
nas verbas case ADP ADP [] [verbas, fará]
verbas fará obl NOUN NOUN [nas, rescisórias] [fará]
rescisórias verbas amod ADJ ADJ [] [verbas, fará]
. fará punct PUNCT PUNCT [] [fará]


In [141]:
text = "empregado, empregados, empregada, empregadas, empregador, empregadores, empregadora, empregadoras"
doc = nlp(text)

lemmas = [token.lemma_ for token in doc if not token.is_punct]
print(lemmas)

['empregar', 'empregado', 'empregar', 'empregar', 'empregador', 'empregador', 'empregadora', 'empregadora']
