In [1]:
from tqdm import tqdm
import networkx as nx
from copy import deepcopy as cp
import io
import os

In [37]:
from natasha import (
    Segmenter,
    MorphVocab,
    
    NewsEmbedding,
    NewsMorphTagger,
    NewsSyntaxParser,
    NewsNERTagger,
    
    PER,
    NamesExtractor,

    Doc
)

segmenter = Segmenter()
morph_vocab = MorphVocab()

emb = NewsEmbedding()
morph_tagger = NewsMorphTagger(emb)
syntax_parser = NewsSyntaxParser(emb)
ner_tagger = NewsNERTagger(emb)

names_extractor = NamesExtractor(morph_vocab)

text = 'Разрабатываемая система обеспечивает к примеру решение задач формирования системы образовательных услуг региона округа района т е задач требующих при решении географической привязки к местности.'
doc = Doc(text)
doc.segment(segmenter)

doc.tag_morph(morph_tagger)
doc.parse_syntax(syntax_parser)
for token in doc.tokens:
#     print(token)
     print(f"{token.pos} \t {token.rel} \t\t\t {token.text} \t\t\t {doc.tokens[int(token.head_id[2:]) -1].text}")


ADJ 	 amod 			 Разрабатываемая 			 система
NOUN 	 nsubj 			 система 			 обеспечивает
VERB 	 root 			 обеспечивает 			 .
ADP 	 case 			 к 			 примеру
NOUN 	 obl 			 примеру 			 обеспечивает
NOUN 	 obj 			 решение 			 обеспечивает
NOUN 	 nmod 			 задач 			 решение
NOUN 	 nmod 			 формирования 			 задач
NOUN 	 nmod 			 системы 			 формирования
ADJ 	 amod 			 образовательных 			 услуг
NOUN 	 nmod 			 услуг 			 системы
NOUN 	 nmod 			 региона 			 системы
NOUN 	 nmod 			 округа 			 системы
NOUN 	 nmod 			 района 			 системы
ADP 	 appos 			 т 			 системы
X 	 fixed 			 е 			 т
NOUN 	 nmod 			 задач 			 решение
VERB 	 nmod 			 требующих 			 формирования
ADP 	 case 			 при 			 решении
NOUN 	 obl 			 решении 			 обеспечивает
ADJ 	 amod 			 географической 			 привязки
NOUN 	 nmod 			 привязки 			 решении
ADP 	 case 			 к 			 местности
NOUN 	 nmod 			 местности 			 привязки
PUNCT 	 punct 			 . 			 обеспечивает


In [28]:
import spacy
nlp = spacy.load("ru_core_news_sm")
import ru_core_news_sm
nlp = ru_core_news_sm.load()
doc = nlp('Разрабатываемая система обеспечивает к примеру решение задач формирования системы образовательных услуг региона округа района т е задач требующих при решении географической привязки к местности.')
for token in doc:
    print(f"{token.pos_} \t {token.dep_} \t\t\t {token.lemma_} \t\t\t {token.head} ")
    

VERB 	 amod 			 разрабатывать 			 система 
NOUN 	 nsubj 			 система 			 обеспечивает 
VERB 	 ROOT 			 обеспечивать 			 обеспечивает 
ADP 	 case 			 к 			 примеру 
NOUN 	 obl 			 пример 			 обеспечивает 
NOUN 	 obj 			 решение 			 обеспечивает 
NOUN 	 nmod 			 задача 			 решение 
NOUN 	 nmod 			 формирование 			 задач 
NOUN 	 nmod 			 система 			 формирования 
ADJ 	 amod 			 образовательный 			 услуг 
NOUN 	 nmod 			 услуга 			 системы 
NOUN 	 nmod 			 регион 			 системы 
NOUN 	 nmod 			 округ 			 формирования 
NOUN 	 nmod 			 район 			 округа 
PROPN 	 appos 			 т 			 района 
NOUN 	 fixed 			 е 			 т 
NOUN 	 nmod 			 задача 			 формирования 
VERB 	 nmod 			 требовать 			 задач 
ADP 	 case 			 при 			 решении 
NOUN 	 obl 			 решение 			 требующих 
ADJ 	 amod 			 географический 			 привязки 
NOUN 	 nmod 			 привязка 			 решении 
ADP 	 case 			 к 			 местности 
NOUN 	 nmod 			 местность 			 привязки 
PUNCT 	 punct 			 . 			 обеспечивает 


In [2]:
import stanza
from nltk.tokenize import sent_tokenize
stanza_parser = stanza.Pipeline(lang='ru', processors='tokenize,pos,lemma,ner,depparse')

2024-08-12 13:39:16 INFO: Checking for updates to resources.json in case models have been updated.  Note: this behavior can be turned off with download_method=None or download_method=DownloadMethod.REUSE_RESOURCES
Widget Javascript not detected.  It may not be installed or enabled properly. Reconnecting the current kernel may help.





2024-08-12 13:39:20 INFO: Loading these models for language: ru (Russian):
| Processor | Package            |
----------------------------------
| tokenize  | syntagrus          |
| pos       | syntagrus_charlm   |
| lemma     | syntagrus_nocharlm |
| depparse  | syntagrus_charlm   |
| ner       | wikiner            |

2024-08-12 13:39:20 INFO: Using device: cpu
2024-08-12 13:39:20 INFO: Loading: tokenize
2024-08-12 13:39:21 INFO: Loading: pos
2024-08-12 13:39:22 INFO: Loading: lemma
2024-08-12 13:39:22 INFO: Loading: depparse
2024-08-12 13:39:23 INFO: Loading: ner
2024-08-12 13:39:29 INFO: Done loading processors!


In [35]:
doc = stanza_parser('\
    Разрабатываемая система обеспечивает к примеру решение задач формирования системы образовательных услуг региона округа района т е задач требующих при решении географической привязки к местности')
for token in doc.sentences[0].words:
    #print(token)
    print(f'{token.upos} \t {token.deprel} \t\t\t {token.lemma} \t\t\t {doc.sentences[0].words[int(token.head) - 1].text}')
    
    

VERB 	 amod 			 разрабатывать 			 система
NOUN 	 nsubj 			 система 			 обеспечивает
VERB 	 root 			 обеспечивать 			 местности
ADP 	 case 			 к 			 примеру
NOUN 	 obl 			 пример 			 обеспечивает
NOUN 	 obj 			 решение 			 обеспечивает
NOUN 	 nmod 			 задача 			 решение
NOUN 	 nmod 			 формирование 			 задач
NOUN 	 nmod 			 система 			 формирования
ADJ 	 amod 			 образовательный 			 услуг
NOUN 	 nmod 			 услуга 			 системы
NOUN 	 nmod 			 регион 			 услуг
NOUN 	 nmod 			 округ 			 региона
NOUN 	 nmod 			 район 			 округа
NOUN 	 nmod 			 тонна 			 района
CCONJ 	 case 			 е 			 задач
NOUN 	 nmod 			 задача 			 т
VERB 	 acl 			 требовать 			 т
ADP 	 case 			 при 			 решении
NOUN 	 obl 			 решение 			 требующих
ADJ 	 amod 			 географический 			 привязки
NOUN 	 nmod 			 привязка 			 решении
ADP 	 case 			 к 			 местности
NOUN 	 nmod 			 местность 			 привязки
