In [5]:
# Импортируем необходимые библиотеки
import spacy
from spacy import displacy

# Загружаем модель SpaCy
nlp = spacy.load("ru_core_news_sm")

# Пример текста
text = "Как же я сильно хочу закрыть все предметы, я так устал, надеюсь, с ММО будет не сложно, хотя находит апатия и уныние"


In [6]:
# Токенизация
doc = nlp(text)
tokens = [token.text for token in doc]
print("Токены:", tokens)

Токены: ['Как', 'же', 'я', 'сильно', 'хочу', 'закрыть', 'все', 'предметы', ',', 'я', 'так', 'устал', ',', 'надеюсь', ',', 'с', 'ММО', 'будет', 'не', 'сложно', ',', 'хотя', 'находит', 'апатия', 'и', 'уныние']


In [7]:
# Частеречная разметка
pos_tags = [(token.text, token.pos_) for token in doc]
print("Части речи:", pos_tags)

Части речи: [('Как', 'ADV'), ('же', 'PART'), ('я', 'PRON'), ('сильно', 'ADV'), ('хочу', 'VERB'), ('закрыть', 'VERB'), ('все', 'DET'), ('предметы', 'NOUN'), (',', 'PUNCT'), ('я', 'PRON'), ('так', 'ADV'), ('устал', 'VERB'), (',', 'PUNCT'), ('надеюсь', 'VERB'), (',', 'PUNCT'), ('с', 'ADP'), ('ММО', 'PROPN'), ('будет', 'AUX'), ('не', 'PART'), ('сложно', 'ADJ'), (',', 'PUNCT'), ('хотя', 'SCONJ'), ('находит', 'VERB'), ('апатия', 'NOUN'), ('и', 'CCONJ'), ('уныние', 'NOUN')]


In [8]:
# Лемматизация
lemmas = [(token.text, token.lemma_) for token in doc]
print("Леммы:", lemmas)

Леммы: [('Как', 'как'), ('же', 'же'), ('я', 'я'), ('сильно', 'сильно'), ('хочу', 'хотеть'), ('закрыть', 'закрыть'), ('все', 'весь'), ('предметы', 'предмет'), (',', ','), ('я', 'я'), ('так', 'так'), ('устал', 'устать'), (',', ','), ('надеюсь', 'надеяться'), (',', ','), ('с', 'с'), ('ММО', 'ммо'), ('будет', 'быть'), ('не', 'не'), ('сложно', 'сложный'), (',', ','), ('хотя', 'хотя'), ('находит', 'находить'), ('апатия', 'апатия'), ('и', 'и'), ('уныние', 'уныние')]


In [9]:
# Выделение именованных сущностей
entities = [(ent.text, ent.label_) for ent in doc.ents]
print("Именованные сущности:", entities)

Именованные сущности: [('ММО', 'ORG')]


In [10]:
# Разбор предложения (синтаксический анализ)
for token in doc:
    print(f'{token.text:{12}} {token.dep_:{10}} {token.head.text:{12}}')

Как          advmod     хочу        
же           advmod     Как         
я            nsubj      хочу        
сильно       advmod     хочу        
хочу         csubj      сложно      
закрыть      xcomp      хочу        
все          det        предметы    
предметы     obj        закрыть     
,            punct      устал       
я            nsubj      устал       
так          advmod     устал       
устал        conj       хочу        
,            punct      надеюсь     
надеюсь      parataxis  сложно      
,            punct      надеюсь     
с            case       ММО         
ММО          obl        сложно      
будет        cop        сложно      
не           advmod     сложно      
сложно       ROOT       сложно      
,            punct      находит     
хотя         mark       находит     
находит      advcl      сложно      
апатия       obj        находит     
и            cc         уныние      
уныние       conj       сложно      


In [11]:
# Визуализация синтаксического дерева и именованных сущностей
displacy.render(doc, style="dep")
displacy.render(doc, style="ent")