In [1]:
!pip install spacy
!python -m spacy download ru_core_news_sm


Collecting ru-core-news-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/ru_core_news_sm-3.8.0/ru_core_news_sm-3.8.0-py3-none-any.whl (15.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m15.3/15.3 MB[0m [31m56.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting pymorphy3>=1.0.0 (from ru-core-news-sm==3.8.0)
  Downloading pymorphy3-2.0.6-py3-none-any.whl.metadata (2.4 kB)
Collecting dawg2-python>=0.8.0 (from pymorphy3>=1.0.0->ru-core-news-sm==3.8.0)
  Downloading dawg2_python-0.9.0-py3-none-any.whl.metadata (7.5 kB)
Collecting pymorphy3-dicts-ru (from pymorphy3>=1.0.0->ru-core-news-sm==3.8.0)
  Downloading pymorphy3_dicts_ru-2.4.417150.4580142-py2.py3-none-any.whl.metadata (2.0 kB)
Downloading pymorphy3-2.0.6-py3-none-any.whl (53 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m53.9/53.9 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading dawg2_python-0.9.0-py3-none-any.whl (9.3 kB)
Downloading pymorphy3

In [2]:
import spacy
nlp = spacy.load("ru_core_news_sm")


In [3]:
text = """
Одиссея -  классическая поэма, приписываемая древнегреческому поэту Гомеру.
Рассказывает о приключениях мифического героя по имени Одиссей во время его возвращения на родину по окончании Троянской войны, а также о приключениях его жены Пенелопы, ожидавшей Одиссея на Итаке.
"""

In [4]:
doc = nlp(text)


In [5]:
# Морфологический анализ (части речи и грамматические признаки)
for token in doc:
    if not token.is_punct and not token.is_space:
        print(f"""
Слово: {token.text}
Лемма: {token.lemma_}
Часть речи: {token.pos_}
Подробный тег: {token.tag_}
Грамматические признаки: {token.morph}
""")



Слово: Одиссея
Лемма: одиссея
Часть речи: PROPN
Подробный тег: PROPN
Грамматические признаки: Animacy=Inan|Case=Nom|Gender=Fem|Number=Sing


Слово: классическая
Лемма: классический
Часть речи: ADJ
Подробный тег: ADJ
Грамматические признаки: Case=Nom|Degree=Pos|Gender=Fem|Number=Sing


Слово: поэма
Лемма: поэма
Часть речи: NOUN
Подробный тег: NOUN
Грамматические признаки: Animacy=Inan|Case=Nom|Gender=Fem|Number=Sing


Слово: приписываемая
Лемма: приписывать
Часть речи: VERB
Подробный тег: VERB
Грамматические признаки: Aspect=Imp|Case=Nom|Gender=Fem|Number=Sing|Tense=Pres|VerbForm=Part|Voice=Pass


Слово: древнегреческому
Лемма: древнегреческий
Часть речи: ADJ
Подробный тег: ADJ
Грамматические признаки: Case=Dat|Degree=Pos|Gender=Masc|Number=Sing


Слово: поэту
Лемма: поэт
Часть речи: NOUN
Подробный тег: NOUN
Грамматические признаки: Animacy=Anim|Case=Dat|Gender=Masc|Number=Sing


Слово: Гомеру
Лемма: гомеру
Часть речи: PROPN
Подробный тег: PROPN
Грамматические признаки: Animacy=Anim|Ca

In [6]:
# Синтаксический разбор (связи между словами)
for token in doc:
    if not token.is_punct:
        print(f"{token.text:15} → {token.dep_:10} → {token.head.text}")



               → dep        → Одиссея
Одиссея         → amod       → поэма
                → dep        → -
классическая    → amod       → поэма
поэма           → ROOT       → поэма
приписываемая   → acl        → поэма
древнегреческому → amod       → поэту
поэту           → iobj       → приписываемая
Гомеру          → appos      → поэту

               → dep        → .
Рассказывает    → ROOT       → Рассказывает
о               → case       → приключениях
приключениях    → obl        → Рассказывает
мифического     → amod       → героя
героя           → nmod       → приключениях
по              → case       → имени
имени           → nmod       → героя
Одиссей         → appos      → имени
во              → case       → возвращения
время           → fixed      → во
его             → det        → возвращения
возвращения     → nmod       → приключениях
на              → case       → родину
родину          → nmod       → возвращения
по              → case       → окончании
окончании       →

In [8]:
# Визуализация синтаксического дерева
from spacy import displacy

displacy.render(doc, style="dep", jupyter=True)
