In [1]:
import spacy
from spacy.lang.en.examples import sentences 
from spacy import displacy
# Загрузка английской NLP-модели
    # загружает конвейер, используя имя установленного пакета, строковый путь или объект типа Path.
    # spaCy попытается разрешить аргумент загрузки в следующием порядке: 
    # 1. Если конвейер загружается из строкового имени, spaCy предположит, что это пакет Python, 
    # импортирует его и вызовет собственный метод load () пакета. 
    # 2. Если конвейер загружается из пути, spaCy предположит, что это каталог данных, загрузит его config.cfg 
    # и будет использовать информацию о языке и конвейере для создания класса Language. 
    # Данные будут загружены через Language.from_disk.

############ 6 ####################################################

############################################################################
############ Русский #######################################################
############################################################################
import spacy
from spacy.lang.en.examples import sentences 
# Загрузка русской NLP-модели
nlp = spacy.load("ru_core_news_sm")

# Текст для анализа
text = "Таким образом, курс на социально-ориентированный национальный проект играет важную роль в формировании форм воздействия."

# Парсинг текста с помощью spaCy. Эта команда запускает целый конвейер
doc = nlp(text)

print(doc.text)

Таким образом, курс на социально-ориентированный национальный проект играет важную роль в формировании форм воздействия.


In [2]:
for token in doc:
    print("{:<15} {:<15} {:<10} {:<10}".format(
              token.text,   # текст 
              token.lemma_, # базовая форма слова
              token.pos_,   # какая часть речи
              token.is_stop # является ли стоп-словом
             )
         )
print()

Таким           такой           DET        1         
образом         образ           NOUN       0         
,               ,               PUNCT      0         
курс            курс            NOUN       0         
на              на              ADP        1         
социально       социальный      ADJ        0         
-               -               ADJ        0         
ориентированный ориентированный ADJ        0         
национальный    национальный    ADJ        0         
проект          проект          NOUN       0         
играет          играть          VERB       0         
важную          важный          ADJ        0         
роль            роль            NOUN       0         
в               в               ADP        1         
формировании    формирование    NOUN       0         
форм            форма           NOUN       0         
воздействия     воздействие     NOUN       0         
.               .               PUNCT      0         



In [3]:
print("{:<15} {:<30} {:<20}".format(
        "текст",        
        "синтаксическая зависимость",   
        "синтаксический родитель"   
        ))
for token in doc:
    print("{:<15} {:<30} {:<20}".format(
            token.text, # текст
            token.dep_, # Отношение синтаксической зависимости
            token.head.text  # Синтаксический родитель
         ))
print()
    

текст           синтаксическая зависимость     синтаксический родитель
Таким           det                            образом             
образом         parataxis                      играет              
,               punct                          образом             
курс            nsubj                          играет              
на              case                           проект              
социально       amod                           проект              
-               amod                           проект              
ориентированный amod                           проект              
национальный    amod                           проект              
проект          nmod                           курс                
играет          ROOT                           играет              
важную          amod                           роль                
роль            obj                            играет              
в               case                         

In [4]:
# визуализации дерева зависимостей, а также распознанных сущностей
from spacy import displacy
displacy.render(docs    = doc,   # Документ(ы) или диапазон(ы) для визуализации.
                style   ='dep',  # Стиль визуализации, "dep" or "ent". По умолчанию "dep".
                page    = True,  # Отображать разметку как полную HTML-страницу. По умолчанию True.
                minify  = False, # Уменьшить разметку HTML. По умолчанию False.
                #options =       # Аргумент options позволяет указать дополнительные настройки для каждого визуализатора.
                manual  = False, # Не разбирать документ, а ожидать словарный запас или список его слов. По умолчанию False.
                jupyter = True   # Явно включить или отключить «режим Jupyter», чтобы вернуть разметку, готовую для отображения в Juputer Notebook. False (по умолчанию).
               )
    

In [5]:
# Получить описание для данного тега POS, метки зависимости или типа объекта. 
# Список доступных терминов см. На сайте glossary.py.
# для расшифровки названий тегов можно воспользоваться функций explain:
print(spacy.explain("AUX"))
print(spacy.explain("CCONJ"))

doc2=nlp("Таким образом, курс на социально-ориентированный национальный проект играет важную роль в формировании форм воздействия.")

for ent in doc2.ents:
    print(ent.text, ent.label_)
displacy.render(doc2, style='ent', jupyter=True)
    
print(spacy.explain("GPE")) 


auxiliary
coordinating conjunction




Countries, cities, states
