In [None]:
from ner.network import NER
from ner.corpus import Corpus
import json
from ner.utils import md5_hashsum, download_untar
from glob import glob


# Check existance of the model by hashsum
if md5_hashsum(glob('model/*')) != 'f25fe8e1297154077fc4d3bf65ed888e':
    # Download and extract model
    download_url = 'http://lnsigo.mipt.ru/export/ner/ner_model_total_rus.tar.gz'
    download_path = 'model/'
    download_untar(download_url, download_path)

# Load network params
with open('model/params.json') as f:
    network_params = json.load(f)


corpus = Corpus(dicts_filepath='model/dict.txt')

network = NER(corpus, verbouse=False, pretrained_model_filepath='model/ner_model', **network_params)

In [2]:
from ner.utils import tokenize, lemmatize


def print_predict(sentence, network):
    # Split sentence into tokens
    tokens = tokenize(sentence)
    
    # Lemmatize every token
    # Example: был -> быть, его -> он
    tokens_lemmas = lemmatize(tokens)
    
    tags = network.predict_for_token_batch([tokens_lemmas])[0]
    for token, tag in zip(tokens, tags):
        print(token, tag)

In [3]:
s = 'Международное рейтинговое агентство Standard & Poors (S&P) ' \
    'в понедельник вечером опустило до дефолтного уровня долг ' \
    'Венесуэлы в иностранной валюте после неисполнения графика ' \
    'платежей по процентам.'

print_predict(s, network)


Международное O
рейтинговое O
агентство O
Standard B-ORG
& I-ORG
Poors I-ORG
( I-ORG
S I-ORG
& I-ORG
P I-ORG
) O
в O
понедельник O
вечером O
опустило O
до O
дефолтного O
уровня O
долг O
Венесуэлы B-LOC
в O
иностранной O
валюте O
после O
неисполнения O
графика O
платежей O
по O
процентам O
. O


In [4]:
s = 'Глава министерства обороны США Джеймс Мэттис назвал ' \
    'приобретение Турцией российских зенитно-ракетных комплексов' \
    ' С-400 "Триумф" суверенным делом властей республики. При этом' \
    ' он подчеркнул, что такая сделка не будет подходить требованиям' \
    ' и принципам североатлантического альянса.'
print_predict(s, network)

Глава O
министерства B-ORG
обороны I-ORG
США B-LOC
Джеймс B-PER
Мэттис I-PER
назвал O
приобретение O
Турцией B-LOC
российских O
зенитно O
- O
ракетных O
комплексов O
С O
- O
400 O
" O
Триумф O
" O
суверенным O
делом O
властей O
республики O
. O
При O
этом O
он O
подчеркнул O
, O
что O
такая O
сделка O
не O
будет O
подходить O
требованиям O
и O
принципам O
североатлантического O
альянса O
. O
