In [None]:
# do_ner1.py

import spacy
from spacy import displacy

nlp = spacy.load('ja_ginza')

text = '宮島でもみじ饅頭を食べた。'
doc = nlp(text)

# 固有表現を抽出
for ent in doc.ents:
    print(ent.text, ent.label_)

# 固有表現の抽出結果を可視化
displacy.render(doc, style='ent')

In [None]:
# do_ner2.py

import pandas as pd

# 1. 口コミデータの読み込み
df = pd.read_csv('text/miyajima_sample.csv', encoding='utf-8',
                 parse_dates=['旅行の時期'])

# 固有表現抽出の結果を表示
for doc in nlp.pipe(df['口コミ']):
    # 固有表現を抽出
    for ent in doc.ents:
        print(ent.text, ent.label_)
    # 固有表現の抽出結果を可視化
    if doc.ents:
        displacy.render(doc, style='ent')
    print('='*80)

In [None]:
# do_ner3.py

from spacy.pipeline import EntityRuler

# 2. 固有表現抽出のルールを追加
ruler = EntityRuler(nlp, overwrite_ents=True)
patterns = [
    {'label': 'Dish', 'pattern': [
        {'TEXT': 'あなご'},
        {'TEXT': {'REGEX': r'飯|めし'}},
    ]},
    {'label': 'Dish', 'pattern': '揚げもみじ'},
    {'label': 'Dish', 'pattern': 'ガンス'},
    {'label': 'Dish', 'pattern': [
        {'TEXT': 'にぎり'},
        {'TEXT': '天'}
    ]}
]

ruler.add_patterns(patterns)
nlp.add_pipe(ruler,  before='ner')

In [None]:
# 3. 固有表現抽出の結果を表示
for doc in nlp.pipe(df['口コミ']):
    # 固有表現を抽出
    for ent in doc.ents:
        print(ent.text, ent.label_)
    # 固有表現の抽出結果を可視化
    if doc.ents:
        spacy.displacy.render(doc, style='ent')
    print('='*80)