# Part-of-Speech NER with Hugging Face BERT

## Imports

In [2]:
import numpy as np
import pandas as pd
from transformers import AutoTokenizer, AutoModelForTokenClassification, TokenClassificationPipeline

## Model Setup

In [6]:
# https://huggingface.co/Davlan/distilbert-base-multilingual-cased-ner-hrl
model_name = "Davlan/distilbert-base-multilingual-cased-ner-hrl"

tokenizer = AutoTokenizer.from_pretrained(model_name)

model = AutoModelForTokenClassification.from_pretrained(model_name)

nlp = TokenClassificationPipeline(model=model, tokenizer=tokenizer, aggregation_strategy="simple")

In [28]:
examples = [
    "Nader Jokhadar had given Syria the lead with a well-struck header in the seventh minute.",
    "Apple est créée le 1er avril 1976 dans le garage de la maison d'enfance de Steve Jobs à Los Altos en Californie par Steve Jobs, Steve Wozniak et Ronald Wayne, puis constituée sous forme de société le 3 janvier 1977 à l'origine sous le nom d'Apple Computer.",
    "1976年4月，史蒂夫·乔布斯、斯蒂夫·沃兹尼亚克和罗纳德·韦恩创立了苹果公司，目的是为了研發和销售沃兹尼亚克Apple I个人电脑，但韦恩12天后就放弃了自己的股份。1977年1月，正式确定公司名称为「苹果电脑公司」，包括Apple II在内的电脑销量迅速增长",
]

ner_results = nlp(examples)

for result in ner_results:
    for entity in result:
        print(f"{entity['word']} ({entity['entity_group']})")


Nader Jokhadar (PER)
Syria (LOC)
Apple (ORG)
Steve Jobs (PER)
Los Altos (LOC)
Californie (LOC)
Steve Jobs (PER)
Steve Wozniak (PER)
Ronald Wayne (PER)
Apple Computer (ORG)
史 蒂 夫 · 乔 布 斯 (PER)
斯 蒂 夫 · 沃 兹 尼 亚 克 (PER)
罗 纳 德 · 韦 恩 (PER)
苹 果 公 司 (ORG)
沃 兹 尼 亚 克 (ORG)
韦 恩 (PER)
苹 果 电 脑 公 司 (ORG)


In [29]:
pd.set_option("display.max_colwidth", None)

pd.DataFrame({
    "Document": examples,
    "Entities": list(map(
        lambda result: list(map(
            lambda entity: f"{entity['word']} ({entity['entity_group']})",
            result
        )),
        ner_results,
    )),
})

Unnamed: 0,Document,Entities
0,Nader Jokhadar had given Syria the lead with a well-struck header in the seventh minute.,"[Nader Jokhadar (PER), Syria (LOC)]"
1,"Apple est créée le 1er avril 1976 dans le garage de la maison d'enfance de Steve Jobs à Los Altos en Californie par Steve Jobs, Steve Wozniak et Ronald Wayne, puis constituée sous forme de société le 3 janvier 1977 à l'origine sous le nom d'Apple Computer.","[Apple (ORG), Steve Jobs (PER), Los Altos (LOC), Californie (LOC), Steve Jobs (PER), Steve Wozniak (PER), Ronald Wayne (PER), Apple Computer (ORG)]"
2,1976年4月，史蒂夫·乔布斯、斯蒂夫·沃兹尼亚克和罗纳德·韦恩创立了苹果公司，目的是为了研發和销售沃兹尼亚克Apple I个人电脑，但韦恩12天后就放弃了自己的股份。1977年1月，正式确定公司名称为「苹果电脑公司」，包括Apple II在内的电脑销量迅速增长,"[史 蒂 夫 · 乔 布 斯 (PER), 斯 蒂 夫 · 沃 兹 尼 亚 克 (PER), 罗 纳 德 · 韦 恩 (PER), 苹 果 公 司 (ORG), 沃 兹 尼 亚 克 (ORG), 韦 恩 (PER), 苹 果 电 脑 公 司 (ORG)]"
