##  Example notebook {#sec-NER}

This is an example notebook meant to illustrate how jupyter notebooks can be integrated with the rest of the document.


### Function
Define a simple function which takes a text string and returns a dataframe of NER-counts:

In [6]:
#| label: simple-NER-count
#| code-fold: true

#!pip install spacy
#!python -m spacy download nb_core_news_sm
#!pip install pandas
import spacy
from spacy import displacy
import pandas as pd

def extract_ner(string):
    # Load the pre-trained NER model
    nlp = spacy.load("nb_core_news_sm")
    
    # Process the input string
    doc = nlp(string)
    
    # Extract the NER objects
    ner_objects = []
    for ent in doc.ents:
        ner_objects.append((ent.text, ent.label_))
    
    # Create a dataframe from the NER objects
    df = pd.DataFrame(ner_objects, columns=["Entity", "Label"])

    ner_counts = df['Label'].value_counts()
    #print(ner_counts)
    
    displacy.render(doc, style="ent", jupyter=True)
    
    return df

In [2]:
#| label: example-string

# create a basic text string
s = """Dette er en tekst om Ola Nordmann,som bor i Stavanger og jobber i Oslo. 
Han liker å reise til Paris, men trives best på hytta i Hemsedal. 
Han sliter litt med migrene fra tid til annen,og har tidligere hatt lengre perioder med depresjon. 
Da er det godt å finne roen på fjellet. Han kan nås på 12 34 56 78 eller på ola.nordann@etellerannet.no"""
print(s)

Dette er en tekst om Ola Nordmann,som bor i Stavanger og jobber i Oslo. 
Han liker å reise til Paris, men trives best på hytta i Hemsedal. 
Han sliter litt med migrene fra tid til annen,og har tidligere hatt lengre perioder med depresjon. 
Da er det godt å finne roen på fjellet. Han kan nås på 12 34 56 78 eller på ola.nordann@etellerannet.no


In [7]:
#| label: NER-example
# extract the NER from the string
df = extract_ner(s)
print(df)  

                        Entity    Label
0                 Ola Nordmann      PER
1                    Stavanger  GPE_LOC
2                         Oslo  GPE_LOC
3                        Paris  GPE_LOC
4                     Hemsedal  GPE_LOC
5  ola.nordann@etellerannet.no     PROD
