# Flair Basics

## Tutorials und Dokumentation

https://github.com/flairNLP/flair

## Seite an der HU mit Referenzen und Paper

https://www.informatik.hu-berlin.de/de/forschung/gebiete/ml/Flair/flair

## Imports

In [1]:
from flair.data import Sentence
from flair.models import SequenceTagger
from flair.models import MultiTagger
from flair.tokenization import SegtokSentenceSplitter

## Tokenisierung

In [49]:
# create sentence
sentence = Sentence('Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als "sehr hoch" ein.')

In [50]:
type(sentence)

flair.data.Sentence

In [51]:
print(sentence)

Sentence: "Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als " sehr hoch " ein ."   [− Tokens: 18]


In [52]:
# show all Tokens
sentence.tokens

[Token: 1 Die,
 Token: 2 Gefahr,
 Token: 3 eines,
 Token: 4 russischen,
 Token: 5 Einmarsches,
 Token: 6 in,
 Token: 7 die,
 Token: 8 Ukraine,
 Token: 9 schätzt,
 Token: 10 US-Präsident,
 Token: 11 Biden,
 Token: 12 als,
 Token: 13 ",
 Token: 14 sehr,
 Token: 15 hoch,
 Token: 16 ",
 Token: 17 ein,
 Token: 18 .]

In [53]:
print(sentence.language_code)

None


In [54]:
print(sentence.get_token(2))

Token: 2 Gefahr


In [55]:
for token in sentence:
    print(token.text, token.idx)    

Die 1
Gefahr 2
eines 3
russischen 4
Einmarsches 5
in 6
die 7
Ukraine 8
schätzt 9
US-Präsident 10
Biden 11
als 12
" 13
sehr 14
hoch 15
" 16
ein 17
. 18


## Tokens in einer Liste

In [56]:
token_list = [ token.text for token in sentence ]

In [36]:
token_list

['Die',
 'Gefahr',
 'eines',
 'russischen',
 'Einmarsches',
 'in',
 'die',
 'Ukraine',
 'schätzt',
 'US-Präsident',
 'Biden',
 'als',
 '"',
 'sehr',
 'hoch',
 '"',
 'ein',
 '.']

## Sätze mit einem Label versehen

In [57]:
sentence.add_label('topic', 'Ukraine-Konflikt')

Sentence: "Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als " sehr hoch " ein ."   [− Tokens: 18  − Sentence-Labels: {'topic': [Ukraine-Konflikt (1.0)]}]

In [74]:
sentence.add_label('category', 'Kriegsgefahr')
sentence.add_label('language', 'German')

Sentence: "Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als " sehr hoch " ein ."   [− Tokens: 18  − Sentence-Labels: {'topic': [Ukraine-Konflikt (1.0)], 'category': [Kriegsgefahr (1.0)], 'language': [German (1.0)]}]

In [75]:
# sentence.remove_labels('language')

In [76]:
for label in sentence.labels:
    print(label)

Ukraine-Konflikt (1.0)
Kriegsgefahr (1.0)
German (1.0)


In [77]:
print(sentence.to_plain_string())
for label in sentence.labels:
    print(f' - classified as "{label.value}" with score {label.score}')

Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als "sehr hoch" ein.
 - classified as "Ukraine-Konflikt" with score 1.0
 - classified as "Kriegsgefahr" with score 1.0
 - classified as "German" with score 1.0


In [78]:
for label in sentence.get_labels('topic'):
    print(label)

Ukraine-Konflikt (1.0)


In [79]:
for label in sentence.get_labels('category'):
    print(label)

Kriegsgefahr (1.0)


## Laden des NER-Taggers

In [80]:
# load the NER tagger
tagger = SequenceTagger.load('de-ner')

# run NER over sentence
tagger.predict(sentence)

2022-02-22 11:05:40,231 --------------------------------------------------------------------------------
2022-02-22 11:05:40,232 The model key 'de-ner' now maps to 'https://huggingface.co/flair/ner-german' on the HuggingFace ModelHub
2022-02-22 11:05:40,233  - The most current version of the model is automatically downloaded from there.
2022-02-22 11:05:40,233  - (you can alternatively manually download the original model at https://nlp.informatik.hu-berlin.de/resources/models/de-ner/de-ner-conll03-v0.4.pt)
2022-02-22 11:05:40,234 --------------------------------------------------------------------------------
2022-02-22 11:05:40,738 loading file C:\Users\nitra\.flair\models\ner-german\a125be40445295f7e94d0afdb742cc9ac40ec4e93259dc30f35220ffad9bf1f6.f46c4c5cfa5e34baa838983373e30051cd1cf1e933499408a49e451e784b0a11


In [81]:
print(sentence)

Sentence: "Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als " sehr hoch " ein ."   [− Tokens: 18  − Token-Labels: "Die Gefahr eines russischen Einmarsches in die Ukraine <S-LOC> schätzt US-Präsident Biden <S-PER> als " sehr hoch " ein ."  − Sentence-Labels: {'topic': [Ukraine-Konflikt (1.0)], 'category': [Kriegsgefahr (1.0)], 'language': [German (1.0)]}]


In [98]:
for token in sentence:
    print(token.text, token.get_tag('ner'))

Die O (1.0)
Gefahr O (1.0)
eines O (1.0)
russischen O (1.0)
Einmarsches O (1.0)
in O (1.0)
die O (1.0)
Ukraine S-LOC (1.0)
schätzt O (1.0)
US-Präsident O (0.9999)
Biden S-PER (0.999)
als O (1.0)
" O (1.0)
sehr O (1.0)
hoch O (1.0)
" O (1.0)
ein O (1.0)
. O (1.0)


In [83]:
print(sentence.to_tagged_string())

Die Gefahr eines russischen Einmarsches in die Ukraine <S-LOC> schätzt US-Präsident Biden <S-PER> als " sehr hoch " ein .


In [84]:
for entity in sentence.get_spans('ner'):
    print(entity)

Span [8]: "Ukraine"   [− Labels: LOC (1.0)]
Span [11]: "Biden"   [− Labels: PER (0.999)]


In [96]:
sentence.to_dict(tag_type='ner')

{'text': 'Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als "sehr hoch" ein.',
 'labels': [{'value': 'Ukraine-Konflikt', 'confidence': 1.0},
  {'value': 'Kriegsgefahr', 'confidence': 1.0},
  {'value': 'German', 'confidence': 1.0}],
 'entities': [{'text': 'Ukraine',
   'start_pos': 47,
   'end_pos': 54,
   'labels': [LOC (1.0)]},
  {'text': 'Biden', 'start_pos': 76, 'end_pos': 81, 'labels': [PER (0.999)]}]}

## Multi-Tagging von NER und POS

[Liste von Pre-Trained Sequence Tagger Models](https://github.com/flairNLP/flair/blob/master/resources/docs/TUTORIAL_2_TAGGING.md#list-of-pre-trained-sequence-tagger-models)

In [87]:
# create sentence
sentence_multi_tagged = Sentence('Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als "sehr hoch" ein.')

In [88]:
multi_tagger = MultiTagger.load(['de-pos', 'de-ner'])

2022-02-22 11:19:15,450 loading file C:\Users\nitra\.flair\models\de-pos-ud-hdt-v0.5.pt
2022-02-22 11:19:15,896 --------------------------------------------------------------------------------
2022-02-22 11:19:15,897 The model key 'de-ner' now maps to 'https://huggingface.co/flair/ner-german' on the HuggingFace ModelHub
2022-02-22 11:19:15,897  - The most current version of the model is automatically downloaded from there.
2022-02-22 11:19:15,898  - (you can alternatively manually download the original model at https://nlp.informatik.hu-berlin.de/resources/models/de-ner/de-ner-conll03-v0.4.pt)
2022-02-22 11:19:15,898 --------------------------------------------------------------------------------
2022-02-22 11:19:16,482 loading file C:\Users\nitra\.flair\models\ner-german\a125be40445295f7e94d0afdb742cc9ac40ec4e93259dc30f35220ffad9bf1f6.f46c4c5cfa5e34baa838983373e30051cd1cf1e933499408a49e451e784b0a11


In [89]:
multi_tagger.predict(sentence_multi_tagged)

In [91]:
print(sentence_multi_tagged)

Sentence: "Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als " sehr hoch " ein ."   [− Tokens: 18  − Token-Labels: "Die <ART> Gefahr <NN> eines <ART> russischen <ADJA> Einmarsches <NN> in <APPR> die <ART> Ukraine <NE/S-LOC> schätzt <VVFIN> US-Präsident <NN> Biden <NE/S-PER> als <KOKOM> " <$(> sehr <ADV> hoch <ADJD> " <$(> ein <PTKVZ> . <$.>"]


In [94]:
sentence_multi_tagged.to_dict(tag_type='de-pos')

{'text': 'Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als "sehr hoch" ein.',
 'labels': [],
 'entities': [{'text': 'Die',
   'start_pos': 0,
   'end_pos': 3,
   'labels': [ART (1.0)]},
  {'text': 'Gefahr', 'start_pos': 4, 'end_pos': 10, 'labels': [NN (1.0)]},
  {'text': 'eines', 'start_pos': 11, 'end_pos': 16, 'labels': [ART (1.0)]},
  {'text': 'russischen',
   'start_pos': 17,
   'end_pos': 27,
   'labels': [ADJA (1.0)]},
  {'text': 'Einmarsches',
   'start_pos': 28,
   'end_pos': 39,
   'labels': [NN (1.0)]},
  {'text': 'in', 'start_pos': 40, 'end_pos': 42, 'labels': [APPR (1.0)]},
  {'text': 'die', 'start_pos': 43, 'end_pos': 46, 'labels': [ART (1.0)]},
  {'text': 'Ukraine', 'start_pos': 47, 'end_pos': 54, 'labels': [NE (0.9601)]},
  {'text': 'schätzt', 'start_pos': 55, 'end_pos': 62, 'labels': [VVFIN (1.0)]},
  {'text': 'US-Präsident',
   'start_pos': 63,
   'end_pos': 75,
   'labels': [NN (0.9999)]},
  {'text': 'Biden', 'start_pos': 76, 'end_p

### Taggen eines arabischen Satzes

In [99]:
# load model
tagger_ar = SequenceTagger.load('ar-ner')

# make Arabic sentence
sentence_ar = Sentence("احب برلين")

# predict NER tags
tagger_ar.predict(sentence_ar)

# print sentence with predicted tags
for entity in sentence_ar.get_labels('ner'):
    print(entity)

2022-02-22 11:22:51,800 --------------------------------------------------------------------------------
2022-02-22 11:22:51,800 The model key 'ar-ner' now maps to 'https://huggingface.co/megantosh/flair-arabic-multi-ner' on the HuggingFace ModelHub
2022-02-22 11:22:51,801  - The most current version of the model is automatically downloaded from there.
2022-02-22 11:22:51,801 --------------------------------------------------------------------------------


Downloading:   0%|          | 0.00/550M [00:00<?, ?B/s]

2022-02-22 11:24:13,539 loading file C:\Users\nitra\.flair\models\flair-arabic-multi-ner\c7af7ddef4fdcc681fcbe1f37719348afd2862b12aa1cfd4f3b93bd2d77282c7.242d030cb106124f7f9f6a88fb9af8e390f581d42eeca013367a86d585ee6dd6
LOC [برلين (2)] (0.9803)


## Tagging von Multilingualen Texten



In [101]:
sentence_multilingual = Sentence('''Die Gefahr eines russischen Einmarsches 
                                    in die Ukraine schätzt US-Präsident Biden 
                                    als "sehr hoch" ein.
                                    The danger of a Russian invasion Ukraine 
                                    is "very high" in the view of U.S. President Biden.''')

tagger_multilingual = SequenceTagger.load('pos-multi')

tagger_multilingual.predict(sentence_multilingual)

2022-02-22 11:35:09,156 --------------------------------------------------------------------------------
2022-02-22 11:35:09,156 The model key 'pos-multi' now maps to 'https://huggingface.co/flair/upos-multi' on the HuggingFace ModelHub
2022-02-22 11:35:09,157  - The most current version of the model is automatically downloaded from there.
2022-02-22 11:35:09,158  - (you can alternatively manually download the original model at https://nlp.informatik.hu-berlin.de/resources/models/multi-pos/pos-multi-v0.1.pt)
2022-02-22 11:35:09,158 --------------------------------------------------------------------------------
2022-02-22 11:35:09,655 loading file C:\Users\nitra\.flair\models\upos-multi\1a44f168663182024fd3ea6d7dcaeee47fe5bcb537cc737ad058b64ad4db9736.5f899f25846741510a6567b89027d988bd6f634b2776a7c3e834fea4629367cb


In [103]:
print(sentence_multilingual.to_tagged_string())

Die <DET> Gefahr <NOUN> eines <DET> russischen <ADJ> Einmarsches <NOUN> in <ADP> die <DET> Ukraine <PROPN> schätzt <VERB> US-Präsident <NOUN> Biden <PROPN> als <ADP> " <PUNCT> sehr <ADV> hoch <ADJ> " <PUNCT> ein <ADV> . <PUNCT> The <DET> danger <NOUN> of <ADP> a <PROPN> Russian <PROPN> invasion <PROPN> Ukraine <PROPN> is <AUX> " <PUNCT> very <ADV> high <ADJ> " <PUNCT> in <ADP> the <DET> view <NOUN> of <ADP> U.S. <PROPN> President <PROPN> Biden <PROPN> . <PUNCT>


## Taggen einer Liste mit mehreren Sätzen


* Ist das überhaupt nötig? Oder kann ein Text mit mehreren Sätzen auch ein Sentence sein? >> Testen

In [104]:
text = '''Biden befürchtet Einmarsch "in den nächsten Tagen"
            Stand: 18.02.2022 06:01 Uhr
            Die Gefahr eines russischen Einmarsches in die Ukraine schätzt US-Präsident Biden als "sehr hoch" ein - schon in den kommenden Tagen könne es dazu kommen. Die russische Regierung wies den Vize-US-Botschafter in Moskau aus.
            US-Präsident Joe Biden befürchtet trotz aller Beteuerungen aus Moskau einen russischen Einmarsch in die Ukraine in den kommenden Tagen. Biden sagte, die Gefahr einer Invasion sei "sehr hoch". Nach seiner Einschätzung könne es "in den nächsten paar Tagen" dazu kommen. Es gebe keine Pläne dafür, dass er mit dem russischen Präsidenten Wladimir Putin telefonieren werde, fügte er hinzu.
            Der Kreml erklärte laut der russischen Agentur RIA, Bidens Warnung verstärke die Spannungen noch. Der stellvertretende Außenminister Sergej Werschinin wies vor dem UN-Sicherheitsrat die Befürchtungen des Westens vor einem bevorstehenden Einmarsch erneut zurück. "Ich denke, wir haben genug darüber spekuliert", sagte er. Eine Invasion sei entgegen der Warnungen ausgeblieben. In Richtung der USA und ihrer westlichen Verbündeten sagte Werschinin: "Mein Rat an Sie ist, sich nicht in eine unangenehme Situation zu begeben."
            Biden will am heutigen Freitag mit Verbündeten über das weitere Vorgehen beraten. Themen der Telefonschalte am Nachmittag (Ortszeit) sollten unter anderem die Aufstockung der russischen Truppen an der Grenze zur Ukraine und weitere diplomatische Bemühungen sein, hieß es aus dem Weißen Haus. Neben Kanadas Premierminister Justin Trudeau sollen führende Politiker aus Deutschland, Frankreich, Großbritannien, Italien, Polen und Rumänien an dem Gespräch teilnehmen, teilte Trudeaus Büro am Donnerstagabend (Ortszeit) mit. Auch die Europäische Union und die NATO seien vertreten.
            US-Außenminister Antony Blinken will sich nächste Woche mit seinem russischen Kollegen Sergej Lawrow treffen - solange Russland nicht in der Ukraine einmarschiert. Blinken habe vorgeschlagen, sich mit Lawrow "nächste Woche in Europa zu treffen. Die Russen haben mit Terminvorschlägen für Ende nächster Woche geantwortet, was wir unter der Bedingung akzeptiert haben, dass es keine russische Invasion der Ukraine gibt", erklärte der Sprecher des Außenministeriums, Ned Price, am Abend.
            Zuvor hatte Blinken vor dem UN-Sicherheitsrat ebenfalls gewarnt, Russland bereite sich auf einen Angriff in den kommenden Tagen vor. Russlands Plan sei, dafür einen Vorwand zu schaffen. "Dies könnte ein gewaltsames Ereignis sein, das Russland gegen die Ukraine vorbringen wird, oder eine unerhörte Anschuldigung, die Russland gegen die ukrainische Regierung erheben wird", sagte er. Möglich wären ihm zufolge ein vermeintlicher Terroranschlag in Russland, die "erfundene Entdeckung eines Massengrabes" und Vorwürfe eines Völkermordes, ein inszenierter Drohnenangriff auf Zivilisten oder ein vorgetäuschter oder echter Angriff mit Chemiewaffen.
            Russische Medien würden bereits "falsche Alarme" verbreiten, so Blinken. Ein russischer Angriff könne auch die ukrainische Hauptstadt Kiew einbeziehen. Der US-Außenminister betonte, Diplomatie sei weiter der wichtigste Weg zur Lösung der Krise. Er habe daher seinem russischen Amtskollegen Sergej Lawrow ein persönliches Treffen in der kommenden Woche vorgeschlagen. 
            '''

### Tokenisierung und Tagging

In [106]:
splitter = SegtokSentenceSplitter()

sentences = splitter.split(text)

multi_tagger = MultiTagger.load(['de-pos', 'de-ner'])

multi_tagger.predict(sentences)

2022-02-22 11:39:44,894 loading file C:\Users\nitra\.flair\models\de-pos-ud-hdt-v0.5.pt
2022-02-22 11:39:45,343 --------------------------------------------------------------------------------
2022-02-22 11:39:45,343 The model key 'de-ner' now maps to 'https://huggingface.co/flair/ner-german' on the HuggingFace ModelHub
2022-02-22 11:39:45,343  - The most current version of the model is automatically downloaded from there.
2022-02-22 11:39:45,343  - (you can alternatively manually download the original model at https://nlp.informatik.hu-berlin.de/resources/models/de-ner/de-ner-conll03-v0.4.pt)
2022-02-22 11:39:45,343 --------------------------------------------------------------------------------
2022-02-22 11:39:45,841 loading file C:\Users\nitra\.flair\models\ner-german\a125be40445295f7e94d0afdb742cc9ac40ec4e93259dc30f35220ffad9bf1f6.f46c4c5cfa5e34baa838983373e30051cd1cf1e933499408a49e451e784b0a11
2022-02-22 11:39:55,763 Ignore 1 sentence(s) with no tokens.
2022-02-22 11:40:00,372 Ig

### Ausgabe des Resultats

In [108]:
for sentence in sentences[:5]:
    print(sentence.to_tagged_string())

Biden <NE/S-PER> befürchtet <VVFIN> Einmarsch <NN> " <$(> in <APPR> den <ART> nächsten <ADJA> Tagen <NN> " <$(> Stand <NN> : <$.> 18.02.2022 <NN> 06:01 <CARD> Uhr <NN> Die <ART> Gefahr <NN> eines <ART> russischen <ADJA> Einmarsches <NN> in <APPR> die <ART> Ukraine <NE/S-LOC> schätzt <VVFIN> US-Präsident <NN> Biden <NE/S-PER> als <KOKOM> " <$(> sehr <ADV> hoch <ADJD> " <$(> ein <PTKVZ> - <$(> schon <ADV> in <APPR> den <ART> kommenden <ADJA> Tagen <NN> könne <VMFIN> es <PPER> dazu <PROAV> kommen <VVINF> . <$.>
Die <ART> russische <ADJA> Regierung <NN> wies <VVFIN> den <ART> Vize-US-Botschafter <NN> in <APPR> Moskau <NE/S-LOC> aus <PTKVZ> . <$.>
US-Präsident <NN> Joe <NE/B-PER> Biden <NE/E-PER> befürchtet <VVFIN> trotz <APPR> aller <PIDAT> Beteuerungen <NN> aus <APPR> Moskau <NE/S-LOC> einen <ART> russischen <ADJA> Einmarsch <NN> in <APPR> die <ART> Ukraine <NE/S-LOC> in <APPR> den <ART> kommenden <ADJA> Tagen <NN> . <$.>
Biden <NN/S-PER> sagte <VVFIN> , <$,> die <ART> Gefahr <NN> einer <

In [159]:
# results for first three sentences

for sentence in sentences[:3]:
    for token in sentence:
        print(token.text, token.get_tag('de-ner'), token.get_tag('de-pos'))

Biden S-PER (0.9938) NE (0.5766)
befürchtet O (1.0) VVFIN (1.0)
Einmarsch O (0.9999) NN (0.9996)
" O (1.0) $( (1.0)
in O (1.0) APPR (1.0)
den O (1.0) ART (1.0)
nächsten O (1.0) ADJA (1.0)
Tagen O (0.9999) NN (1.0)
" O (1.0) $( (1.0)
Stand O (0.9995) NN (0.9999)
: O (1.0) $. (1.0)
18.02.2022 O (1.0) NN (0.7352)
06:01 O (1.0) CARD (0.9994)
Uhr O (1.0) NN (1.0)
Die O (1.0) ART (1.0)
Gefahr O (1.0) NN (1.0)
eines O (1.0) ART (1.0)
russischen O (1.0) ADJA (1.0)
Einmarsches O (1.0) NN (1.0)
in O (1.0) APPR (1.0)
die O (1.0) ART (1.0)
Ukraine S-LOC (1.0) NE (0.9372)
schätzt O (1.0) VVFIN (1.0)
US-Präsident O (0.9999) NN (0.9999)
Biden S-PER (0.999) NE (0.986)
als O (1.0) KOKOM (1.0)
" O (1.0) $( (1.0)
sehr O (1.0) ADV (0.9999)
hoch O (1.0) ADJD (0.9998)
" O (1.0) $( (1.0)
ein O (1.0) PTKVZ (0.9999)
- O (1.0) $( (1.0)
schon O (1.0) ADV (1.0)
in O (1.0) APPR (1.0)
den O (1.0) ART (1.0)
kommenden O (1.0) ADJA (1.0)
Tagen O (1.0) NN (1.0)
könne O (1.0) VMFIN (1.0)
es O (1.0) PPER (1.0)
dazu O (1.

### Named Entities: Person

In [186]:
list_all_per = []

for sentence in sentences:
    
    list_per = [ token.text for token in sentence if str(token.get_tag('de-ner')).split(' ')[0][-3:] == 'PER' ]
    
    # or if **** == x-PER
    list_all_per.append(list_per)

In [187]:
list_all_per

[['Biden', 'Biden'],
 [],
 ['Joe', 'Biden'],
 ['Biden'],
 [],
 ['Wladimir', 'Putin'],
 ['Bidens'],
 ['Sergej', 'Werschinin'],
 [],
 [],
 ['Werschinin'],
 ['Biden'],
 [],
 ['Justin', 'Trudeau', 'Trudeaus'],
 [],
 ['Antony', 'Blinken', 'Sergej', 'Lawrow'],
 ['Lawrow'],
 ['Ned', 'Price'],
 [],
 [],
 [],
 [],
 [],
 [],
 [],
 ['Sergej', 'Lawrow'],
 []]

### Named Entities

abgefragt über POS == NE

In [176]:
list_all_NE = []

for sentence in sentences:
    
    list_ne = [ (token.text, token.get_labels()) for token in sentence if str(token.get_tag('de-pos')).split(' ')[0] == 'NE' ]
    
    list_all_NE.append(list_ne)

In [177]:
list_all_NE

[[('Biden', [NE (0.5766), S-PER (0.9938)]),
  ('Ukraine', [NE (0.9372), S-LOC (1.0)]),
  ('Biden', [NE (0.986), S-PER (0.999)])],
 [('Moskau', [NE (0.9999), S-LOC (0.9999)])],
 [('Joe', [NE (1.0), B-PER (1.0)]),
  ('Biden', [NE (0.9991), E-PER (1.0)]),
  ('Moskau', [NE (0.9994), S-LOC (1.0)]),
  ('Ukraine', [NE (0.9513), S-LOC (1.0)])],
 [],
 [],
 [('Wladimir', [NE (0.9996), B-PER (0.9999)]),
  ('Putin', [NE (0.9997), E-PER (0.9998)])],
 [('RIA', [NE (0.9996), S-ORG (1.0)]),
  ('Bidens', [NE (0.9991), S-PER (0.9999)])],
 [('Sergej', [NE (1.0), B-PER (0.9999)]),
  ('Werschinin', [NE (0.9999), E-PER (0.9999)])],
 [],
 [],
 [('USA', [NE (1.0), S-LOC (1.0)]),
  ('Werschinin', [NE (0.7708), S-PER (0.9998)])],
 [('Biden', [NE (0.6464), S-PER (0.9995)])],
 [('Ukraine', [NE (0.8791), S-LOC (1.0)])],
 [('Kanadas', [NE (0.9998), S-LOC (1.0)]),
  ('Justin', [NE (1.0), B-PER (1.0)]),
  ('Trudeau', [NE (0.9999), E-PER (0.9999)]),
  ('Deutschland', [NE (1.0), S-LOC (0.9999)]),
  ('Frankreich', [NE (

#### Test

In [132]:
biden = sentences[0].get_token(1)

In [135]:
biden.get_tag('de-ner')

S-PER (0.9938)

In [137]:
biden.get_labels()

[NE (0.5766), S-PER (0.9938)]

In [168]:
sentence.to_tagged_string('de-ner')

'US-Präsident Joe <B-PER> Biden <E-PER> befürchtet trotz aller Beteuerungen aus Moskau <S-LOC> einen russischen Einmarsch in die Ukraine <S-LOC> in den kommenden Tagen .'