# EIT Konstuktion 
## Nützliche Libraries

Silbentrennung mit [Pyphen](https://pyphen.org)

In [None]:
#!pip install pyphen

In [1]:
import pyphen

#Beispielsatz aus deu-com_web_2021: 879
sentence_tokenized = "Beispielsweise empfiehlt es sich , Ohrstöpsel dabei zu haben , wenn Sie in ein Konzert oder in ein Kino mit lauter Filmmusik gehen ."


dic = pyphen.Pyphen(lang='de_De')

#Bindestriche an Silbengrenzen einfügen
for word in sentence_tokenized.split():
    print(dic.inserted(word))

Bei-spiels-wei-se
emp-fiehlt
es
sich
,
Ohr-stöp-sel
da-bei
zu
ha-ben
,
wenn
Sie
in
ein
Kon-zert
oder
in
ein
Ki-no
mit
lau-ter
Film-mu-sik
ge-hen
.


In [2]:
#Positionen der Silbengrenzen ausgeben
for word in sentence_tokenized.split():
    print(word, dic.positions(word))

Beispielsweise [3, 9, 12]
empfiehlt [3]
es []
sich []
, []
Ohrstöpsel [3, 7]
dabei [2]
zu []
haben [2]
, []
wenn []
Sie []
in []
ein []
Konzert [3]
oder []
in []
ein []
Kino [2]
mit []
lauter [3]
Filmmusik [4, 6]
gehen [2]
. []


Vorverarbeitung mit [spaCy](https://spacy.io), inkl. Silbentrennung (basiert auf pyphen)

In [None]:
#!pip install spacy
#!python3 -m spacy download de_core_news_sm

#https://pypi.org/project/spacy-syllables/ --> uses Pyphen
#!pip install spacy_syllables

In [11]:
import spacy
from spacy_syllables import SpacySyllables

sentence = "Beispielsweise empfiehlt Dr. House, Ohrstöpsel dabei zu haben, wenn Sie in ein Konzert oder in ein Kino mit lauter Filmmusik gehen."

#Modell laden
nlp = spacy.load("de_core_news_sm")
# ['tok2vec', 'tagger', 'parser', 'attribute_ruler', 'lemmatizer', 'ner']
# nlp.select_pipes(enable=['tok2vec', 'tagger', 'parser', 'attribute_ruler', 'lemmatizer', 'ner'])

#Komponente für die Silbentrennung zur Pipeline hinzufügen
nlp.add_pipe("syllables", after="tagger", config={"lang": "de_DE"})

#NLP-Pipeline ausführen
doc = nlp(sentence)

#Analysen ausgeben lassen
for token in doc:
    print(token.text, token.lemma_, token.pos_, token._.syllables, token._.syllables_count)

Beispielsweise beispielsweise ADV ['bei', 'spiels', 'wei', 'se'] 4
empfiehlt empfehlen VERB ['emp', 'fiehlt'] 2
Dr. Dr. NOUN None None
House House PROPN ['hou', 'se'] 2
, -- PUNCT None None
Ohrstöpsel Ohrstöpsel NOUN ['ohr', 'stöp', 'sel'] 3
dabei dabei ADV ['da', 'bei'] 2
zu zu PART ['zu'] 1
haben haben VERB ['ha', 'ben'] 2
, -- PUNCT None None
wenn wenn SCONJ ['wenn'] 1
Sie sie PRON ['sie'] 1
in in ADP ['in'] 1
ein ein DET ['ein'] 1
Konzert Konzert NOUN ['kon', 'zert'] 2
oder oder CCONJ ['oder'] 1
in in ADP ['in'] 1
ein ein DET ['ein'] 1
Kino Kino NOUN ['ki', 'no'] 2
mit mit ADP ['mit'] 1
lauter laut ADJ ['lau', 'ter'] 2
Filmmusik Filmmusik NOUN ['film', 'mu', 'sik'] 3
gehen gehen VERB ['ge', 'hen'] 2
. -- PUNCT None None
