In [1]:
#!python -m spacy download de_core_news_lg

In [2]:
import spacy
from spacy.lang.de.examples import sentences 

nlp = spacy.load("de_core_news_lg")
doc = nlp(sentences[0])
print(doc.text)
for token in doc:
    print(token.text, token.pos_, token.dep_)

Die ganze Stadt ist ein Startup: Shenzhen ist das Silicon Valley für Hardware-Firmen
Die DET nk
ganze ADJ nk
Stadt NOUN sb
ist AUX ROOT
ein DET nk
Startup NOUN pd
: PUNCT punct
Shenzhen PROPN sb
ist AUX cj
das DET nk
Silicon PROPN pnc
Valley PROPN sb
für ADP mnr
Hardware-Firmen NOUN nk


In [3]:
type(nlp)

spacy.lang.de.German

In [4]:
import spacy
from spacy import displacy

def print_all(doc):
    print("text", "lemma_", "pos_", "tag_", "dep_", "shape_", "is_alpha", "is_stop")
    for token in doc:
        print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,
                token.shape_, token.is_alpha, token.is_stop)

def print_sentence(sentence):
    doc = nlp(sentence)

    print(doc.text)
    print()
    print_all(doc)

def print_dependency_diagram(sentence):
    doc = nlp(sentence)
    displacy.render(doc, style="dep", options={"compact":True})

In [5]:
import spacy
from nltk import Tree
from spacy.tokens.token import Token
from typing import Callable, Optional

def to_nltk_tree(sentence: str, tok_format: Optional[Callable[Token, str]] = None):
    def tok_format_(tok: Token):
        return "_".join([tok.orth_, tok.dep_])
    
    if tok_format is None:
        tok_format = tok_format_
        
    def to_nltk_tree_(node: Token):
        if node.n_lefts + node.n_rights > 0:
            return Tree(tok_format(node), [to_nltk_tree_(child) for child in node.children])
        else:
            return tok_format(node)
        
    doc = nlp(sentence)
    
    ret_val = []
    for sent in doc.sents:
        nltk_tree = to_nltk_tree_(sent.root)
        if isinstance(nltk_tree,str):
            ret_val.append(nltk_tree)
        else:
            ret_val.append(nltk_tree.pretty_print())
    return ret_val

# Dependency Trees

https://www.spiegel.de/ausland/china-und-frankreich-xi-jinping-empfaengt-emmanuel-macron-in-peking-a-1a1b7402-5428-4ce2-8656-35839d368f02

In [6]:
sentence = 'Bei seinem Besuch in Peking hat der französische Präsident Macron den chinesischen Staatschef Xi aufgefordert, Russland »wieder zur Vernunft zu bringen«.'
to_nltk_tree(sentence)

                                                                               hat_ROOT                                                                                         
    ______________________________________________________________________________|____________________________                                                                  
   |                  |                                                                                 aufgefordert_oc                                                         
   |                  |                      __________________________________________________________________|________________________________                                 
   |                  |                     |                Bei_mo                            |                                                |                               
   |                  |                     |                  |                               |                 

[None]

In [7]:
sentence = '»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«, sagte Macron zu Xi.'
to_nltk_tree(sentence)

                                                   sagte_ROOT                                                                          
    ___________________________________________________|____________________________________________________________________________    
   |        |        |                                           hat_oc                                                             |  
   |        |        |        _____________________________________|__________________________________                              |   
   |        |        |       |       |           Aggression_sb                                   versetzt_oc                        |  
   |        |        |       |       |       __________|___________                     ______________|_____________________        |   
   |        |        |       |       |      |          |         in_mnr          Stabilität_da                              |       |  
   |        |        |       |       |      |

[None]

In [8]:
print_sentence(sentence)

»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«, sagte Macron zu Xi.

text lemma_ pos_ tag_ dep_ shape_ is_alpha is_stop
» -- PUNCT $( punct » False False
Die der DET ART nk Xxx True True
russische russisch ADJ ADJA nk xxxx True False
Aggression Aggression NOUN NN sb Xxxxx True False
in in ADP APPR mnr xx True True
der der DET ART nk xxx True True
Ukraine Ukraine PROPN NE nk Xxxxx True False
hat haben AUX VAFIN oc xxx True True
der der DET ART nk xxx True True
( -- PUNCT $( punct ( False False
internationalen international ADJ ADJA nk xxxx True False
) -- PUNCT $( punct ) False False
Stabilität Stabilität NOUN NN da Xxxxx True False
einen ein DET ART nk xxxx True True
Schlag Schlag NOUN NN oa Xxxxx True False
versetzt versetzen VERB VVPP oc xxxx True False
« -- PUNCT $( punct « False False
, -- PUNCT $, punct , False False
sagte sagen VERB VVFIN ROOT xxxx True True
Macron Macron PROPN NE sb Xxxxx True False
zu zu ADP APPR mo xx True 

In [9]:
spacy.explain('oc')

'clausal object'

In [10]:
sentence = '»Ich weiß, dass ich auf Sie zählen kann, wenn es darum geht, Russland wieder zur Vernunft zu bringen und alle an den Verhandlungstisch zurückzuholen.«'
to_nltk_tree(sentence)

                                                              weiß_ROOT                                                                                                             
    ______________________________________________________________|______________________                                                                                            
   |      |       |       |       |                                                   kann_oc                                                                                       
   |      |       |       |       |        ______________________________________________|____________________                                                                       
   |      |       |       |       |       |      |       |        |                                        geht_mo                                                                  
   |      |       |       |       |       |      |       |        |         _________________

[None]

In [11]:
sentence = 'Der französische Präsident Emmanuel Macron ist in Peking vom chinesischen Staatschef Xi Jinping mit militärischen Ehren empfangen worden.'
to_nltk_tree(sentence)

                                 ist_ROOT                                                                      
    ________________________________|________________________                                                   
   |                  |                                  worden_oc                                             
   |                  |                                      |                                                  
   |                  |                                 empfangen_oc                                           
   |                  |                          ____________|________________________________________          
   |                  |                         |                        vom_sbp                      |        
   |                  |                         |                           |                         |         
   |             Präsident_sb                   |                     Staatschef_nk                 

[None]

In [12]:
sentence = 'Vor gemeinsamen Gesprächen begrüßte Xi seinen Gast auf einem roten Teppich.'
to_nltk_tree(sentence)

              begrüßte_ROOT                                        
   _________________|_______________________________                
  |      |        Vor_mo         |                auf_mo           
  |      |          |            |                  |               
  |      |    Gesprächen_nk   Gast_oa           Teppich_nk         
  |      |          |            |         _________|_________      
Xi_sb ._punct gemeinsamen_nk seinen_nk einem_nk            roten_nk



[None]

In [13]:
sentence = 'Macron sagte zu Xi, »Die Aggression hat der Stabilität einen Schlag versetzt«.'
to_nltk_tree(sentence)

                                sagte_ROOT                                              
     _______________________________|_______________________                             
    |        |       |      |                             hat_oc                        
    |        |       |      |        _______________________|__________                  
    |        |       |      |       |            |                versetzt_oc           
    |        |       |      |       |            |           __________|___________      
    |        |       |    zu_mo     |      Aggression_sb    |    Stabilität_da Schlag_oa
    |        |       |      |       |            |          |          |           |     
Macron_sb ,_punct ._punct Xi_nk  »_punct       Die_nk    «_punct     der_nk     einen_nk



[None]

In [14]:
sentence = '»Die Aggression hat der Stabilität einen Schlag versetzt«, sagte Macron zu Xi.'
to_nltk_tree(sentence)

                                  sagte_ROOT                                                        
    __________________________________|__________________________________________________________    
   |        |        |                           hat_oc                                          |  
   |        |        |        _____________________|__________________________                   |   
   |        |        |       |        |            |                     versetzt_oc             |  
   |        |        |       |        |            |              ____________|__________        |   
   |        |        |       |        |      Aggression_sb Stabilität_da             Schlag_oa zu_mo
   |        |        |       |        |            |             |                       |       |   
,_punct Macron_sb ._punct »_punct  «_punct       Die_nk        der_nk                 einen_nk Xi_nk



[None]

In [15]:
sentence = 'Macron sagte zu Xi dass die Aggression der Stabilität einen Schlag versetzt habe.'
to_nltk_tree(sentence)

                        sagte_ROOT                                                
     _______________________|_________                                             
    |        |      |              habe_oc                                        
    |        |      |        _________|_____________________________________       
    |        |      |       |              Aggression_sb               versetzt_oc
    |        |      |       |          __________|_____________             |      
    |        |    zu_mo     |         |                  Stabilität_ag  Schlag_oa 
    |        |      |       |         |                        |            |      
Macron_sb ._punct Xi_nk  dass_cp    die_nk                   der_nk      einen_nk 



[None]

In [16]:
paragraph = 'Der Palast hat bestätigt, dass Prinz Harry (38) zur Krönung von König Charles III. (74) und dessen Ehefrau, Königin Camilla (75), nach London kommt. Seine Ehefrau und Kinder wird er aber nicht in seine alte Heimat mitbringen. Doch warum reisen Herzogin Meghan (41), sein Sohn Archie (3) und seine Tochter Lilibet (1), nicht aus den USA mit nach England?'
to_nltk_tree(paragraph, lambda x: f"{x.text}_{x.lemma_}_{x.dep_}")

                                                                                                     hat_haben_ROOT                                                                                                                                                               
     ______________________________________________________________________________________________________|________________                                                                                                                                                       
    |             |                                                                                                  bestätigt_bestät                                                                                                                                             
    |             |                                                                                                      igen_oc                                              

[None, None, '\xa0_\xa0_dep', None]

In [17]:
sentence = 'Die Aggression habe der Stabilität einen Schlag versetzt, sagte Macron zu Xi.'
to_nltk_tree(sentence)

                            sagte_ROOT                                           
    ____________________________|_____________________________________________    
   |        |        |                     habe_oc                            |  
   |        |        |           _____________|____________                   |   
   |        |        |          |                     versetzt_oc             |  
   |        |        |          |              ____________|__________        |   
   |        |        |    Aggression_sb Stabilität_da             Schlag_oa zu_mo
   |        |        |          |             |                       |       |   
,_punct Macron_sb ._punct     Die_nk        der_nk                 einen_nk Xi_nk



[None]

In [18]:
spacy.explain('sb')

'subject'

In [19]:
def get_roots(string: str):
    return list([sent.root for sent in nlp(string).sents])
roots = get_roots(sentence)

In [20]:
quotation_verbs_raw = 'sagen meinen erzählen versichern erklären betonen mitteilen ankündigen'
quotation_verbs_doc = nlp(quotation_verbs_raw)
quotation_verbs = list(map( lambda t: t.lemma_, quotation_verbs_doc))
quotation_verbs

['sagen',
 'meinen',
 'erzählen',
 'versichern',
 'erklären',
 'betonen',
 'mitteilen',
 'ankündigen']

In [21]:
from functools import reduce
from operator import iconcat
from typing import List, Optional

def condition(node: Token, dep: str, whitelist: Optional[List[str]] = None) -> bool:
    return node.dep_ == dep and (whitelist is None or node.head.lemma_ in whitelist)

def get_nearest_tokens_with_dep(node: Token, dep: str, whitelist: Optional[List[str]] = None):
    # check current node
    if condition(node, dep, whitelist):
        return [node]
        
    # Return immediate childrens co's if available
    if dep in map(lambda n: n.dep_, node.children):
        return list(filter(lambda n: condition(n, dep, whitelist), node.children))
    
    # Recursion step (flatten result)
    return reduce(iconcat, [get_nearest_tokens_with_dep(n, dep, whitelist) for n in node.children], [])


print(get_nearest_tokens_with_dep(roots[0], 'oc', quotation_verbs))
print(get_nearest_tokens_with_dep(roots[0], 'sb'))

[habe]
[Macron]


In [22]:
from functools import reduce
from operator import iconcat

def flatten_tree(node: Token):
    def flatten_tree_(node: Token):
        return reduce(iconcat, [flatten_tree_(child) for child in node.children], [node])
    return sorted(flatten_tree_(node), key = lambda x: x.i)
                  
flattened = flatten_tree(roots[0])

In [23]:
flatten_tree(get_nearest_tokens_with_dep(roots[0], 'oc')[0])

[Die, Aggression, habe, der, Stabilität, einen, Schlag, versetzt]

In [24]:
def get_text_from_tree(node: Token):
    return "".join(map(lambda x: x.text_with_ws, flatten_tree(node))).strip()

In [25]:
from typing import Union

def get_subject_node(node: Token) -> Union[Token, None]:
    return get_nearest_tokens_with_dep(node, 'sb')[0]

def get_quote_node(node: Token) -> Union[Token, None]:
    return get_nearest_tokens_with_dep(node, 'oc', quotation_verbs)[0]

def get_subject(node: Token) -> Union[str, None]:
    return get_text_from_tree(get_subject_node(node))

def get_quote(node: Token) -> Union[str, None]:
    return get_text_from_tree(get_quote_node(node))


In [26]:
get_subject(roots[0])

'Macron'

In [27]:
from enum import Enum
from dataclasses import dataclass

class CitationType(Enum):          
    SYNTACTIC = 1
    FLOATING = 2

@dataclass
class Citation:
    position_in_text: int
    citation: str
    subject: str                 # der Bundesrat Berset
    citation_verb: str       # sagte, meinte, erklärte
    citation_type: CitationType
    
    def __init__(
        self,
        position_in_text: int,
        citation: str,
        subject: str,
        citation_verb: str,
        citation_type: CitationType
    ):
        self.position_in_text = position_in_text
        self.citation = citation
        self.subject = subject
        self.citation_verb = citation_verb
        self.citation_type = citation_type

In [28]:
type(roots[0])

spacy.tokens.token.Token

In [29]:
def get_syntactic_quote(node: Token) -> Citation:
    try:
        position_in_text = node.idx
        subject = get_subject(node)
        citation = get_quote(node)
        citation_verb = get_quote_node(node).head.text
        citation_type = CitationType.SYNTACTIC
        print(node.text)

        return Citation(position_in_text, citation, subject, citation_verb, citation_type)
    except IndexError as e:
        return None

get_syntactic_quote(roots[0])

sagte


Citation(position_in_text=58, citation='Die Aggression habe der Stabilität einen Schlag versetzt', subject='Macron', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>)

In [30]:
def get_syntactic_quotes_from_str(string: str):
    roots = get_roots(string)
    quotes = map(lambda r: get_syntactic_quote(r), roots)
    return list(filter(lambda x: x is not None, quotes))

get_syntactic_quotes_from_str("»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«, sagte Macron zu Xi.")

sagte


[Citation(position_in_text=102, citation='»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«', subject='Macron', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>)]

In [31]:
paragraph = """
»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«, sagte Macron zu Xi. »Ich weiß, dass ich auf Sie zählen kann, wenn es darum geht, Russland wieder zur Vernunft zu bringen und alle an den Verhandlungstisch zurückzuholen.«
"""

get_syntactic_quotes_from_str(paragraph)

sagte


[Citation(position_in_text=103, citation='»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«', subject='Macron', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>)]

In [32]:
article = """


Der französische Präsident Emmanuel Macron ist in Peking vom chinesischen Staatschef Xi Jinping mit militärischen Ehren empfangen worden. Vor gemeinsamen Gesprächen begrüßte Xi seinen Gast auf einem roten Teppich.

Macron sagte dem chinesischen Präsidenten Xi Jinping am Donnerstag, er wisse, dass er auf China zählen könne, um Russland zur Vernunft zu bringen und alle wieder an den Verhandlungstisch zu bringen.

»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«, sagte Macron zu Xi. »Ich weiß, dass ich auf Sie zählen kann, wenn es darum geht, Russland wieder zur Vernunft zu bringen und alle an den Verhandlungstisch zurückzuholen.«

Nach dem bilateralen Treffen zwischen Macron und Xi steht eine Dreierrunde mit EU-Kommissionschefin Ursula von der Leyen an. Darin soll es etwa um den Ukrainekrieg gehen. »Ich bin fest davon überzeugt, dass China eine wichtige Rolle bei der Schaffung von Frieden spielt«, erklärte Macron bei Twitter. Er wolle das bei seinen Gesprächen »diskutieren und vorantreiben«.

Auch wird erwartet, dass wirtschaftliche Themen zwischen China und der EU zur Sprache kommen. China sei von »großer Bedeutung für Europa«, sagte von der Leyen bei einem Gespräch mit dem chinesischen Ministerpräsidenten Li Qiang. Es gebe gegenseitige Abhängigkeiten und eine lange gemeinsame Geschichte, sagte von der Leyen. Zwar hätten China und die EU stark von ihrer gewachsenen Kooperation profitiert, doch seien die Beziehungen in den vergangenen Jahren »komplexer« geworden.

Bei einer Begegnung mit Parlamentspräsident Zhao Leji betonte Macron auch, welchen Einfluss der Ukraine-Krieg auf die Sicherheit und das globale strategische Gleichgewicht habe. Außerdem sei es wichtig, dass China internationale Abkommen rasch ratifiziere – etwa eines zur Biodiversität in der Hochsee, die Uno-Konvention zur juristischen Immunität von Staaten und ihren Gütern sowie die Uno-Konvention zu Bürgerrechten und politischen Rechten, teilte der Élysée-Palast mit.

"""

get_syntactic_quotes_from_str(article)

sagte
sagte
erklärte
sagte
betonte


[Citation(position_in_text=225, citation='er wisse, dass er auf China zählen könne, um Russland zur Vernunft zu bringen und alle wieder an den Verhandlungstisch zu bringen', subject='Macron', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>),
 Citation(position_in_text=520, citation='»Die russische Aggression in der Ukraine hat der (internationalen) Stabilität einen Schlag versetzt«', subject='Macron', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>),
 Citation(position_in_text=964, citation='»Ich bin fest davon überzeugt, dass China eine wichtige Rolle bei der Schaffung von Frieden spielt«', subject='Macron', citation_verb='erklärte', citation_type=<CitationType.SYNTACTIC: 1>),
 Citation(position_in_text=1200, citation='China sei von »großer Bedeutung für Europa«', subject='China', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>),
 Citation(position_in_text=1596, citation='welchen Einfluss der Ukraine-Krieg auf die Sicherheit und das g

In [33]:
sentence = "China sei von »großer Bedeutung für Europa«, sagte von der Leyen bei einem Gespräch mit dem chinesischen Ministerpräsidenten Li Qiang."
get_syntactic_quotes_from_str(sentence)

sagte


[Citation(position_in_text=45, citation='China sei von »großer Bedeutung für Europa«', subject='China', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>)]

In [34]:
to_nltk_tree(sentence)

                                          sagte_ROOT                                                                          
    __________________________________________|_______________________________________________                                 
   |       |                        |                              |                        bei_mo                            
   |       |                        |                              |                          |                                
   |       |                      sei_oc                           |                     Gespräch_nk                          
   |       |        ________________|_________                     |         _________________|_____________                   
   |       |       |        |               von_mo                 |        |                             mit_op              
   |       |       |        |                 |                    |        |                               

[None]

In [35]:
spacy.explain("nk")

'noun kernel element'

In [36]:
spacy.explain("mo")

'modifier'

In [37]:
print_dependency_diagram(sentence)

In [38]:
paragraphs = """
Präsident Wolodymyr Selenskyj hat nach seinem Besuch in Warschau betont, wie wichtig solche Zusammenkünfte für die Sicherheit seines Landes sind. »Die Verteidigung und der Schutz unseres Volkes, die Unterstützung unserer Widerstandsfähigkeit, insbesondere unserer Soldaten, ist das Thema Nummer eins bei allen Verhandlungen und Treffen«, sagte Selenskyj in seiner allabendlichen Videoansprache. Er dankte Polen für die Möglichkeit des Besuchs.

Polen gilt nach den USA als einer der größten Unterstützer der Ukraine bei der Verteidigung gegen Russland. Kiew hat eine Bestellung von Radschützenpanzern im Nachbarland Polen von 100 auf 150 Exemplare aufgestockt. Dies kündigte Polens Regierungssprecher Piotr Müller nach Angaben der Agentur PAP an. Die Panzer vom Typ KTO Rosomak sollen mit Hilfen der USA und der EU finanziert werden. Es handelt sich um eine Lizenzversion auf Basis des finnischen Militärfahrzeugs Patria AMV.

Zudem gab die Ukraine den Bau von mehr als 50 selbstfahrenden Mörsern des Typs M120 Rak (»Krebs«) in Auftrag. Geplant sei zudem die Lieferung von 100 Raketen für Kurzstrecken-Flugabwehrraketensysteme. Vor wenigen Wochen hatte Polens Präsident Andrzej Duda angekündigt, dass man der Ukraine Kampfjets vom Typ MiG-29 liefern werde. Bei Selenskyjs Besuch wurde er nun konkret: Die Ukraine habe von Polen bereits acht MiG-29 geliefert bekommen. Darüber hinaus würden derzeit noch sechs MiG-29 für die Übergabe vorbereitet, kündigte Duda an.

"""

get_syntactic_quotes_from_str(paragraphs)

sagte


[Citation(position_in_text=339, citation='»Die Verteidigung und der Schutz unseres Volkes, die Unterstützung unserer Widerstandsfähigkeit, insbesondere unserer Soldaten, ist das Thema Nummer eins bei allen Verhandlungen und Treffen«', subject='Selenskyj', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>)]

In [39]:
sentence = "Präsident Wolodymyr Selenskyj hat nach seinem Besuch in Warschau betont, wie wichtig solche Zusammenkünfte für die Sicherheit seines Landes sind. »Die Verteidigung und der Schutz unseres Volkes, die Unterstützung unserer Widerstandsfähigkeit, insbesondere unserer Soldaten, ist das Thema Nummer eins bei allen Verhandlungen und Treffen«, sagte Selenskyj in seiner allabendlichen Videoansprache. Er dankte Polen für die Möglichkeit des Besuchs."
print_dependency_diagram(sentence)

# Indirekte Rede

In [40]:
sentence = "Macron sagte zu Xi dass die Aggression der Stabilität einen Schlag versetzt habe."

In [41]:
get_syntactic_quotes_from_str(sentence)

sagte


[Citation(position_in_text=7, citation='dass die Aggression der Stabilität einen Schlag versetzt habe', subject='Macron', citation_verb='sagte', citation_type=<CitationType.SYNTACTIC: 1>)]

In [42]:
to_nltk_tree(sentence)

                        sagte_ROOT                                                
     _______________________|_________                                             
    |        |      |              habe_oc                                        
    |        |      |        _________|_____________________________________       
    |        |      |       |              Aggression_sb               versetzt_oc
    |        |      |       |          __________|_____________             |      
    |        |    zu_mo     |         |                  Stabilität_ag  Schlag_oa 
    |        |      |       |         |                        |            |      
Macron_sb ._punct Xi_nk  dass_cp    die_nk                   der_nk      einen_nk 



[None]

# 20min Artikel
https://www.20min.ch/story/frau-wird-von-auto-ueberrollt-meine-tochter-hat-sie-schreien-gehoert-839730623558

In [43]:
article = """
In der Nacht auf Samstag, um zirka 1.15 Uhr, wurde der Kantonspolizei Solothurn gemeldet, dass im Bereich der Kaselfeldstrasse in Bellach SO ein Auto von der Strasse abgekommen und ins dortige Wiesland gefahren sei. Beim Eintreffen der Polizei konnte das Auto in der Wiese angetroffen werden, ebenfalls vor Ort war der mutmassliche Fahrzeuglenker. Wie die Kapo SO mitteilt, lag unter dem Auto eine Frau, bei welcher nur noch deren Tod festgestellt werden konnte.

Die Polizei und die Staatsanwaltschaft Solothurn haben umgehend Ermittlungen zum Hergang und den Umständen eingeleitet. Nebst mehreren Patrouillen und Spezialdiensten der Kantonspolizei Solothurn, standen die Staatsanwaltschaft Kanton Solothurn, der Rettungsdienst, Angehörige der Feuerwehr Bellach, Angehörige der Kantonspolizei Bern, ein Institut für Rechtsmedizin, ein Care-Team und ein Abschleppunternehmen im Einsatz.

Personen, die sachdienliche Angaben zu diesem Ereignis machen können, werden gebeten, sich mit der Kantonspolizei Solothurn in Verbindung zu setzen, Telefon 032 627 70 00.

Ein Anwohner sagt gegenüber 20 Minuten: «Meine Tochter ist nachts aufgewacht, weil sie eine Frau schreien gehört hat.»  
"""

get_syntactic_quotes_from_str(article)

sagt


[Citation(position_in_text=1075, citation='«Meine Tochter ist nachts aufgewacht, weil sie eine Frau schreien gehört hat', subject='Ein Anwohner', citation_verb='sagt', citation_type=<CitationType.SYNTACTIC: 1>)]

In [44]:
article = """
Wie das Portal «Walliser Bote» berichtet, ist die Lawine am Samstagmorgen im Saastal im Gebiet «Alphubel» niedergegangen. Die Kantonspolizei Wallis spricht auf Anfrage von 20 Minuten von einem «grossen Lawinenniedergang», derzeit läuft ein Grosseinsatz. Es stünden fünf Helikopter und die Feuerwehr im Einsatz, so die Kantonspolizei. «Wir wissen nicht, ob und wenn ja, wie viele Leute verschüttet wurden», sagt ein Sprecher.

Die Nachrichtenagentur DPA berichtet, dass die Lawine ausserhalb der markierten Piste abgegangen sei. Es habe zunächst keine Vermisstenmeldungen gegeben, möglich sei aber, dass vier oder fünf Personen verschüttet wurden. Zwei Personen hätten ohne grössere Verletzungen befreit werden können, berichtet die Polizei.
"""


get_syntactic_quotes_from_str(article)

sagt


[Citation(position_in_text=407, citation='«Wir wissen nicht, ob und wenn ja, wie viele Leute verschüttet wurden»', subject='ein Sprecher', citation_verb='sagt', citation_type=<CitationType.SYNTACTIC: 1>)]

In [45]:
article = """
Sieben Menschen haben ihr Leben bei einem Verkehrsunfall am vergangenen Samstag in Thüringen (D) verloren. Unter den Todesopfern befinden sich fünf 19-Jährige, die in ihrem Wagen verbrannten. Neben den Teenagern im Mercedes starben der 60-jährige Fahrer des VW und ein Insasse des BMW. Nun gibt es neue Erkenntnisse, wie der Unfall ablief.

Laut der «Bild»-Zeitung soll der betrunkene 34-jährige Unfallfahrer, der zuerst für den Beifahrer gehalten wurde, den BMW privat geliehen haben und damit in der langgezogenen Linkskurve nach rechts von der Fahrbahn abgekommen sein. Der Fahrer soll dann damit reagiert haben, dass er nach links gelenkt hatte, und geriet dadurch auf die Gegenfahrbahn, auf der er in den entgegenkommenden Mercedes raste. Das Fahrzeug ging in Flammen auf, fünf Teenager sind gestorben. 

Hinter dem Mercedes folgte ein 60-Jähriger mit seinem VW Caddy. Er konnte nicht mehr bremsen und krachte in der Folge in den Mercedes, auch der VW fing Feuer und der Fahrer verstarb. Die 73-jährige Beifahrerin konnte sich aus dem Wrack retten und überlebte mit einem Rippenbruch, Nackenschmerzen und einer Brandverletzung an der Hand. 

Weshalb der Mercedes sofort in Brand geriet, ist bisher nicht bekannt. Laut der «Bild» fing der VW Feuer, da der Tank abgerissen wurde und sich das Benzin entzündete. Der Unfallverursacher, der ohne Führerschein unterwegs war, schwebt noch immer in Lebensgefahr. Sein 45-jähriger Beifahrer überlebte den Crash. Ein 44-Jähriger in dem BMW starb. Der Besitzer des geliehenen BMW könnte eine Strafe erwarten. «Derjenige, der ein Fahrzeug verleiht, kann sich strafbar machen, wenn er sich nicht vergewissert, dass derjenige auch eine Fahrerlaubnis besitzt, an den das Fahrzeug verliehen wird», sagt der stellvertretende Leiter der Staatsanwaltschaft Mühlhausen gegenüber der «Bild». Es müsse nun geprüft werden, ob ein «Gestatten des Fahrens ohne Fahrerlaubnis» vorliege. 
"""

get_syntactic_quotes_from_str(article)

sagt


[Citation(position_in_text=1738, citation='«Derjenige, der ein Fahrzeug verleiht, kann sich strafbar machen, wenn er sich nicht vergewissert, dass derjenige auch eine Fahrerlaubnis besitzt, an den das Fahrzeug verliehen wird»', subject='der stellvertretende Leiter der Staatsanwaltschaft Mühlhausen', citation_verb='sagt', citation_type=<CitationType.SYNTACTIC: 1>)]

In [46]:
article = """Mittlerweile wohnt Schenkel im Hotel Wartmann, beim Hauptbahnhof in Winterthur. «Ich muss den Gürtel enger schnallen, auch das Mietauto habe ich abgegeben», so der 70-Jährige. «Wenn ich bis dann keinen Job finde, muss ich in den sauren Apfel beissen und nach Berg am Irchel ziehen.» Dort habe er in einer Wohnung auch einen Grossteil seiner Sachen, unter anderem Familienerbstücke, wie das Inventar aus dem Restaurant Rossberg, wie der «Landbote» schreibt. «Es gibt da keine Infrastruktur, keine Läden, keine Bank und keine Post. Ich würde überschnappen.»"""
get_syntactic_quotes_from_str(article)

[]

In [47]:
to_nltk_tree(article)

                            wohnt_ROOT                                    
        ________________________|_________________________________         
       |             |          |         |         |          beim_mo    
       |             |          |         |         |             |        
       |             |          |         |       im_mo    Hauptbahnhof_nk
       |             |          |         |         |             |        
       |             |          |         |      Hotel_nk       in_mnr    
       |             |          |         |         |             |        
Mittlerweile_mo Schenkel_sb  ,_punct   ._punct Wartmann_nk  Winterthur_nk 

                                      70-Jährige_ROOT                                                                                               
   __________________________________________|___________                                                                                            
  |       |          

[None, None, None, None, None, None, '»_ROOT']