# √úberblick √ºber Transformer und das Huggingface-Repository ü§ó 

## Transformer Allgemein

W√§hrend es Sprachmodelle auf der Basis rekurrenter neuronaler Netze im Prinzip schon seit Jahrzehnten gibt (das [LSTM-Paper](https://direct.mit.edu/neco/article/9/8/1735/6109/Long-Short-Term-Memory) ist von 1997), wurden Transformerarchitekturen, die auf einem sogenannten "Attention"-Mechanismen beruhen, erst 2017 vorgestellt. Das erste Paper trug den bezeichnenden Namen ["Attention is all you need"](https://arxiv.org/abs/1706.03762).  W√§hrend andere Architekturen, wie Convolutional Neural Nets oder Recurrent Neural Nets, sehr eing√§ngig sind und auch parallelen zu tats√§chlichen neuronalen Netzwerken im visuellen Cortex oder Pr√§frontalcortex aufweisen, muss man f√ºr Transformer etwas umdenken.  Einen sehr guten ersten √úberblick gibt das folgende, f√ºnfmin√ºtige [Video](https://www.youtube.com/watch?v=KN3ZL65Dze0). Eine der besten Einf√ºhrungen in die Details der Transformerarchitektur bietet der folgende [Blogpost](http://jalammar.github.io/illustrated-transformer/).

## Pre-Training und Transfer-Learning

Neben der neuen Transformerarchitektur war der zweite gro√üe Meilenstein, der zu dem enormen Erfolg der Transformer in der Sprachmodellierung und Textverarbeitung gef√ºhrt hat, der Einsatz von bestimmten so genannten "Pre-Training Tasks". Diese Aufgaben lassen ein Transformernetzwerk zun√§chst die statistische Struktur eines gro√üen Datensatzes, z.B. englischer Texte, lernen. Ein klassisches Beispiel f√ºr solch eine Aufgabe f√ºr rekurrente neuronale Netzwerke w√§re z.B. die Vorhersage des n√§chsten Zeichens oder Wortes in einer gegebenen Textsequenz. Solche - auch als "self-supervised tasks" bezeichneten - Aufgaben ben√∂tigen nur relativ leicht verf√ºgbare Trainingsdaten, da sie ohne arbeitsaufw√§ndige Annotationen durch Expertinnen auskommen. Das Ziel dieses Pretrainings ist es nicht, dass das Netzwerk direkt auf eine einzelne, spezifische Aufgabe, z.B. Textklassifikation, √úbersetzung, ... trainiert wird, sondern dass das Netzwerk in seinen tieferen Schichten sinnvolle Repr√§sentationen lernt, die man sp√§ter f√ºr viele verschiedene Aufgaben einsetzen kann. Die so vortrainierten Netzwerke kann man dann sp√§ter auf deutlich kleineren, anwendungs- und aufgabenspezifischen Datens√§ten nachtrainieren ("fine-tunen"). Dies wird als "Transfer-Learning" bezeichnet und senkt die Kosten, die eine einzelne Anwenderin aufbringen muss, um mit solchen Modellen zu arbeiten, drastisch. Denn das initiale Training eines gro√üen Sprachmodelles (oft mit mehreren hundert Millionen Parametern) auf gro√üen Textcorpora (meiste mehrere Millionen Worte) verschlingt [gigantische Rechen-(und damit nat√ºrlich auch Energie-, Zeit- und Geld-)ressourcen](https://arxiv.org/pdf/2004.08900.pdf). Im Gegensatz dazu ben√∂tigt das Nachtrainieren f√ºr spezifische Aufgaben meist nur wesentlich kleinere - daf√ºr aber annotierte - Datens√§tze und kann meist auf einzelnen Workstations innerhalb weniger Stunden bis Tage durchgef√ºhrt werden.

## BERT

Ein sehr erfolgreiches Beispiel eines so vortrainierten Transformernetzwerkes ist [BERT](https://ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html). W√§hrend fr√ºhere Transformerarchitekturen noch End-to-End auf spezifische Anwendungen trainiert wurden, wurde hier zum ersten mal mit einer sehr erfolgreichen Kombination aus zwei Pre-Training-Tasks gearbeitet, mit dem Ziel eine abstrakte Repr√§sentation der Texte zu lernen, auf deren Grundlage man verschiedenste Aufgaben l√∂sen kann. Bei der ersten Aufgabe handelt es sich um die "Masked-Language-Modelling" Task. Das klingt kompliziert, aber im Prinzip werden dem Netzwerk lediglich l√§ngere Textabschnitte pr√§sentiert, bei denen ein bestimmter Anzahl an Tokens (Textbausteine, je nach Modell k√∂nnen das einzelne Worte, Wortteile oder Buchstaben sein) durch L√ºcken ("Blanks") ersetzt wurden, genauso wie fr√ºher bei den L√ºckentexten in der Schule. Ziel des Netzwerkes war es, eine Wahrscheinlichkeitsverteilung zu lernen, die m√∂glichst gut die entfernten Tokens vorhersagt. Diese Task wurde mit einer zweiten Pretraining-Task kombiniert, bei der das Netzwerk zwei S√§tze pr√§sentiert wurden und es entscheiden musste, ob es sich dabei um zwei unabh√§ngig voneinander aus dem Trainingskorpus gezogene S√§tze, oder zwei aufeinanderfolgende S√§tze aus den Trainingscorpus handelt. Die Idee war, das Netzwerk so auch l√§ngere Abh√§ngigkeiten √ºber einzelne S√§tze hinweg lernen musste, um diese Aufgabe l√∂sen zu k√∂nnen. Wenn man nun eine konkrete Aufgabe mittels solcher Transformernetze l√∂sen m√∂chte, startet man nicht mehr bei Null, sondern kann sich f√ºr viele Sprachen z.B. ein vortrainiertes BERT-Modell herunterladen. F√ºr einen guten √úberblick √ºber BERT im speziellen, sehen sie sich das folgende f√ºnfmin√ºtige [Video](https://www.youtube.com/watch?v=zMxvS7hD-Ug) an. Eine detaillierte Einf√ºhrung in Bert gibt dieser [Blogpost](http://jalammar.github.io/illustrated-bert/). Ein konkretes Beispiel, mit dem wir in den n√§chsten Notebooks arbeiten werden, ist ein [deutsches, sogar bereits auf einer deutschen Frage-Antwort-Aufgabe __nachtrainiertes__ BERT-Netzwerk](https://huggingface.co/Sahajtomar/GBERTQnA). Dieses wurde zun√§chst auf einem gro√üen deutschen Textkorpus vortrainiert. Dieser umfasste ca. 163GB Texte aus der deutschen Wikipedia, weiteren Internetquellen, aber auch B√ºcher, Filmuntertitel oder juristische Fachtexte. Die Kosten des Trainings werden nicht angegeben, sollten sich aber mindestens im vierstelligen Bereich bewegen. Dieses [noch aufgabenunabh√§ngige Netzwerk](https://huggingface.co/deepset/gbert-large) wurde von den Entwicklern, einer Kollaboration von deepset.ai und der Bayerischen Staatsbibliothek M√ºnchen, √ºber das Huggingface-Repository (s.u.) frei zur Verf√ºgung gestellt.  Von dort wurde es heruntergeladen und auf einem Frage-Antwort-Datensatz nachtrainiert, der lediglich 5000 Trainingsbeispiele enthielt (je ein Tripel aus 1. einem Informationstext, 2. einer Frage, die anhand dieses Textes beantwortet werden soll, und 3. m√∂glichen korrekten Antworten), und wiederum vom Entwickler, Sahaj Tomar, [frei zur Verf√ºgung gestellt](https://huggingface.co/Sahajtomar/GBERTQnA). Auch hier wurden die Trainingskosten nicht beziffert, aber es ist nicht unrealistisch, so ein finetuning auf einer lokalen Workstation f√ºr einige bis einige hundert Euro durchzuf√ºhren.

## Das Huggingface Repository

In der Praxis der Sprachverarbeitung mit tiefen neuronalen Netzen spielt momentan das Huggingface-Repository eine gro√üe Rolle. Dieses Repository stellt √ºber das Python-Paket __transformers__ verschiedenste Transformerarchitekturen, die auf verschiedensten Datens√§tzen __vor-__ und zum Teil auch bereits auf konkrete Aufgaben __nachtrainiert__ wurden, sehr einfach zur Verf√ºgung. F√ºr einige, konkrete Anwendungen gibt es sogar bereits vorgefertigte __pipelines__. Diese Pipelines basieren auf Netzwerken, die bereits auf konkreten Aufgaben nachtrainiert wurden und __kapseln__ diese in einfach zu benutzende Funktionen, so dass sich die Anwenderin gar keine Gedanken mehr dar√ºber machen muss, welche Netzwerkarchitektur eigentlich genau im Hintergrund arbeitet, und wie die Inputs und Outputs f√ºr das Netzwerk eventuell vor- bzw. nachverarbeitet werden m√ºssen. Einige dieser Pipelines wollen wir uns in diesem Notebook ansehen. 

# Verschiedene h√§ufige Anwendungen von Transformermodellen

Im folgenden werden wir ihnen einige Anwendungsbeispiele zeigen, die die Vielfalt der momentan relativ einfach verf√ºgbaren und einsetzbaren transformerbasierten Sprachmodelle zeigen. Einen gro√üen Anteil an dieser "Einfachheit" hat das Huggingface (ü§ó) Repository, das eine Vielzahl von vortrainierten Transformernetzwerken, Datens√§tzen, sowie Funktionen zum einfachen Nachtrainieren oder Integrieren von Transformernetzwerken in eigene Projekte anbietet. Im folgenden werden wir eine kleine Tour durch die verschiedenen "Pipelines" von Huggingface machen, die "off-the-shelf"-Funktionalit√§t f√ºr verschiedene Aufgaben in Python bereitstellen. F√ºr weitergehende Informationen verweisen wir auf die [entsprechende Seite des Huggingface Repositories](https://huggingface.co/transformers/v3.0.2/task_summary.html).

## Aufgabe

- __Lesen sie die kurzen Einf√ºhrungstexte f√ºr jede Pipeline, f√ºhren sie dann die dazugeh√∂rige Codezelle(n) aus und achten sie auf die Input- und Outputtexte.__
- __Modifizieren__ sie die Inputtexte, die die Pipeline erh√§lt, in den entsprechenden Zellen
- Benutzen sie das __Miro-Board, welches in den geteilten Notizen im Hauptraum verlinkt ist__. __Notieren__ sie darin __Inputtexte__ und die entsprechenden __Netzwerk-Outputs__, bei denen die einzelnen Pipelines out-of-the-box:
    - __Erstaunlich oder beeindruckend gut__ funktioniert.
    - __√úberraschend schlecht__ funktioniert.
    - Oder Beispiele, bei denen sie den Output des Netzwerkes auf andere Weise __bemerkenswert oder witzig__ finden.
- Sammeln sie in dem __Miro-Board__ f√ºr die einzelnen Beispiele (ihre eigenen aber auch gerne f√ºr die ihrer Kommiliton*innen) __Ideen zu den folgenden Themen__:
    - __Woran__ die entsprechende Performance des Netzwerks liegen k√∂nnte.
    - Auf __welcher Art von Daten__ man eventuell __nachtrainieren__ k√∂nnte, um die schlechte Performance auf Negativbeispielen zu Verbessern.
    - Wie man die __Performance__ eventuell __verbessern__ k√∂nnte, in dem man um die Transformer-Pipeline herum zus√§tzlichen Code schreibt, der die __Netzwerk In- und Outputs vor bzw. nachverarbeitet__.

## Text Generation

### So einfach ist es mit ü§ó Transformers, einen l√§ngeren Text generieren zu lassen

Wundern sie sich beim ausf√ºhren der folgenden Codezellen nicht √ºber die Ladebalken. Sobald sie eine Pipeline zum ersten mal aufrufen, wird zun√§chst das entsprechende vortrainierte Modell einmal vom Huggingface-Repository heruntergeladen. 

<div class="alert alert-block alert-danger">
<span style="color:black"><b>Hinweis:</b> Ignorieren sie im folgenden die (so wie diese Box) rot hinterlegten Warnhinweise. Diese werden von der Pipeline automatisch generiert und dienen Entwicklern lediglich zur Fehlersuche.</span>
</div>


In [None]:
# Importiere das "Pipeline"-Modul der Huggingface "transformers" Bibliothek
from transformers import pipeline

# Erstelle einen "Textgenerator"
text_generator = pipeline("text-generation")

# Gibt einen Starttext vor (dreifache Anf√ºhrungszeichen erlauben es, 
# Zeichenketten √ºber mehrere Zeilen zu definieren)
prompt = """When Abraham Lincoln rose from his grave again during the 2025 Zombie apocalypse, he was very shocked to find out, that """

# Starte ein vortrainiertex Textmodell und generiere eine vorgegebene Anzahl 
# an "Tokens" (Textbausteine, das k√∂nnen je nach Modell W√∂rter, 
# Wortteile oder Buchstaben sein. Dar√ºber lernen sie im
# n√§chsten Notebook genaueres)
generate_length = 200
output = text_generator(prompt, max_length=generate_length)

# Gibt generierten Text aus
print(output[0]['generated_text'])

## Masked Language Modelling (a.k.a. "Fill-the-Blank")

Mit der ü§ó Transformers __fill-mask__ Pipeline ist es m√∂glich, eine Zeichenkette mit __einer__ L√ºcke vorzugeben, die von einem vortrainierten englischen Sprachmodell geschlossen wird.

Dazu muss man die L√ºcke innerhalb einer durch __f"__ und __"__ eingerahmten, vorgegebenen Zeichenfolge durch __{nlp.tokenizer.mask_token}__ kenntlich machen. Mit den Standardeinstellungen werden dann die f√ºnf komplettierten Zeichenketten ausgegeben, die das trainierte Sprachmodell f√ºr am wahrscheinlichsten h√§lt. Zudem erh√§lt man f√ºr jede komplettierte Zeichenkette einen "Score", der beziffert, f√ºr wie wahrscheinlich das trainierte Sprachmodell die entsprechende Vervollst√§ndigung h√§lt (h√∂her bedeutet wahrscheinlicher). Im Prinzip ist es diese Task, die auch f√ºr das Pre-Training von BERT-Modellen Verwendung findet.

In [None]:
from transformers import pipeline

nlp = pipeline("fill-mask")

# Der Input muss mit f" beginnen und mit " enden und
# eine "L√ºcke" enthalten, die durch {nlp.tokenizer.mask_token} markiert wird.
masked_string = f"Marsians looked very {nlp.tokenizer.mask_token}, when they found out that Elon Musk was going to move to their home."

output = nlp(masked_string)

# Mit den Standardeinstellungen werden 5 vorschl√§ge mit einem jeweiligen Score f√ºr ihre 
# Wahrscheinlichkeit generiert

for i in range(len(output)):
    print('Output Nr:')
    print(i)
    print('Text:')
    print(output[i]['sequence'])
    print('Score:')
    print(output[i]['score'])
    print()

## Summarization

Die Summarization-Pipeline erlaubt es, __Zusammenfassungen__ vorgegebener Texte zu erzeugen. Man gibt lediglich eine Zeichenkette vor, die den Text enth√§lt, der zusammengefasst werden soll. Dabei erlauben es die dreifachen Anf√ºhrungszeichen __""" ... """__ auch Zeichenketten √ºber mehrere Zeilen zu definieren. Des weiteren kann man noch die minimale und maximale L√§nge der Zusammenfassung in Tokens (Worte, Wortteile oder Buchstaben, je nach Modell) vorgeben. Als Output enth√§lt man eine Zeichenkette, die eine Zusammenfassung des Inputtextes enth√§lt.

In [None]:
from transformers import pipeline

summarizer = pipeline("summarization")

ARTICLE = """ Alan Mathison Turing OBE FRS (/Ààtj ä…ôr…™≈ã/; 23 June 1912 ‚Äì 7 June 1954) was 
an English mathematician, computer scientist, logician, cryptanalyst, philosopher, 
and theoretical biologist.[6][7] Turing was highly influential in the development 
of theoretical computer science, providing a formalisation of the concepts of algorithm 
and computation with the Turing machine, which can be considered a model of a 
general-purpose computer.[8][9][10] Turing is widely considered to be the father 
of theoretical computer science and artificial intelligence.[11]
Born in Maida Vale, London, Turing was raised in southern England. He graduated at 
King's College, Cambridge with a degree in mathematics. Whilst he was a fellow at 
Cambridge, he published a proof demonstrating that some purely mathematical yes‚Äìno 
questions can never be answered by computation and defined a Turing machine, and 
went on to prove the halting problem for Turing machines is undecidable. In 1938, 
he obtained his PhD from the Department of Mathematics at Princeton University. 
During the Second World War, Turing worked for the Government Code and Cypher 
School (GC&CS) at Bletchley Park, Britain's codebreaking centre that produced 
Ultra intelligence. For a time he led Hut 8, the section that was responsible 
for German naval cryptanalysis. Here, he devised a number of techniques for 
speeding the breaking of German ciphers, including improvements to the pre-war 
Polish bombe method, an electromechanical machine that could find settings for 
the Enigma machine. Turing played a crucial role in cracking intercepted coded 
messages that enabled the Allies to defeat the Nazis in many crucial engagements, 
including the Battle of the Atlantic.[12][13] Due to the problems of counterfactual 
history, it is hard to estimate the precise effect Ultra intelligence had on the war,
[14] but Professor Jack Copeland has estimated that this work shortened the war 
in Europe by more than two years and saved over 14 million lives.[12]
After the war, Turing worked at the National Physical Laboratory, where he designed 
the Automatic Computing Engine. The Automatic Computing Engine was one of the first 
designs for a stored-program computer. In 1948, Turing joined Max Newman's Computing 
Machine Laboratory, at the Victoria University of Manchester, where he helped develop 
the Manchester computers[15] and became interested in mathematical biology. He wrote 
a paper on the chemical basis of morphogenesis[1] and predicted oscillating chemical 
reactions such as the Belousov‚ÄìZhabotinsky reaction, first observed in the 1960s. 
Turing was prosecuted in 1952 for homosexual acts; the Labouchere Amendment of 1885 
had mandated that "gross indecency" was a criminal offence in the UK. He accepted 
chemical castration treatment, with DES, as an alternative to prison. Turing died 
in 1954, 16 days before his 42nd birthday, from cyanide poisoning. An inquest 
determined his death as a suicide, but it has been noted that the known evidence 
is also consistent with accidental poisoning.
Despite these accomplishments, he was never fully recognised in his home country 
during his lifetime because much of his work was covered by the Official Secrets 
Act. In 2009, following an Internet campaign, British Prime Minister Gordon 
Brown made an official public apology on behalf of the British government for 
"the appalling way he was treated". Queen Elizabeth II granted Turing a posthumous 
pardon in 2013. The "Alan Turing law" is now an informal term for a 2017 law 
in the United Kingdom that retroactively pardoned men cautioned or convicted 
under historical legislation that outlawed homosexual acts.[16] Turing has an 
extensive legacy with statues of him, many things named after him including an 
annual award for computer science innovations. He is due to appear on the Bank 
of England ¬£50 note, to be released in June 2021. A 2019 BBC series, as voted by 
the audience, named him the greatest person of the 20th century."""

# maximale L√§nge der Zusammenfassung
max_length = 130

# minimale L√§nge der Zusammenfassung
min_length = 30

output = summarizer(ARTICLE, max_length=max_length, min_length=min_length)

print(output[0]['summary_text'])

## Translation

Die __translation_en_to_de__ Pipeline erlaubt es, ihrem Namen entsprechend, englische Inputtexte in deutsche Outputtexte zu √ºbersetzen. Es gibt auch weitere Sprachkombinationen (__translation_en_to_fr__, __translation_en_to_ro__), mit denen sie neben der Ver√§nderung des Inputtextes experimentieren k√∂nnen.

__Beachten__ sie, dass nur einzelne S√§tze √ºbersetzt werden, d.h. dass die Inputzeichenkette nur bis zum ersten __Punkt "."__ verarbeitet wird.

In [None]:
from transformers import pipeline

translator = pipeline("translation_en_to_de")

english = """The Turing test, originally called the imitation game by Alan Turing in 1950,[2] is a test 
of a machine's ability to exhibit intelligent behaviour equivalent to, or indistinguishable from, that 
of a human; to this end, Turing proposed that a human evaluator would judge natural language conversations between a 
human and a machine."""

output = translator(english)

print('Englischer Text:')
print(english)
print('')

print('Deutsche √úbersetzung:')
print(output[0]['translation_text'])

## Extractive Question Answering (oft verk√ºrzt nur als Question Answering (QA) bezeichnet)

In dieser Aufgabe, mit der wir uns auch in den weiteren Notebooks des Workshops besch√§ftigen werden, geht es darum, eine Frage anhand eines bereitgestellten Textes zu beantworten. Dabei ist es die Aufgabe des Netzwerkes, die m√∂gliche Antwort auf die Frage innerhalb des sogenannten "Kontexts" zu finden und auszuschneiden (bzw. mit virtuellem Textmarker anzustreichen). D.h. die Ausgabe des Netzwerks besteht aus der wahrscheinlichsten Position einer m√∂glichen Antwort auf die gegebene Frage innerhalb des gegebenen Kontexts. Deshalb wird dieser Aufgabentyp auch als "Extractive Question Answering" bezeichnet, da es darum geht die Antwort aus einem vorgegebenen Textabschnitt zu extrahieren. Synonym wird auch die Bezeichnung "Reading Comprehension", also Leseverst√§ndnis, f√ºr diesen Aufgabentyp benutzt. 

__Beachte:__ Die Transformers __question-answering Pipeline__ gibt die entsprechend aus dem Kontext ausgeschnittene Antwort direkt als Zeichenkette aus.

In [None]:
from transformers import pipeline

nlp = pipeline("question-answering")

# Als "Kontext" wird ein Text bezeichnet, aus dem die Antwort auf eine gegebene Frage extrahiert werden soll.
# H√§ufig ist die Aufgabe, die Antwort auf eine Frage direkt aus diesem Kontext herauszuschneiden
# bzw. mit "Textmarker" anzustreichen. Damit ist gemeint, die Position der Antwort innerhalb
# des Kontextes auszugeben.

# Experimentieren sie mit Unterschiedlichen Textabschnitten und dazu (mehr oder weniger gut)
# passenden Fragen.
context = """Extractive Question Answering is the task of extracting an answer from a text given a question. 
An example of a question answering dataset is the SQuAD dataset, which is entirely based on that task. 
If you would like to fine-tune a model on a SQuAD task, you may leverage the 
examples/question-answering/run_squad.py script from the Huggingface transformer repository.
"""

frage1 = "What is extractive question answering?"
frage2 = "What is a good example of a question answering dataset?"

# Frage 1 anhand des gegebenen Kontexts beantworten
output_frage1 = nlp(question=frage1, context=context)

# Antwort auf Frage 1 ausgeben
print('Frage: ' + frage1)
print('Antwort: ' + output_frage1['answer'])
print('Gefunden im Kontext von Position %d bis Position %d!' % (output_frage1['start'], output_frage1['end']))
print('Score: %f' % output_frage1['score'])
print()

# Frage 2 anhand des gegebenen Kontexts beantworten
output_frage2 = nlp(question=frage2, context=context)

# Antwort auf Frage 2 ausgeben
print('Frage: ' + frage2)
print('Antwort: ' + output_frage2['answer'])
print('Gefunden im Kontext von Position %d bis Position %d!' % (output_frage2['start'], output_frage2['end']))
print('Score: %f' % output_frage2['score'])
print()

## Conversation

Eventuell haben sie die __conversation__-Pipeline schon im Rahmen der Chatbot-Notebooks kennen gelernt. Sie bietet eine recht komfortable M√∂glichkeit, ein auf zahlreichen Reddit-Konversationen vortrainiertes Sprachmodell mit wenigen Zeilen Code z.B. in eine eigene Chatbot-Logik einzubinden. Die Pipeline erlaubt es, mit einer Startnachricht (__conversation_start__) eine Konversation mit dem trainierten Transformermodell zu initialisieren und die entsprechende Antwort des Modells (bzw. die gesamte Konversation) auszugeben.

In [None]:
from transformers import pipeline, Conversation

conversational_pipeline = pipeline("conversational")

# Initialer Userinput
conversation_start = "Let's watch a movie tonight - any recommendations?"

# Initialisiere Konversation mit der Zeichenkette in
# conversation_start (erster Satz der Nutzer*in)
conversation = Conversation(conversation_start)

# Erzeuge Antwort des Sprachmodells und h√§nge die Antwort an die
# bisherige Konversation an
conversation = conversational_pipeline(conversation)

# Gib kompletten bisherigen Verlauf der Konversation aus
print(conversation)

In der folgenden Zelle, f√ºgen wir der Konversation den n√§chsten Userinput hinzu und lassen das Modell wieder darauf antworten.

In [None]:
# Antwort der Nutzer*in auf die bisherige Konversation
conversation_next = "What is it about?"

# F√ºgt Nutzer*innenantwort der Konversation hinzu
conversation.add_user_input(conversation_next)

# Erzeugt Antwort des Sprachmodells und f√ºgt diese 
# der laufenden Konversation hinzu
conversation = conversational_pipeline(conversation)

# Gibt bisherigen Konversationsverlauf aus
print(conversation)

In dem sie die Zeichenkette der obigen Zelle ver√§ndern und die Zelle immer wieder ausf√ºhren, k√∂nnen sie die Unterhaltung mit dem trainierten Sprachmodell fortsetzen. __Achten__ sie darauf, ob und wann die Konversation eventuell in eine Sackgasse l√§uft und wie sie das (nach __Neustarten der Konversation mittels der ersten Conversation-Codezelle__) eventuell verhindern l√§sst.

# Wie geht es jetzt weiter?

Wie sie hoffentlich selbst erfahren konnten, sind die Huggingface __pipelines__ so gut verpackt, dass man relativ einfach schon recht beeindruckende Ergebnisse erzielen kann, ohne sich √ºberhaupt gro√üe Gedanken √ºber die zu Grunde liegenden Sprachmodelle machen zu m√ºssen. Dies bedeutet jedoch auch, dass man als Anwenderin praktisch keine Kontrolle √ºber die genauen Vor- und Nachverarbeitungsschritte der Inputs und Outputs, sowie √ºber die genutzten Sprachmodelle hat. Aus diesem Grund werden wir uns im n√§chsten Notebook damit besch√§ftigen, wie man eine konkrete Aufgabe (deutsche Fragen anhand vorgegebener, deutscher Texte beantworten) mit Hilfe einer selbst gebauten Pipeline und vortrainierten Transformermodellen l√∂sen kann. Falls sie damit weitermachen m√∂chten, geht es im Notebook *02_Question_Answering_with_BERT.ipynb* weiter.