# GPT (Generative Pretrained Transformers) Workshop

Eine kurze Einführung in die Welt der Sprachmodelle und spezielle GPT-3. Wie können Sie die Welt verändern werden und wie funktionieren sie überhaupt?

In [2]:
import requests

def continue_text(text):
    r = requests.post(
        "https://api.deepai.org/api/text-generator",
        data={
            'text': text
        },
        headers={'api-key': 'quickstart-QUdJIGlzIGNvbWluZy4uLi4K'}
    )
    return r.json()['output']

In [5]:
continue_text('GPT is going to change the world as we know it.')

KeyError: 'output'

## Einführung Sprachmodelle

Sprachmodelle sind in ihrer einfachsten Form auf der Zählung von Wörtern.
Die Sprachmodelle können beliebig komplex werden, wenn Kontext berücksichtigt wird.
Als Kontext kann das vorherige Wort genutzt werden.
Bei Menschen erkennt man das häufig, wenn sie Sprichwörter ergänzen.
Auch bei Google sieht man es häufig bei der Vervollständigung von Suchanfragen.

In [6]:
text = '''Marcus currit Lucius currit Marcus et Lucius rident Lucius et Marcus rident'''

In [7]:
print(text.split(' '))

['Marcus', 'currit', 'Lucius', 'currit', 'Marcus', 'et', 'Lucius', 'rident', 'Lucius', 'et', 'Marcus', 'rident']


In [8]:
from collections import defaultdict
import random

def create_language_model(tokens):
    bigrams_language_model = defaultdict(list)
    for i in range(0, len(tokens)):
        bigrams_language_model[tokens[i-1]].append(tokens[i])
    return bigrams_language_model


def use_language_model(lm, token):
    return random.choice(lm[token])    

In [9]:
lm = create_language_model(text.split(' '))

In [14]:
token = 'Lucius'
text = ''
for i in range(5):
    text += token + ' '
    token = use_language_model(lm, 'Marcus')
print(text)

Lucius et rident rident currit 


Dieser Ansatz ist einfach, führt aber zu mehreren Problemen:
1. Alle Wörter müssen abgedeckt sein
1. Ergebnisse sind nicht immer grammatikalisch
1. Bias in den Daten
1. Man braucht **VIELE** Daten

![https://cheezburger.com/6432347136/a-lessen-n-gramr](https://i.chzbgr.com/full/6432347136/h5B3BDD4B/a-lessen-n-gramr "Language Model")

---

## GPT-3 im Speziellen

Was ist an GPT-3 besonders?
* Transformer Modell ([Attention is all you need](https://arxiv.org/abs/1706.03762) oder direkt selber machen mit [Tensorflow Transformers](https://www.tensorflow.org/tutorials/text/transformer))
* 175 Milliarden Parameter
* Spezialisierte fine-tuned Modelle für spezifische Tasks

### Wie wird GPT-3 erstellt?
1. Großen Textkorpus auswählen (300 Milliarden Wörter)
1. Word Embedding für Eingabe erstellen
1. Transformer Magic

(Animationen von https://jalammar.github.io/how-gpt3-works-visualizations-animations/)

#### 1. Textkorpus
Es gibt viele frei verfügbaren Datensätze, die genutzt werden können.
Wikipedia ist ein sehr sauberer Datensatz, der grammatikalisch korrekte Sätze enthält, während Twitter einen starken Bias hat und viele Fehler enthält.
Wenn große Datenmengen notwendig sind, wird häufig [Common Crawl](https://commoncrawl.org) verwendet.

#### 2. Word Embeddings
Word Embeddings sind eine gute Möglichkeit, um Wörter maschinell besser verarbeiten zu können.
Mit Word Embeddings werden Wörter als Vektoren dargestellt.
Ein häufig verwendetes Tool zum Erstellen von Embeddings ist [word2vec](https://github.com/tensorflow/tensorflow/blob/r1.1/tensorflow/examples/tutorials/word2vec/word2vec_basic.py) und [fastText](https://fasttext.cc).

![http://lifestyletrading101.com/word2vec-deep-learning/](https://i1.wp.com/lifestyletrading101.com/wp-content/uploads/2017/03/word2-vec-king-queen.png "Embeddings")

#### 3. Transformer Magic

#### Training
Für das Training wird das neuronale Netz mit existierenden Texten 'gefüttert' und immer das nächste Wort versucht zu erraten.
![https://jalammar.github.io/how-gpt3-works-visualizations-animations/](https://jalammar.github.io/images/gpt3/03-gpt3-training-step-back-prop.gif "Training")

#### Anwendung
Vereinfacht ist GPT-3 ein neuronales Netz, das als Input Text verwendet und als Output einen Vektor erzeugt, der in Text umgewandelt werden kann.
![https://jalammar.github.io/how-gpt3-works-visualizations-animations/](https://jalammar.github.io/images/gpt3/06-gpt3-embedding.gif "Ablauf")

---

## Use Cases mit GPT-3

Vereinfacht ist GPT-3 nur darauf trainiert, das nächste Wort vorherzsagen.
Dadurch ist das Sprachmodell ideal, um automatisch Texte zu generieren.
Allerdings ist noch so viel mehr möglich, wenn man den Use Case passend formuliert.

### React Code erzeugen
Programmcode ist nichts anderes als Text und damit kann GPT-3 zum Programmieren verwendet werden. (https://twitter.com/sharifshameem/status/1284421499915403264)

![https://jalammar.github.io/how-gpt3-works-visualizations-animations/](https://jalammar.github.io/images/gpt3/09-gpt3-generating-react-code-example.gif "React Code Example")


### Question Answering

In [15]:
import openai

stop = "\n"
prompt = """
Q: What is human life expectancy in the United States? 
A: Human life expectancy in the United States is 78 years.  
Q: Who was president of the United States in 1955? 
A: Dwight D. Eisenhower was president of the United States in 1955.  
Q: What party did he belong to? A: He belonged to the Republican Party.  
Q: Who was president of the United States before George W. Bush? 
A: Bill Clinton was president of the United States before George W. Bush.  
Q: Who won the World Series in 1995? 
A: The Atlanta Braves won the World Series in 1995.  
Q: What year was the first fax sent? 
A:"""

response = openai.Completion.create(engine="davinci", prompt=prompt, stop=stop, temperature=0)
print(response)

ModuleNotFoundError: No module named 'openai'

Leider kein API-Key...

Die Antwort von GPT-3 sollte sein:
**Q: What year was the first fax sent? A: The first fax was sent in 1843.**

### Use Cases von OpenAI
* Parsing von unstrukturiertem Text
* Stilistisches Verbessern von Texten
* Machine Translations
* Text to Bash

### DALL-E: Wie GPT-3 nur für Bilder

![https://openai.com/blog/dall-e/)](openai_dalle.jpg "Dall-E Beispiel")

---

# Offene Fragen
* Wird GPT-3 die Welt wirklich verändern?
* Wird sich programmieren, schreiben, ... verändern?
* Wird sich Beratung dadurch verändern?
* Können wir unseren Kunden einen Mehrwert mit GPT-3 anbieten?