# GPT (Generative Pretrained Transformers) Workshop

Eine kurze Einführung in die Welt der Sprachmodelle und spezielle GPT-3. Wie können Sie die Welt verändern werden und wie funktionieren sie überhaupt?

In [57]:
import requests

def continue_text(text):
    r = requests.post(
        "https://api.deepai.org/api/text-generator",
        data={
            'text': text
        },
        headers={'api-key': 'quickstart-QUdJIGlzIGNvbWluZy4uLi4K'}
    )
    return r.json()['output']

In [58]:
continue_text('GPT is going to change the world as we know it.')

'GPT is going to change the world as we know it. We\'ll fight hard to help the poor, and if we can do that, then so many more people will be working for it, too. It\'s a big fight I want to watch for."\n\nThe Obama administration has proposed a $500 million aid package for Haiti that would include $200 million to help fund community and migrant relief in the port town of Maizomba, a country that has seen devastating cyclone seasons over the last few years.'

## Einführung Sprachmodelle

Sprachmodelle sind in ihrer einfachsten Form auf der Zählung von Wörtern.
Die Sprachmodelle können beliebig komplex werden, wenn Kontext berücksichtigt wird.
Als Kontext kann das vorherige Wort genutzt werden.
Bei Menschen erkennt man das häufig, wenn sie Sprichwörter ergänzen.
Auch bei Google sieht man es häufig bei der Vervollständigung von Suchanfragen.

In [44]:
text = '''Marcus currit Lucius currit Marcus et Lucius rident Lucius et Marcus rident'''

In [45]:
print(text.split(' '))

['Marcus', 'currit', 'Lucius', 'currit', 'Marcus', 'et', 'Lucius', 'rident', 'Lucius', 'et', 'Marcus', 'rident']


## Einsatzmöglichkeiten von Sprachmodellen

In [46]:
from collections import defaultdict
import random

def create_language_model(tokens):
    bigrams_language_model = defaultdict(list)
    for i in range(0, len(tokens)):
        bigrams_language_model[tokens[i-1]].append(tokens[i])
    return bigrams_language_model


def use_language_model(lm, token):
    return random.choice(lm[token])    

In [47]:
lm = create_language_model(text.split(' '))

In [56]:
token = 'Lucius'
text = ''
for i in range(5):
    text += token + ' '
    token = use_language_model(lm, 'Marcus')
print(text)

Lucius currit et rident currit 


Dieser Ansatz ist einfach, führt aber zu mehreren Problemen:
1. Alle Wörter müssen abgedeckt sein
1. Ergebnisse sind nicht immer grammatikalisch
1. Man braucht **VIELE** Daten

## GPT-3 im Speziellen

Was ist an GPT-3 besonders?
* Transformer Modell [Arxiv Publikation zu Transfer Learning](https://arxiv.org/pdf/1910.07370.pdf)
* 175 Milliarden Parameter
* Spezialisierte fine-tuned Modelle für spezifische Tasks

### Wie wird GPT-3 erstellt?
1. Großen Textkorpus auswählen (300 Milliarden Wörter)
1. Word Embedding für Eingabe erstellen
1. Transformer Magic

(Animationen von https://jalammar.github.io/how-gpt3-works-visualizations-animations/)

### 1. Textkorpus

### 2. Word Embeddings
Word Embeddings sind eine gute Möglichkeit, um Wörter maschinell besser verarbeiten zu können.
Mit Word Embeddings werden Wörter als Vektoren dargestellt.
Ein häufig verwendetes Tool zum Erstellen von Embeddings ist [word2vec](https://github.com/tensorflow/tensorflow/blob/r1.1/tensorflow/examples/tutorials/word2vec/word2vec_basic.py) und [fastText](https://fasttext.cc).

![http://lifestyletrading101.com/word2vec-deep-learning/](https://i1.wp.com/lifestyletrading101.com/wp-content/uploads/2017/03/word2-vec-king-queen.png "Embeddings")

![https://jalammar.github.io/how-gpt3-works-visualizations-animations/](https://jalammar.github.io/images/gpt3/06-gpt3-embedding.gif "Ablauf")

## Sprachmodell im Eigenbau