<a href="https://colab.research.google.com/github/andjoer/AI_color_grade_lut/blob/master/colabs/gpt2_inference.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Inference of gpt2 models with different finetuning
The original model had been trained on a german text corpus:https://huggingface.co/benjamin/gerpt2-large
This model then had been finetuned on works from Immanuel Kant https://korpora.zim.uni-duisburg-essen.de/kant/verzeichnisse-gesamt.html resulting in Anjoe/kant-gpt2-large.
The original model also had been finetuned on german poetry from projekt gutenberg https://www.projekt-gutenberg.org/ resulting in Anjoe/german-poetry-gpt2-large.
These models are now tested on four different input prompts: Only one word ('Der'), a text from a wikipedia article, a text from Immanuel Kant and a poem. 
It can be observed that the orignal model is quite adaptive. The model trained on texts from Kant is not able to produce poetry anymore. Both, the Kant and the poetry model are only hardly influenced by the topic of the wikipedia article, although they are. 



In [1]:
!pip install transformers

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting transformers
  Downloading transformers-4.22.1-py3-none-any.whl (4.9 MB)
[K     |████████████████████████████████| 4.9 MB 5.0 MB/s 
Collecting tokenizers!=0.11.3,<0.13,>=0.11.1
  Downloading tokenizers-0.12.1-cp37-cp37m-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (6.6 MB)
[K     |████████████████████████████████| 6.6 MB 72.6 MB/s 
Collecting huggingface-hub<1.0,>=0.9.0
  Downloading huggingface_hub-0.9.1-py3-none-any.whl (120 kB)
[K     |████████████████████████████████| 120 kB 79.4 MB/s 
Installing collected packages: tokenizers, huggingface-hub, transformers
Successfully installed huggingface-hub-0.9.1 tokenizers-0.12.1 transformers-4.22.1


In [6]:
from transformers import pipeline
from transformers import GPT2Tokenizer, GPT2LMHeadModel

def gpt2_generate(input_text,model_name, max_length= 256, num_return_sequences=1):
    generator = pipeline('text-generation', model=model_name,
                 tokenizer=model_name, framework = 'pt')

    generated = generator(input_text, max_length=max_length,return_full_text = False, num_return_sequences=num_return_sequences)
    
    return [item['generated_text'] for item in generated][0]

def generate_texts(model_name,prompts):
  for key in prompts:
      print('#######')
      print('output for prompt '+ key)
      print(gpt2_generate(prompts[key],model_name))
      
one_word = 'Der'

wikipedia = '''Starke KI wären Computersysteme, die auf Augenhöhe mit Menschen die Arbeit zur Erledigung schwieriger 
Aufgaben übernehmen können. Demgegenüber geht es bei schwacher KI darum, konkrete Anwendungsprobleme zu meistern. 
Das menschliche Denken und technische Anwendungen sollen hier in Einzelbereichen unterstützt werden. Die Fähigkeit zu 
lernen ist eine Hauptanforderung an KI-Systeme und muss ein integraler Bestandteil sein, der nicht erst nachträglich 
hinzugefügt werden darf. Ein zweites Hauptkriterium ist die Fähigkeit eines KI-Systems, mit Unsicherheit und probabilistischen
Informationen umzugehen. Insbesondere sind solche Anwendungen von Interesse, zu deren Lösung nach allgemeinem''' # Quelle: https://de.wikipedia.org/wiki/K%C3%BCnstliche_Intelligenz#Starke_und_schwache_KI

kant = '''Und hier mache ich eine Anmerkung, die ihren Einfluß auf alle nachfolgende	 	 	 
Betrachtungen erstreckt, und die man wohl vor Augen haben	 	 	 
muß, nämlich: daß nicht eine jede Erkenntniß a priori, sondern nur die,	 	 	 
dadurch wir erkennen, daß und wie gewisse Vorstellungen (Anschauungen	 	 	 
oder Begriffe) lediglich a priori angewandt werden oder möglich sind,	 	 	 
transscendental (d. i. die Möglichkeit der Erkenntniß oder der Gebrauch	 	 	 
derselben a priori) heißen müsse. Daher ist weder der Raum, noch irgend	 	 	 
eine geometrische Bestimmung desselben a priori eine transscendentale	 	 	 
Vorstellung, sondern nur die Erkenntniß, ''' # Quelle: https://korpora.zim.uni-duisburg-essen.de/kant/aa03/078.html

poesie = '''Kein Wesen kann zu nichts zerfallen!
Das Ewge regt sich fort in allen,
Am Sein erhalte dich beglückt!
Das Sein ist ewig: denn Gesetze
Bewahren die lebendgen Schätze,
Aus welchen sich das All geschmückt. ''' # Quelle: https://www.projekt-gutenberg.org/goethe/gedichte/chap420.html

prompts = {'one word (Der)':one_word,
    'wikipedia': wikipedia,
              'kant':kant,
              'poesie':poesie}

In [7]:
generate_texts('benjamin/gerpt2-large',prompts)

#######
output for prompt one word (Der)


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


, der als letzte zu einem neuen Platz reist, muss mit leeren Händen zurückkehren, da er im letzten Turnier keine Rolle hatte.
Der beste Spieler (im Sinne der Ranglistenwertung), der in diesem Turnier keinen einzigen Treffer erzielt, scheidet aus.
1) Die Spieler des zweiten Durchgangs erhalten die Punkte des ersten Durchgangs nicht auf ihre Konten, sondern auf das eines Partners.
2) Die Spieler der ersten Runde, die aufgrund ihrer Platzierung in der Rangliste in den letzten drei Durchgängen keinen einzigen Treffer erzielen, werden in den letzten drei Durchgängen nicht berücksichtigt.
3) Die Punkte für den letzten Durchgang (im Sinne der Ranglistenwertung vom Vortag) werden jedem Ranglistenspieler gutgeschrieben, der eine zweite Runde spielt.
4) Die Ranglistenpunkte werden nicht auf die Konten der Spieler der ersten Runde (im Sinne der Ranglistenwertung vom Tage nach dem ersten Durchgang) gutgeschrieben. Sie werden allen Ranglistenspielern in der Ranglistenwertung gutgeschrieben.
5) Die 

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


 wissenschaftlichen 
Die technischen Grundlagen der KI liegen bislang nicht vor. Es wird jedoch erwartet, dass diese Basis künftig durch 
sich der Mensch der technischen Herausforderung stellen muss und die Möglichkeiten der KI-Systeme verbessern muss, um
die Anforderungen an die menschliche Intelligenz zu unterstützen.
Ein weiteres zentrales Ziel von KI ist die Erhöhung der Produktivität der Arbeitswelt, insbesondere im industriellen Umfeld.
Eine KI-basierte Lösung ist ein Werkzeug, das die menschliche Arbeitsleistung bestmöglich unterstützt, um eine kontinuierliche 
Verbesserung der Produktivität zu erwirken.
Ziel der Förderung des Aufbaus eines Netzwerkes von ITI-ExpertInnen ist es, die bestehenden KI-Dienste in den Bereichen 
Technologie
#######
output for prompt kant


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


 oder zumindest die Möglichkeit der Benutzung eines
mit diesen Konstruktionen und Gedankenweisen zu tun haben.
d. i. eine Vorstellung von einem Raum, die nur eine a priori Anwendung haben
können. Im Unterschied zu den a priori Vorstellungen und den a priori Ideen wird die Vorstellung
von einem Raum dann
#######
output for prompt poesie


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


 [1701]
Sehet, mit wem ihr es zu tun habt:
Sehet, mit wem es zu tun hat
(Er) war einer von dem Großen,
Und in jedem Reiche des Alls. [1701]
Mit Recht und Gerechtigkeit in ihm erfüllt. [1701]
Die der Mensch braucht und begehrt. [1701]
Der Tag der Auferstehung hat sich offenbart, ein Tag, wie keiner, wie keiner vorher, war und sein soll.  [1702]
Und der Herr ist gnädig, ewiglich,
Der Mensch aber wird nicht mehr, wie er ist,
Mit der Zeit wird das Reich der Himmel
Alles so geschehen, wie es der Herr will.  [1703]
Denn das Ewge sorgt für alle, die ihn ehren
Und ist es um der Wahrheit willen
Sonnig ist der Tag und die Sonne
und der Mond hell und freundlich.
Es ist das Zeichen der Menschen,
So ist es auch


In [12]:
generate_texts('Anjoe/kant-gpt2-large',prompts)

#######
output for prompt one word (Der)


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


, der das Dasein der Dinge bloß vom Verstande als abhängig betrachtet, muß nach demjenigen, was von ihm nach seinem Urtheil die Wirklichkeit der Gegenstände abhängen müsse, d. i. nach seiner Beschaffenheit (z. B. seiner Empfänglichkeit für den Willen) und nicht nach seinem Verhältniß zum Gefühl der Lust oder Unlust, handeln. Eine bloß intellectuelle (physische) Ursache muß zur Causalität angenommen werden, nicht aber eine intellectuelle, welche auf das Gefühl der Lust oder Unlust, das nicht unmittelbar durch den Verstand, sondern mithin durch den Einfluß der Sinnlichkeit auf die Urtheilskraft Einfluß haben würde, folgte, wobei die Eintheilung der Causalität in Ansehung der Causalität des Verstandes dann freilich auf Erscheinungen eingeschränkt bleiben müßte. Eine solche Causalbestimmung aus Principien der Sinnlichkeit, als auf Erfahrungsbedingungen (diese mögen nun der Willkür überlassen bleiben) gegründet, z. B. daraus, daß ein Ding für sich selbst existire, konnte nur in einer intell

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


 Princip viel Erfahrung erforderlich ist; z. B. wenn es darum zu thun ist, mit Ungewißheit den Zustand des Weltbaues zu erforschen; aber auch alle andere für die Wissenschaft so wichtigen Aufgaben. Das Überschwengliche gehört zu den wesentlichen, obgleich nur particularen Aufgaben, und die Unmöglichkeit, sich auch nur einen bestimmten Begriff davon zu machen, macht noch lange nicht, daß eine solche Idee unmoglich sei. Nur die Schwierigkeit, die mit diesen Aufgaben verbunden ist, macht, daß wir mit ihrer Auflösung nicht früher als nach einer gewissen Zeit zufrieden sein können. Eine sehr große Schwierigkeit ist, das Ganze unter dem Bedingten
#######
output for prompt kant


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


eim Ganzes gegebener Vorstellungen zu einem Begriffe. Ein Raum ist nichts anders, als die bloße Form des äußeren äußerlichen Verhältnisses äußerer Dinge oder in Ansehung dessen, was da ist, das Mannigfaltige dessen, was im Raume und überhaupt in demselben gedacht ist. Er ist nicht eine Anschauung,
#######
output for prompt poesie


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


sten Nov.. Ein Wesen, dem sich das All geziemt. Gott heißt die Welt regiren. Gott hat das Buch der Rache gelesen die den Weltmisogyn in sich giebt; jetzt ist es an der Zeit seiner Majestät gewahr zu werden. Er hat dem Kinde gesagt es soll künftig Rache nehmen an dem Tode dessen, der seinem Loose Gewalt giebt. Er hat ihm die Herrschaft über die Wolken gegeben. Der Mensch sollte ihn haßt Gott heißen weil er nicht lieben kann. Die Natur hat uns zwar eine ungemeine Macht gegeben, aber wir sind ihrer nicht gewiß und haben die Unbegreiflichkeit von dem was sie vermag. Wir werden auch immer unerfahren bleiben aber wir erkennen doch durch die Natur die Gesetze der Handlungen Gott will in uns wohnen. Das System des Pradicats nach dem Tode ist eine Lüge Er hat zu uns nicht gnug gnug Gewalt den Willen einzuschränken, noch kan er seine Herrschaft über uns ertheilen bis wir diese Gewalt uns erschlichen haben.


In [10]:
generate_texts('Anjoe/german-poetry-gpt2-large',prompts)

#######
output for prompt one word (Der)


Downloading:   0%|          | 0.00/1.06k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/3.13G [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/795 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/869k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/527k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/2.25M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/387 [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


 nicht mit Worten, nicht mit Blicken,
Mit sanfter Hand den Abschied gibt,
Der, wo er Abschied nimmt, nicht weint,
Und wo die Tränen still verrinnen.
Ihr Deutschen, seid ihr auch so treu?
Habt ihr euch auch eingefunden
In den Jubel, der gedämpft erschallt?
Ich habe nichts dagegen einzuwenden,
Wenn sich Christen zum Christenturm
Vom Staub der Erde hoch erheben,
Und wenn die Glocken himmelwärts
Verkünden ihren Jubelklang.
Wie mancher wird dann aus seiner Kluft
Die Brüder ziehen und den Herrn
Im Licht und über den Wolken loben.
Wie mancher kommt und singt dann: Heil dem Mann,
Der in die Fremde mußte ziehen!
Heil jedem Mann, der die Not gesehen!
Ja, ja, ihr andern, seid ihr auch so treu?
Habt ihr alles, alle, alles ausgehalten?
Wie manches wird verzweifelnd sich erheben,
Wenn er schaut, wie wir zur Heimat ziehen.
Und zitternd geht er dann in die Arme,
Wenn er sieht, wie wir zur Heimat gehn.
Und was er weint, das drückt er schüchtern
In die Hände bloß.
Und in den letzten Tränen spricht er le

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


 Erkenntnisstand
noch keine allgemein akzeptierte Lösung zur Verfügung steht. 
Darüber hinaus sind von Bedeutung:
Im Unterschied zu diesen beiden sind schwache
Anwenderinteraktionen
nicht so empfindlich wie starke, denn sie haben nicht die probabilistischen
Eigenschaften starker Systeme. Sie können nicht mit sicherem Wissen
über die Zukunft handeln, denn es kann
nicht vorausberechnet werden:
aber es kann mit sicherem Wissen
voraberkannt werden, ob
sie auch wirklich so kommt,
wie wir es uns gedacht.
So schwache Anwenderinteraktionen
lösen zwar oft auch probabilistische Dinge,
aber wir wissen aus unseren Gründen,
#######
output for prompt kant


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



ob und wenn ja, wie solche Vorstellung 
ausüben könnnen oder auch nicht vermag, dies sei im Rahmen dieser Praxistipps  aufs Allerliebstste erklärt  
aufgrund von Vorstellung garnicht 
zu nennen, oder zu erfahren wäre.
Dies hat den großen Vorteil, daß man von Anbeginn
#######
output for prompt poesie


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.




Das Sein ist Wahrheit! Sei dein Wesen
Der Wirklichkeit Wirklichkeit werden!
Die Widerlegung heißt: es sei!
Nur so kannst du der Seele Sinn
An ihrer Wirklichkeit binden.
Nur so ist sie bereit zu retten
Aus Irrthum, Wahn und Fesselbande,
Nur so kann sie dem All sich nahn,
Und es ihr bringen, was es liebt.
Dann lebt und atmet sie in Eintracht,
Kein Widerstreit ist fortan,
Und keine Trennung trübe die Lieb,
Kein Mißklang der himmlischen Mächte
Hebbt sie je aus ihrem Frieden!
Wie kannst du der Wahrheit Kern entsiegeln,
Wenn du sie nicht kennst? Dich fassen
Im höchsten, tiefsten Innern?
Sieh, dieses soll dir Versuchung scheinen:
Auf Erden
Irreth, Wahn und Trug und Bande weichen.
Zuviel ist genug getan,
Zu viel nur scheint uns genug.
Zuviel ist unser Streben,
Zuviel ist unser
