<a href="https://colab.research.google.com/github/TurkuNLP/gf_summerschool/blob/main/text_generation_example.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Text generation example

This is a brief example of how to run text generation with a Finnish GPT-3 model on Colab.

Install [transformers](https://huggingface.co/docs/transformers/index) python package. This will be used to load the model and tokenizer and to run generation.

In [1]:
!pip install --quiet transformers

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.4/7.4 MB[0m [31m40.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m268.8/268.8 kB[0m [31m19.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.8/7.8 MB[0m [31m28.9 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m26.3 MB/s[0m eta [36m0:00:00[0m
[?25h

Import the `AutoTokenizer` and `AutoModelForCausalLM` classes. These support loading tokenizers and generative models from the [Hugging Face repository](https://huggingface.co/models).

In [2]:
from transformers import AutoTokenizer, AutoModelForCausalLM

Load a generative model and its tokenizer. You can substitute any other generative model name here (e.g. [other TurkuNLP GPT-3 models](https://huggingface.co/models?sort=downloads&search=turkunlp%2Fgpt3)), but note that Colab may have issues running larger models.

In [3]:
MODEL_NAME = 'TurkuNLP/gpt3-finnish-large'

tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)

Downloading (…)okenizer_config.json:   0%|          | 0.00/218 [00:00<?, ?B/s]

Downloading (…)/main/tokenizer.json:   0%|          | 0.00/6.23M [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/96.0 [00:00<?, ?B/s]

Downloading (…)lve/main/config.json:   0%|          | 0.00/562 [00:00<?, ?B/s]

Downloading pytorch_model.bin:   0%|          | 0.00/3.53G [00:00<?, ?B/s]

Here's a simple function to generate text using broadly reasonable parameters. For details on text generation using `transformers`, see e.g. [this tutorial](https://huggingface.co/blog/how-to-generate).

In [4]:
def generate(prompt, temperature=0.7, max_new_tokens=50):
    input = tokenizer(prompt, return_tensors='pt')
    output = model.generate(
        **input,
        do_sample=True,
        temperature=temperature,
        max_new_tokens=max_new_tokens,
        no_repeat_ngram_size=2,
    )
    return tokenizer.decode(output[0], skip_special_tokens=True)

A few generation examples. Note that re-running these generation examples will produce different outputs as `model.generate` is invoked with the `do_sample=True` parameter.

First, a simple sentence continuation:

In [5]:
print(generate('Suomen kieltä käsittelevien tekoälymenetelmien kehitykselle on keskeisen tärkeää, että'))

Suomen kieltä käsittelevien tekoälymenetelmien kehitykselle on keskeisen tärkeää, että tarjolla on riittävästi laadukasta, helposti saatavilla olevaa suomenkielistä aineistoa. Tässä hankkeessa tuotetaan suomen kielen opettamiseen ja oppimateriaalien luomiseen tarvittavia suomen kieltä käsitteleviä tekoälymenetelmiä, jotka ovat sovellettavissa sekä suomen että muiden kielten opetukseen. Hanke perustuu syksyllä 2011 toteutetussa pilotissa kehitettyihin suomen kieli


An example of one-shot classification:

In [6]:
prompt = """Onko seuraava lause positiivinen vai negatiivinen?
Lause: Täällä on erittäin hauskaa!
Vastaus: positiivinen

Onko seuraava lause positiivinen vai negatiivinen?
Lause: elokuva oli surkea!
Vastaus:"""

print(generate(prompt))

Onko seuraava lause positiivinen vai negatiivinen?
Lause: Täällä on erittäin hauskaa!
Vastaus: positiivinen

Onko seuraava lause positiivinen vai negatiivinen?
Lause: elokuva oli surkea!
Vastaus: negatiivinen

Jos olet nuori, lue tämä kirja, saat uuden näkökulman elämään ja opit käsittelemään ajatuksiasi ja tunteitasi uudella tavalla.
– J. K. Rowling –
Kun olet aikuinen, mieti, voisitko kokeilla tätä uutta, itsellesi sopivaa tapaa ja katso, onko


Note above that even if the model produces the right answer, it usually doesn't know to stop generation after the answer and attempts to predict a plausible continuation.