In [60]:
import pandas as pd
import numpy as np
import spacy

import torch
from transformers import pipeline, set_seed
from transformers import GPT2Tokenizer, GPT2Model
from transformers import AutoTokenizer, AutoModelWithLMHead

## Generators

In [55]:
# https://huggingface.co/gpt2/blame/main/README.md

In [65]:
generator = pipeline('text-generation', model='gpt2')
set_seed(42)

print( generator("Hello, I'm a language model,", max_length=30, num_return_sequences=1)[0]['generated_text'] ) 

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Hello, I'm a language model, I'm a problem solver in languages."

At the same time, she said we can understand an


In [66]:
tokenizer_en = GPT2Tokenizer.from_pretrained('gpt2')
model_en = GPT2Model.from_pretrained('gpt2')

In [67]:
text = "Replace me by any text you'd like."
encoded_input = tokenizer_en(text, return_tensors='pt')

### Polish

In [73]:
model_pl = AutoModelWithLMHead.from_pretrained('flax-community/papuGaPT2')
tokenizer_pl = AutoTokenizer.from_pretrained('flax-community/papuGaPT2')
#set_seed(42) # reproducibility

text = 'Największym polskim poetą był'
input_ids = tokenizer_pl.encode(text, return_tensors='pt')

In [75]:
sample_outputs = model_pl.generate(
    input_ids,
    do_sample=True, 
    max_length=10, 
    top_k=50, 
    top_p=0.95, 
    num_return_sequences=1
)

print( tokenizer_pl.decode(sample_outputs[0], skip_special_tokens=True) )

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Największym polskim poetą był Czesław Bielecki.


In [77]:
def return_generated_text(text, n_len=10, tokenizer=tokenizer_pl, model=model_pl):
    input_ids = tokenizer.encode(text, return_tensors='pt')
    
    sample_outputs = model.generate(
        input_ids,
        do_sample=True, 
        max_length=n_len, 
        top_k=20, 
        top_p=0.95, 
        num_return_sequences=1
    )
    
    print( tokenizer.decode(sample_outputs[0], skip_special_tokens=True) )

In [79]:
text = """Nad rzeczką opodal krzaczka
Mieszkała kaczka-dziwaczka,
Lecz zamiast trzymać się rzeczki
Robiła piesze wycieczki.\n"""

return_generated_text(text, 100)

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Nad rzeczką opodal krzaczka
Mieszkała kaczka-dziwaczka,
Lecz zamiast trzymać się rzeczki
Robiła piesze wycieczki.
Nagle usłyszała odgłos kroków. Odgłos zbliżającej się ku nią kobiety. Nie było jej. Stanęła na
W tej samej chwili, kiedy poczuła, że jej serce bije, na jej twarzy pojawiło się
się małe czerwone, jakby z zaschniętych łez. Nie zdążyła nawet podnieść wzroku, zanim ujrzała
Ach
