# Text Generation with GPT2

In [1]:
import torch
from transformers import TFGPT2LMHeadModel, GPT2Tokenizer, GPT2LMHeadModel

In [2]:
model_name = "cahya/gpt2-small-indonesian-522M"

In [4]:
tokenizer = GPT2Tokenizer.from_pretrained(f'{model_name}')

# add the EOS token as PAD token to avoid warnings
model = GPT2LMHeadModel.from_pretrained(f'{model_name}', pad_token_id=tokenizer.eos_token_id)

## Text Generation

In [5]:
input_sentences = [
    'Alkisah pada jaman dahulu kala seekor babi tengah melintas di sebuah hutan belantara. Babi hutan itu sedang merasa kehausan di tengah panasnya terik matahari',
    'Cirebon adalah sebuah kota kecil di Jawa Barat dengan keindahannya yang melebihi kota Bandung',
    'Sriwijaya adalah salah satu kemaharajaan bahari yang pernah berdiri di pulau Sumatra dan banyak memberi pengaruh di Nusantara dengan daerah kekuasaan yang luas',
    'Pantai berpasir putih ini cukup populer akhir-akhir ini karena menawarkan pemandangan yang begitu eksotis, indah dan mempesona',  
]

In [6]:
# We set the seed manualy for reproducible result
for i, sentence in enumerate(input_sentences):
    torch.manual_seed(1)
    input_ids = tokenizer.encode(sentence, return_tensors='pt')
    sample_output = model.generate(
        input_ids,
        do_sample=True, 
        max_length=150, 
        top_k=50, 
        top_p=0.95
    )
    print("Output:\n" + 100 * '-')
    print("{}: {}".format(i, tokenizer.decode(sample_output[0], skip_special_tokens=True)))

Setting `pad_token_id` to 50256 (first `eos_token_id`) to generate sequence
Setting `pad_token_id` to 50256 (first `eos_token_id`) to generate sequence


Output:
----------------------------------------------------------------------------------------------------
0: Alkisah pada jaman dahulu kala seekor babi tengah melintas di sebuah hutan belantara. Babi hutan itu sedang merasa kehausan di tengah panasnya terik matahari, karena itu ia pergi ke tengah hutan untuk mencari makanan. Kemudian ia kembali ke istana dan bertemu dengan seekor musang bernama Sang Hyang (Himala). Sang Hyang pun berjanji akan membiarkannya hidup sendirian. Sang Hyang pun pergi ke hutan untuk mencari makanannya. Setelah sampai di tengah hutan, Sang Hyang bertanya kepada istrinya, “ Wahai para dewa, aku akan menemukan makanan dan air yang dapat memenuhi kebutuhanmu. ” Sang Hyang kemudian menjelaskan mengapa sang dewi merasa haus darah dan kembali tertidur. Sang dewi marah dan tak sadarkan diri saat terbangun, tetapi Sang Hyang merasa ketakutan dan tertawa. Sang Hyang berteriak, ” "Bagaimana jika ia berada pada


Setting `pad_token_id` to 50256 (first `eos_token_id`) to generate sequence


Output:
----------------------------------------------------------------------------------------------------
1: Cirebon adalah sebuah kota kecil di Jawa Barat dengan keindahannya yang melebihi kota Bandung, seperti kota-kota di Jawa Barat yang lainnya. Di Kota Cirebon, kota ini menjadi pusat perdagangan antaretnis antarabangsa Asia-Arab maupun Arab-Indonesia. Selain itu Kota Cirebon dikenal sebagai kota industri.
Kota Cirebon memiliki banyak pelabuhan di sepanjang pantai utara Jawa dan Selat Sunda. Pelabuhan ini menghubungkan kota Cirebon dengan kota-kota lain di pulau Jawa. Kota Cirebon juga memiliki pelabuhan kapal laut di Selat Sunda, seperti Pelabuhan Banten dan Pelabuhan Lemahir di Laut Jawa. Pelabuhan Cirebon terdapat di kota Cirebon yang menghubungkan Pelabuhan Cirebon dengan Pelabuhan Pelabuhan Kalibagor (Pelabuhan Merak). Pelabuhan ini juga menjadi penghubung kapal terbesar untuk rute lintas samudera (kapal barang di Jawa. Pelabuhan Cirebon dikenal akan tiga pelabuhan


Setting `pad_token_id` to 50256 (first `eos_token_id`) to generate sequence


Output:
----------------------------------------------------------------------------------------------------
2: Sriwijaya adalah salah satu kemaharajaan bahari yang pernah berdiri di pulau Sumatra dan banyak memberi pengaruh di Nusantara dengan daerah kekuasaan yang luas, seperti kerajaan Melayu di pulau Sumatra dan Kesultanan Malaka di pulau Sumatra.
Pada awal abad ke-14 Sriwijaya membangun benteng pertamanya di pulau Bintan yang disebut " "Bataram Lama" ", yang disebut " "bataram", yang kemudian digantikan oleh pemerintahan "Mataram Lama" ". "Bataram Lama" menjadi ibukota " "tujuh belas kerajaan yang meliputi wilayah laut dan laut di seluruh Nusantara.
Dari catatan-catatan China yang diketahui dengan pasti Sriwijaya disebut di Prasasti Batu Gelang (atau "Batu Tulis"), Prasasti Padang Roco (nama lain dari Prasasti Batu Tulis), Prasasti Cindulungagung dan Prasasti Batu Barabai ), dan Prasasti
Output:
--------------------------------------------------------------------------------------