### Google Colaboratoryでりんなの大規模GPT-2(japanese-gpt-1b)を試してみる 

In [None]:
# Transformersのインストール
!pip install transformers

In [None]:
# SentencePieceのインストール
!pip install sentencepiece

In [None]:
# ライブラリのインポート
import torch
from transformers import T5Tokenizer, AutoModelForCausalLM

# トークナイザの読み込み
tokenizer = T5Tokenizer.from_pretrained("rinna/japanese-gpt-1b")

# モデル本体の読み込み
model = AutoModelForCausalLM.from_pretrained("rinna/japanese-gpt-1b")

# GPU使用時の設定
if torch.cuda.is_available():
    model = model.to("cuda")

In [None]:
# 入力文
text = "GPT-2のような文章生成モデルは、"

# 入力文のトークナイズ
token_ids = tokenizer.encode(text, add_special_tokens=False, return_tensors="pt")

# 入力文とパラメータの設定にしたがって文章を生成
with torch.no_grad():
    output_ids = model.generate(
        token_ids.to(model.device),
        max_length=100,
        min_length=100,
        do_sample=True,
        top_k=500,
        top_p=0.95,
        pad_token_id=tokenizer.pad_token_id,
        bos_token_id=tokenizer.bos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        bad_word_ids=[[tokenizer.unk_token_id]]
    )

# 生成された文章を単語IDから実際の単語に変換
output = tokenizer.decode(output_ids.tolist()[0])
print(output)