<a href="https://colab.research.google.com/github/yukinaga/llm_mechanism/blob/main/section_4/01_japanese_llm.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 日本語LLMの利用
2023年に公開された日本語LLM「OpenCALM」を使ってみましょう。

## ライブラリのインストール
OpenCALMが含まれるライブラリtransformersをインストールします。

In [None]:
!pip install transformers

## OpenCALMの設定

形態素解析のために`AutoTokenizer`を、訓練済みモデルの読み込みのために`AutoModelForCausalLM`を設定します。
今回は、パラメータ数が14億のモデル`cyberagent/open-calm-1b`を読み込みます。
https://huggingface.co/cyberagent

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("cyberagent/open-calm-1b")
model = AutoModelForCausalLM.from_pretrained("cyberagent/open-calm-1b")

## 最初の文章を設定
トークナイザーを使って、始まりの文章をモデルへの入力に変換します。


In [None]:
first_sentence = "遠い昔、はるか彼方の銀河系で"  # 始まりの文章
x = tokenizer.encode(first_sentence, return_tensors="pt", add_special_tokens=False)  # 入力

## 文章の生成
訓練済みのモデルに入力を渡します。
モデルの出力は、トークナイザーを使って文章に変換します。


In [None]:
y = model.generate(
    x,
    max_new_tokens=64,
    do_sample=True,
    temperature=1.2,
    top_p=0.9,
    repetition_penalty=1.05,
    pad_token_id=tokenizer.pad_token_id,
)

generated_sentence = tokenizer.batch_decode(y)
print(generated_sentence)