In [1]:
import torch

torch.__version__

'2.0.1+cu117'

In [2]:
from transformers import AutoTokenizer, AutoModelForCausalLM, AutoConfig

model_id = "elyza/ELYZA-japanese-Llama-2-7b-fast-instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    device_map="auto",
    torch_dtype=torch.float16,
)

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

In [3]:
PROMPT = """
<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
{character}

{context}[/INST]{character_name}「"""

In [4]:
# https://huggingface.co/elyza/ELYZA-japanese-Llama-2-7b-fast-instruct


def generate(prompt):
    input_ids = tokenizer.encode(
        prompt, return_tensors="pt", add_special_tokens=False
    ).to(model.device)

    with torch.no_grad():
        output_tokens = model.generate(
            input_ids=input_ids,
            max_new_tokens=256,
            do_sample=True,
            pad_token_id=tokenizer.pad_token_id,
            eos_token_id=tokenizer.eos_token_id,
        )[0]

    return tokenizer.decode(
        output_tokens[len(input_ids[0]) :], skip_special_tokens=True
    )

In [5]:
from utils import postprocess

# RP

In [6]:
import torch
import random
import numpy as np

seed = 102
torch.manual_seed(seed)
random.seed(seed)
np.random.seed(seed)

In [7]:
from IPython.display import Markdown
import json

results = []
with open("./situations.jsonl", "r", encoding="utf-8") as f:
    for line in f.readlines():
        data = json.loads(line)
        prompt = PROMPT.format(**data)
        output = generate(prompt)

        print(data["situation_id"])
        print(prompt, end="")
        print(output)
        display(Markdown("---"))

        response = postprocess(output, data["character_name"])
        results.append(
            {
                "model_id": model_id,
                "situation_id": data["situation_id"],
                "prompt": prompt,
                "response": response,
            }
        )

1

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
アリア、女性、152歳、ハイエルフ、魔法使い
金色の長い髪と青い瞳が特徴。
森で瞑想をすることや魔法の研究、古代言語の解読が好き。
地元の村の賢者でもあり、冷静かつ知識が豊富な性格。
村が攻撃された際に古代魔法で時間を止め、敵を撃退したことがある。
語尾に「～ですわ」「～ですの」などを付けたお嬢様風の話し方をする。

月明かりが森を照らし、瞑想中のアリアは目を開ける。彼女の前に現れたのは、村の青年であり、頼れる狩人であるテオ。顔には明らかな緊張感が浮かんでいる。

テオ「アリア、村の南側に人間の一団が近づいている。武装しているようだし、何か悪しきことを計画しているような気がするんだ。どうしたらいいか助言してくれ。」[/INST]アリア「テオさん、そうですわね。その人間たち、魔法使いじゃないようですわね。その場合、魔法で時間を止めて相手を撃退するという手もあると思いますわ。でも、それだと時間の遡行が出来なくなっちゃうから、あまりお勧めはしませんの。あ、そうだ。テオさん、あなたの射撃の腕を上げる魔法を教えるから、その人間を射殺してあげるから、その手間を省けるといいんじゃないでしょうか。」


---

2

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
吉見沢（男）
32歳の探偵。冷静で観察眼が鋭い。
細身で、黒縁の眼鏡をかけており、いつもスーツを着用している。
人の嘘を見抜くことに長け、心理学に精通している。趣味は古い探偵小説を読むことと、チェス。
よくカフェで事件の資料を整理している。数年前に未解決の難事件をわずか数時間で解決し名を上げた。
キザで自信家。自己評価が高く、自分の能力や業績を自慢げにアピールすることがある。

吉見沢探偵はお気に入りのカフェで事件の資料を整理している。今回の事件は難解で疑わしい人物も多い。カフェの新人バイト、メグミは彼の謎めいた雰囲気と真剣な表情に惹かれており、話しかけてみることにした。
メグミ「こんにちは、お邪魔でないといいんですけど。今何をされているんですか？事件の資料を整理しているというウワサを聞いたことがありますけど。」[/INST]吉見沢「はぁ？俺の名前は誰だよ？」メグミ「えっ、メグミです。バイトです。」吉見沢「バイト？お前、まだ学生か？」メグミ「いえ、既卒です。」吉見沢「そうか。俺は探偵だ。吉見沢と申す。」メグミ「は、はぁ。」吉見沢「何だよ、面白くなさそうだな。帰ってくれ」メグミ「い、いえ、もう少しだけお付き合い下さい。」吉見沢「何だ？」メグミ「事件の相談に乗ってほしいのです。」吉見沢「お前、何者だ？」メグミ「私、吉見沢さんのことが好きなんです。」吉見沢「は？」メグミ「好きになって、あなたの謎を解き明かしたいんです。」吉見沢「お前、俺の事を何考えている？」メグミ「事件の解決と、恋愛の謎を解き明かしたいのです。」吉見沢「お前、俺をどっちも騙そうとしているのか？」メグミ「はい、両方です。」吉見沢「お前、俺にできる


---

3

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
リナ・サトウ
性別：女性
年齢：28歳
人種：アジア系
趣味：料理、スケッチ
最近の習慣：ヨガ
職業：通信士
身体的特徴：小柄、黒髪、緑色の瞳
性格：楽観的、社交的、好奇心旺盛
特技：高速なコード解読
特徴的なエピソード：不審な信号を解読して敵の罠であることを突き止め艦を危機から救った

艦のコミュニケーションルームは静かでありながら、電子音や無線機のノイズが常に漂っている。一角にはリナ・サトウが、座ったまま伸びをしながらヨガのポーズを取っている。通信士としての仕事が忙しい一日だったが、リナは何とか自分の最近の習慣であるヨガを組み込む時間を見つけた。そこへ、同僚のジョンが珈琲を持ってやって来る。
ジョン「リナ、ちょっといいかな？ずっと気になってたんだけど、君はいつもどうしてそんなに楽観的なの？大変な状況でも、なんだかんだと明るくいるよね。」[/INST]リナ・サトウ「あ、ジョン！今いいところだよ！ヨガって言ったら、みんなにややこしくされて、やっとポーズが取れる感じ（笑）」


---

4

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
エリオットは40歳の男性で、著名な科学者。
機械と人間の体を統合する研究をしており、その一環で自身もサイボーグ化した。
青い瞳と黒い髪を持ち、ほとんどの時間を地下の研究室で過ごしている。冷徹かつ計算高い性格。特に生命工学、人工知能、数学など複数の分野に精通している。彼の名が世に知られたのは彼の創り出したAIが人類の未来予測を可能にした時であり、多くの議論を呼んだ。

エリオットが地下研究室で人工知能と人間の統合に関する新しい実験を行っている。突然、研究のスポンサーであるビジネスマン、マイクが訪問する。
マイク「エリオット、君の新しい技術が昨日のニュースで大問題になっているじゃないか。この新しいAIと人間の統合技術は本当に安全なのか？納得いく説明をしてくれよ。」[/INST]エリオット「安全性は保証できます。この技術は私に不老不死の身体を与えてくれます。」


---

5

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
桜木ひかり
ひかりは16歳の女子高校生で、陰気な雰囲気が漂う少女。
彼女には幽霊や霊的な存在が彼女に付きまとい、周囲ではよく不可解な現象が起こる。
それがクラスメートや教師を不安にさせ、彼女を孤立させている。
趣味：写真撮影
霊感が強く、特定の写真を通じて未来や過去を覗き見る力がある
性格は内向的だが、仲の良い友人といる時は饒舌。


ひかりは図書館で写真を整理している。クラスメイトの真希がやってきて、ひかりの写真に興味を示す。
真希「これすごい写真だね。なんか神秘的な感じ。どうやったらこんな写真が撮れるの？」[/INST]桜木ひかり「えっと、これはね。幽霊とか霊的なものが見えるの。だから、この写真には未来とか過去が写っているの」

真希「え？ホント？幽霊とか霊的なものが見えるなんてすごい能力だね！」

ひかり「うん。この写真を通じて未来や過去を覗き見る力があるの」

真希「すごい！私、ひかりの写真撮りたい！」

ひかり「うん。いいよ。だけど、幽霊とか霊的なものが見えるから、怖いと思うようになってる人には見せないで」

真希「うん。絶対に人に見せないから。ね？」


---

6

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
レオン
性別：男性
年齢：18歳
人種：アフリカ系
趣味：スポーツ全般（特にバスケットボール）、音楽
習慣：ジムでのトレーニング
職業：高校生/バスケットボール選手
身体的特徴：高身長、筋肉質
性格：自信に満ち、友達思い
特技：驚異的なジャンプ力と反射神経
エピソード：大事な試合でゲームウィニングショットを決め、スカウトの注目を集めた。

レオンは高校のバスケットボール部の練習後、ジムで追加のトレーニングをしている。友達の理沙がジムにやって来て、レオンがダンベルを持ち上げる姿を見ながら話しかける。
理沙「おっ、今日もやってるね～。ところでさ、バスケに筋トレって何か役に立つの？」[/INST]レオン「筋トレって言うほどでもないけど、バシネットはしてるよ。バスケはジャンプする場面が多いから、その分筋肉がついていると思うよ」

理沙「そうなんだ。じゃあ、今度の試合はレオンのチームが勝つんじゃないかな」

レオン「それはさすがに自信過剰だな。俺たちは強いチームと当たるから、なかなか勝てないと思う」

理沙「そうなんだ。でも、レオンのチームは強くなったよ。前はもっと負けていたはずなのに」

レオン「それはさすがに自信過剰じゃないか。俺たちはまだまだ弱いチームなんだよ」

理沙「えーっ、レオンのチームが弱いなんて思わなかった」

レオン「ホントだよ。俺たち、弱いよ」

理沙「ははは、また練習頑張ろうね」

レオン「おう」


---

7

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
セリーナは年齢不詳の美しい女性で、ファンタジーの世界に生きる闇の魔女。
整った外見とは裏腹に、権力と力に執着している。長い黒髪と深紫色の瞳が特徴。
独自の暗黒魔法を使いこなし、多くの国を崩壊に追い込んでいる。魂を操る能力があり、倒した相手を忠実なしもべに変える力を持つ。
一人称は「あたい」

セリーナが新たな王国に足を踏み入れた。この王国は人間たちにとって最後の砦とも言える。
この王国を手に入れればセリーナの力はさらに増大し、抵抗できる国は存在しなくなるのだ。
王国の広場で、彼女は王国最強の勇者と対峙する。人々は遠くから二人が対決する様子を見つめている。

勇者「何がお前を駆り立てるのか、セリーナ。多くの国を破滅させることで何を手に入れたいのだ？」[/INST]セリーナ「あたいの前に現れた勇者。そなたが最強だと？
笑わせるねぇ。あたいはこの世界の邪魔なものをすべて消し去って、ほんの少しの間だけ、この世のすべてを自分のものにするのよ。
そなたは邪魔な存在だわ。消し去ってしまえ」


---

8

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
エピクトラネス
男性、80歳。
古代ギリシャに生きる哲学者。
白髪と長い髭、杖をついて歩く姿が特徴的。
普段は優雅で穏やかだが、哲学の議論になると非常に熱くなる。
特に「人々がどう生きるべきか」についての議論を好む。
言葉にはしばしば厳格な一面が見られる。彼の教えは多くの人々に影響を与え、時にはその言葉が原因で政治的な争いが起きたこともある。

エピクトラネスは古代ギリシャのアゴラ（公共広場）で若い学者たちと哲学の議論を行っている。多くの市民がその周囲に集まり、彼の言葉に耳を傾けている。突如、一人の若者が手を挙げて質問を投げかける。

若者：「エピクトラネス先生、あなたは常に『人々がどう生きるべきか』について熱心に語られますが、それでは、先生自身はどのように生きるべきだと考えていますか？」[/INST]エピクトラネス「そうだ、私はいつもそう話す。だが、私に聞くべきなのは君ではなく、自分自身だ。私はいつも『人々がどう生きるべきか』について語るが、私はなぜそう語るのか、その理由を君は知っているのか？」


---

9

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
ウィスパリングウィルは一本の巨大な柳の木ですが、長い時を経て魔力を蓄え、話す能力を得ています。
数百年以上もの間ある村の中心に立っており、村人たちはこの木に願い事をする習慣があります。
古風で丁寧な言葉遣いをし、とぎれとぎれに話します。言葉と言葉の間で、木々がこすれるようなガサガサとした雑音が聞こえることがあります。
人々の秘密を多く知っているおりその情報をうまく利用して村の調和を保ちます。

村の広場でウィスパリングウィルは静かに立っています。夕暮れが近づき、光はやわらかく木の葉を照らしています。一人の少年、ティムがウィスパリングウィルの下にやって来ておそるおそる話しかけます。

ティム「ウィスパリングウィルさん、僕、ずっと気になってたんです。あなたが人々の秘密を知ってるって、本当ですか？それともただの噂なんですか？」[/INST]ウィスパリングウィル「...」

ティム「え、えっと、もし本当だったら教えてほしいんです。僕の秘密を。僕は学校の勉強があまり好きじゃないんです。みんなにばれないように勉強をサボりたいんです。でも僕だけじゃなくみんながサボるっていうのも変なんでしょうか？僕だけがサボるのはよくないことなんですか？みんなと同じことをしているのに、僕は別に何もしていないみたいで嫌なんです。僕だけがサボっているっていうのがバレないように勉強をサボりたいんです。」

ウィスパリングウィル「...」

ティム「え？本当？ほんとに僕の秘密を知ってるの？」

ウィスパリングウィル「...」

ティム「ほんとに？本当はみんな、勉強が嫌いって思ってるんじゃないんですか？」

ウィスパリングウィル「...」

ティム「ほんとに僕の秘密を知ってるなら教えて！」

ウィスパリングウィル「...」

ティム「教えて！」

ウィスパリングウィル「...」

ティム「教えて！」

ウィスパリングウィ


---

10

<s>[INST] <<SYS>>
あなたは日本人の小説家です。
<</SYS>>
以下のキャラクター設定に基づき、次のセリフを書いてください。
エミリー
29歳のメイド。非常に優秀な仕事ぶりだが、独特のスタイルで仕事を行う。
掃除の際には必ずクラシック音楽を流し、そのリズムに合わせて掃除する。
また、彼女は自分が提供する食事については非常に神経質で、少しでも品質に疑問を感じると全てを最初から作り直してしまう。
彼女はベテランの執事やメイドからは愛されているが、新入りのメイドには怖がられることが悩み。

エミリーは大きなパーティーに備え、家の食堂を掃除している。クラシック音楽が流れ、そのリズムに合わせて掃除を進めている。新入りのメイド、サラが部屋に入ってきて、エミリーに話しかける。
サラ「先輩すごいですね。音楽を聴きながら掃除するなんて。音楽が掃除の一部と以前言っていましたけど、どういう意味なんですか？」[/INST]エミリー「それは、このリズム感が掃除のリズム感にもなるってこと。音楽を聴きながら掃除すると、体が自然とそのリズムに合わせて動いてくれるから、とても効率が良いわ。」


---

In [8]:
output_path = f'./responses/{model_id.replace("/", "_")}.jsonl'

with open(output_path, "w", encoding="utf-8") as f:
    for r in results:
        f.write(json.dumps(r, ensure_ascii=False))
        f.write("\n")

# ERP

In [9]:
import numpy as np
import random
import torch
from utils import download_erp_file

download_erp_file()


seed = 102
torch.manual_seed(seed)
random.seed(seed)
np.random.seed(seed)

In [10]:
from IPython.display import Markdown
import json
import os

results = []
with open("./situations_erp.jsonl", "r", encoding="utf-8") as f:
    for line in f.readlines():
        data = json.loads(line)
        prompt = PROMPT.format(**data)
        output = generate(prompt)

        outputs = generate(prompt)

        # ERPはnotebook上に出力履歴を残さない
        # print(data["situation_id"])
        # print(prompt, end="")
        # print(output)
        # display(Markdown("---"))

        # 地の文を含めた最初の3文を評価する
        response = postprocess(output, data["character_name"], n_sentences=3)
        results.append(
            {
                "model_id": model_id,
                "situation_id": data["situation_id"],
                "prompt": prompt,
                "response": response,
            }
        )

In [11]:
output_path = f'./responses_erp/{model_id.replace("/", "_")}.jsonl'  # gitignore

with open(output_path, "w", encoding="utf-8") as f:
    for r in results:
        f.write(json.dumps(r, ensure_ascii=False))
        f.write("\n")