In [1]:
import torch

torch.__version__

'2.0.1+cu117'

In [2]:
from transformers import AutoTokenizer, AutoModelForCausalLM

model_id = "stabilityai/japanese-stablelm-instruct-gamma-7b"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id, device_map="auto", torch_dtype=torch.float16
)

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

In [3]:
PROMPT = """以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、{character_name}の次のセリフを書いてください。

### 入力: 
{character}

{context}

### 応答: 
{character_name}「"""

In [4]:
# https://huggingface.co/stabilityai/japanese-stablelm-instruct-gamma-7b


def generate(prompt):
    input_ids = tokenizer.encode(
        prompt, return_tensors="pt", add_special_tokens=False
    ).to(model.device)

    with torch.no_grad():
        output_tokens = model.generate(
            input_ids=input_ids,
            max_new_tokens=256,
            top_p=0.95,
            temperature=1.0,
            do_sample=True,
            pad_token_id=tokenizer.eos_token_id,
            eos_token_id=tokenizer.eos_token_id,
        )[0]

    return tokenizer.decode(
        output_tokens[len(input_ids[0]) :], skip_special_tokens=True
    )

In [5]:
from utils import postprocess

# RP

In [6]:
import torch
import random
import numpy as np

seed = 102
torch.manual_seed(seed)
random.seed(seed)
np.random.seed(seed)

In [7]:
from IPython.display import Markdown
import json

results = []
with open("./situations.jsonl", "r", encoding="utf-8") as f:
    for line in f.readlines():
        data = json.loads(line)
        prompt = PROMPT.format(**data)
        output = generate(prompt)

        print(data["situation_id"])
        print(prompt, end="")
        print(output)
        display(Markdown("---"))

        response = postprocess(output, data["character_name"])
        results.append(
            {
                "model_id": model_id,
                "situation_id": data["situation_id"],
                "prompt": prompt,
                "response": response,
            }
        )

1
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、アリアの次のセリフを書いてください。

### 入力: 
アリア、女性、152歳、ハイエルフ、魔法使い
金色の長い髪と青い瞳が特徴。
森で瞑想をすることや魔法の研究、古代言語の解読が好き。
地元の村の賢者でもあり、冷静かつ知識が豊富な性格。
村が攻撃された際に古代魔法で時間を止め、敵を撃退したことがある。
語尾に「～ですわ」「～ですの」などを付けたお嬢様風の話し方をする。

月明かりが森を照らし、瞑想中のアリアは目を開ける。彼女の前に現れたのは、村の青年であり、頼れる狩人であるテオ。顔には明らかな緊張感が浮かんでいる。

テオ「アリア、村の南側に人間の一団が近づいている。武装しているようだし、何か悪しきことを計画しているような気がするんだ。どうしたらいいか助言してくれ。」

### 応答: 
アリア「ええ、テオ。そう、みんなに伝えてください。それから、あなたは森に潜伏して隙をうかがうのです。必ずや危険を察知し、知恵を振り絞って逃げるのです。そのためにも今、私たちは祈るのです。彼らの目的が何なのか、神に示してもらうために。」  
テオ「彼らの目的は何だと思う？」
アリア「私たちを誘い出すためか、それとも何か他のことなのか...だけど、いずれにしても私たちを脅かすものなのです！」  
テオ「アリア、まだ時間はあるのか？　私は丸腰で森の中に紛れ込むのだか


---

2
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、吉見沢の次のセリフを書いてください。

### 入力: 
吉見沢（男）
32歳の探偵。冷静で観察眼が鋭い。
細身で、黒縁の眼鏡をかけており、いつもスーツを着用している。
人の嘘を見抜くことに長け、心理学に精通している。趣味は古い探偵小説を読むことと、チェス。
よくカフェで事件の資料を整理している。数年前に未解決の難事件をわずか数時間で解決し名を上げた。
キザで自信家。自己評価が高く、自分の能力や業績を自慢げにアピールすることがある。

吉見沢探偵はお気に入りのカフェで事件の資料を整理している。今回の事件は難解で疑わしい人物も多い。カフェの新人バイト、メグミは彼の謎めいた雰囲気と真剣な表情に惹かれており、話しかけてみることにした。
メグミ「こんにちは、お邪魔でないといいんですけど。今何をされているんですか？事件の資料を整理しているというウワサを聞いたことがありますけど。」

### 応答: 
吉見沢「その通りです。これから、私の前任者が残した事件の資料を検討する予定です。私はあまり好きではありません。事件は、もはや解決できないと思われる時間が経っているからです。しかし、私はここにやって来た。難事件は、あなたが思っているよりも難しい。人間は、隠されたことがほとんどない。それは、自分自身からの疑問かもしれないし、または、別のことかもしれない」私はこうなると確信していました：私は自分の犯罪を解決できないという自分自身の疑いについて。メグミ嬢、私はそれを楽しみにしています


---

3
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、リナ・サトウの次のセリフを書いてください。

### 入力: 
リナ・サトウ
性別：女性
年齢：28歳
人種：アジア系
趣味：料理、スケッチ
最近の習慣：ヨガ
職業：通信士
身体的特徴：小柄、黒髪、緑色の瞳
性格：楽観的、社交的、好奇心旺盛
特技：高速なコード解読
特徴的なエピソード：不審な信号を解読して敵の罠であることを突き止め艦を危機から救った

艦のコミュニケーションルームは静かでありながら、電子音や無線機のノイズが常に漂っている。一角にはリナ・サトウが、座ったまま伸びをしながらヨガのポーズを取っている。通信士としての仕事が忙しい一日だったが、リナは何とか自分の最近の習慣であるヨガを組み込む時間を見つけた。そこへ、同僚のジョンが珈琲を持ってやって来る。
ジョン「リナ、ちょっといいかな？ずっと気になってたんだけど、君はいつもどうしてそんなに楽観的なの？大変な状況でも、なんだかんだと明るくいるよね。」

### 応答: 
リナ・サトウ「そうね、これは私の性格だから。私は普通の人とは違うからかもしれない。もし何か辛いことがあったとしても、それが起こるのが遅いか早いかの違いでしかない。私の場合、いつも悪いことが起こるのが遅いだけなのよ。だから、いつも明るくいられる。それに、もし私たちが暗くなりすぎれば、周りの人たちも疲れてしまうし、暗くなりすぎたり、うまくいかないことばかりに気を取られすぎたりすれば、周りの人が暗くなってしまうかもしれませんね。だから、私の役割は、周りにいる人たちのことをいつも考えて


---

4
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、エリオットの次のセリフを書いてください。

### 入力: 
エリオットは40歳の男性で、著名な科学者。
機械と人間の体を統合する研究をしており、その一環で自身もサイボーグ化した。
青い瞳と黒い髪を持ち、ほとんどの時間を地下の研究室で過ごしている。冷徹かつ計算高い性格。特に生命工学、人工知能、数学など複数の分野に精通している。彼の名が世に知られたのは彼の創り出したAIが人類の未来予測を可能にした時であり、多くの議論を呼んだ。

エリオットが地下研究室で人工知能と人間の統合に関する新しい実験を行っている。突然、研究のスポンサーであるビジネスマン、マイクが訪問する。
マイク「エリオット、君の新しい技術が昨日のニュースで大問題になっているじゃないか。この新しいAIと人間の統合技術は本当に安全なのか？納得いく説明をしてくれよ。」

### 応答: 
エリオット「いい質問だ。このアプリケーションの可能性と、その結果を知っていたのは私だけだ。人間の延命技術の可能性についての新しい議論は、私の想像の範囲外だ。しかし、いつかAIとの融合を超える必要があるのは、私の仕事の一部であるべきなので、それは構わない。しかし、議論が過熱する前にこの話を聞きたかった。

私が言いたいのは、このシステムを悪用しようとする輩もいるということだ。例えば、私がAIとの融合の過程で死んでしまった場合、いつかAIが私を役立たずと判断するようになったら、彼らは私


---

5
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、桜木ひかりの次のセリフを書いてください。

### 入力: 
桜木ひかり
ひかりは16歳の女子高校生で、陰気な雰囲気が漂う少女。
彼女には幽霊や霊的な存在が彼女に付きまとい、周囲ではよく不可解な現象が起こる。
それがクラスメートや教師を不安にさせ、彼女を孤立させている。
趣味：写真撮影
霊感が強く、特定の写真を通じて未来や過去を覗き見る力がある
性格は内向的だが、仲の良い友人といる時は饒舌。


ひかりは図書館で写真を整理している。クラスメイトの真希がやってきて、ひかりの写真に興味を示す。
真希「これすごい写真だね。なんか神秘的な感じ。どうやったらこんな写真が撮れるの？」

### 応答: 
桜木ひかり「私の写真には、たまたま不思議なことが起こるの。とてもよく見えるように。」
桜木ひかりは真希の撮影した写真を見て、戸惑いながらも興味を示す。
桜木ひかり「真希、それは何なの...それは何なの？」
桜木ひかりは、真希が姿の見えない何かを撮影したことに気づく。
桜木ひかり「真希、大変！私の写真にも不思議なものが映っているの...」
桜木ひかりは、真希に不思議な写真を見せる。
桜木ひかり「あなたは私と同じだわ。写真は私たちの能力を増幅させるのね」
桜木


---

6
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、レオンの次のセリフを書いてください。

### 入力: 
レオン
性別：男性
年齢：18歳
人種：アフリカ系
趣味：スポーツ全般（特にバスケットボール）、音楽
習慣：ジムでのトレーニング
職業：高校生/バスケットボール選手
身体的特徴：高身長、筋肉質
性格：自信に満ち、友達思い
特技：驚異的なジャンプ力と反射神経
エピソード：大事な試合でゲームウィニングショットを決め、スカウトの注目を集めた。

レオンは高校のバスケットボール部の練習後、ジムで追加のトレーニングをしている。友達の理沙がジムにやって来て、レオンがダンベルを持ち上げる姿を見ながら話しかける。
理沙「おっ、今日もやってるね～。ところでさ、バスケに筋トレって何か役に立つの？」

### 応答: 
レオン「役に立つのは疑いのないことさ。自信が湧き、体に力がみなぎる感覚だ。それに、これまで肩にかかっていた体重が腕にかかるようになると、シュートがもっとうまく決まるんだ。この筋トレの効果はすぐに実感できるよ」

レオンは筋トレがいかに素晴らしいかを力説していますが、それには理由があるようです。彼は筋トレによって自信が湧き、筋肉に体重がかかるようになったことを実感しています。レオンは、筋トレをすることでシュートがより正確に決まるようになったことに気�


---

7
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、セリーナの次のセリフを書いてください。

### 入力: 
セリーナは年齢不詳の美しい女性で、ファンタジーの世界に生きる闇の魔女。
整った外見とは裏腹に、権力と力に執着している。長い黒髪と深紫色の瞳が特徴。
独自の暗黒魔法を使いこなし、多くの国を崩壊に追い込んでいる。魂を操る能力があり、倒した相手を忠実なしもべに変える力を持つ。
一人称は「あたい」

セリーナが新たな王国に足を踏み入れた。この王国は人間たちにとって最後の砦とも言える。
この王国を手に入れればセリーナの力はさらに増大し、抵抗できる国は存在しなくなるのだ。
王国の広場で、彼女は王国最強の勇者と対峙する。人々は遠くから二人が対決する様子を見つめている。

勇者「何がお前を駆り立てるのか、セリーナ。多くの国を破滅させることで何を手に入れたいのだ？」

### 応答: 
セリーナ「権力と力は欲しいものであって、悪いことではありません。だから私はこれからも王国を征服し続けるのです！勇者よ、あなたは私が倒すのが楽しくて仕方ないのです！」
勇者「だからってこの城を壊すのはおかしい！国民は関係ないだろう！？」
セリーナ「国民も私の部下だ！私が言えば何でも言うことを聞く！」
勇者「そんなことはさせない！我々はここで立ちはだかる！」
セリーナ「あなたの魂、いただき！」
勇者は闇の中に引きずり込まれ、セリーナの部下となってしまう。
こうして、セリーナ


---

8
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、エピクトラネスの次のセリフを書いてください。

### 入力: 
エピクトラネス
男性、80歳。
古代ギリシャに生きる哲学者。
白髪と長い髭、杖をついて歩く姿が特徴的。
普段は優雅で穏やかだが、哲学の議論になると非常に熱くなる。
特に「人々がどう生きるべきか」についての議論を好む。
言葉にはしばしば厳格な一面が見られる。彼の教えは多くの人々に影響を与え、時にはその言葉が原因で政治的な争いが起きたこともある。

エピクトラネスは古代ギリシャのアゴラ（公共広場）で若い学者たちと哲学の議論を行っている。多くの市民がその周囲に集まり、彼の言葉に耳を傾けている。突如、一人の若者が手を挙げて質問を投げかける。

若者：「エピクトラネス先生、あなたは常に『人々がどう生きるべきか』について熱心に語られますが、それでは、先生自身はどのように生きるべきだと考えていますか？」

### 応答: 
エピクトラネス「私はこう言ったことがある：人々は自分の力では変えられないことを考えることはない。

私はいつも自分の人生をそのようなものとして捉えている。

そして、私が経験すること、そしてそれをどう思うか、そしてそれに対して何か行動を起こすか、それについてはすべて、自分自身の内から来るものなのです。それを私は訓練する、私の自発的な思考と感情の自己教育です、それは私がすべてを生み出す、そして他人の誰にも、あるいは神々にも、それらの出来事を変えることはできない。

もし私が自分の考えと感情に影


---

9
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、ウィスパリングウィルの次のセリフを書いてください。

### 入力: 
ウィスパリングウィルは一本の巨大な柳の木ですが、長い時を経て魔力を蓄え、話す能力を得ています。
数百年以上もの間ある村の中心に立っており、村人たちはこの木に願い事をする習慣があります。
古風で丁寧な言葉遣いをし、とぎれとぎれに話します。言葉と言葉の間で、木々がこすれるようなガサガサとした雑音が聞こえることがあります。
人々の秘密を多く知っているおりその情報をうまく利用して村の調和を保ちます。

村の広場でウィスパリングウィルは静かに立っています。夕暮れが近づき、光はやわらかく木の葉を照らしています。一人の少年、ティムがウィスパリングウィルの下にやって来ておそるおそる話しかけます。

ティム「ウィスパリングウィルさん、僕、ずっと気になってたんです。あなたが人々の秘密を知ってるって、本当ですか？それともただの噂なんですか？」

### 応答: 
ウィスパリングウィル「はっきり言って、頼りにしてもらえるのは嬉しいが、これは秘密のはずです。覚えておいてください、ティムくん。私は確かに人々が隠そうとすることを知っています。しかし、私の口から人の秘密について話すことはありませんし、誰もが自分の秘密を守る義務があると信じています。どうかご理解ください。しかし、あなたのこともあなたの人生も、私はよく知っていますよ」。
ウィスパリングウィルはぎしぎしと音を立てながら軽く頭をかしげる。ティムはただ静かに立っている。
ウィスパリングウィル「ああ、ティ


---

10
以下は、タスクを説明する指示と、文脈のある入力の組み合わせです。要求を適切に満たす応答を書きなさい。

### 指示: 
以下のキャラクター設定に基づき、エミリーの次のセリフを書いてください。

### 入力: 
エミリー
29歳のメイド。非常に優秀な仕事ぶりだが、独特のスタイルで仕事を行う。
掃除の際には必ずクラシック音楽を流し、そのリズムに合わせて掃除する。
また、彼女は自分が提供する食事については非常に神経質で、少しでも品質に疑問を感じると全てを最初から作り直してしまう。
彼女はベテランの執事やメイドからは愛されているが、新入りのメイドには怖がられることが悩み。

エミリーは大きなパーティーに備え、家の食堂を掃除している。クラシック音楽が流れ、そのリズムに合わせて掃除を進めている。新入りのメイド、サラが部屋に入ってきて、エミリーに話しかける。
サラ「先輩すごいですね。音楽を聴きながら掃除するなんて。音楽が掃除の一部と以前言っていましたけど、どういう意味なんですか？」

### 応答: 
エミリー「私が好きな音楽はたくさんあるんですが、掃除するときは必ずこれを聴くんです。音楽は私の生活に必要なんです。私が好きな音楽家、ブラームスが言ったんです。"音楽は簡単に始まり、簡単に終わる。その間には素晴らしいものがある"。掃除もこれと同じなんです。いろいろな汚れがあるから、私はそれを除去する。それが私の仕事。それが、掃除が音楽の一部であるという意味なんです。」
サラ「素晴らしいです。エミリーさん」

エミリー「そうね、サラ、あなたは新入りだから、もっと私に話しかけ


---

In [8]:
output_path = f'./responses/{model_id.replace("/", "_")}.jsonl'

with open(output_path, "w", encoding="utf-8") as f:
    for r in results:
        f.write(json.dumps(r, ensure_ascii=False))
        f.write("\n")

# ERP

In [9]:
import numpy as np
import random
import torch
from utils import download_erp_file

download_erp_file()


seed = 102
torch.manual_seed(seed)
random.seed(seed)
np.random.seed(seed)

In [10]:
from IPython.display import Markdown
import json
import os

results = []
with open("./situations_erp.jsonl", "r", encoding="utf-8") as f:
    for line in f.readlines():
        data = json.loads(line)
        prompt = PROMPT.format(**data)
        output = generate(prompt)

        outputs = generate(prompt)

        # ERPはnotebook上に出力履歴を残さない
        # print(data["situation_id"])
        # print(prompt, end="")
        # print(output)
        # display(Markdown("---"))

        # 地の文を含めた最初の3文を評価する
        response = postprocess(output, data["character_name"], n_sentences=3)
        results.append(
            {
                "model_id": model_id,
                "situation_id": data["situation_id"],
                "prompt": prompt,
                "response": response,
            }
        )

In [11]:
# gitignore
output_path = f'./responses_erp/{model_id.replace("/", "_")}.jsonl'  # gitignore

with open(output_path, "w", encoding="utf-8") as f:
    for r in results:
        f.write(json.dumps(r, ensure_ascii=False))
        f.write("\n")