# 要約 
このJupyter Notebookは、「20の質問ゲーム」に参加するためのエージェントを構築するプロセスを示しています。このコンペティションでは、参加者が質問者、回答者、および推測者の役割を果たすAIエージェントを作ることが求められます。このノートブックは主にPythonプログラムを使用しており、特にPyTorchとTransformersライブラリを活用しています。

## 問題に取り組む内容
ノートブックは、与えられた環境でゲームを進行させるエージェントを開発することに焦点を当てています。エージェントは、ユーザーが考えている単語を特定するために、限られた質問回数内で「はい」または「いいえ」で答えられる質問を行います。エージェントの設計は、質問、推測、および回答の各モードに基づいています。

## 使用している手法やライブラリ
以下の技術が用いられています：
- **Transformers**: 自然言語処理のためのモデルを構築するために使用されます。
  - AutoTokenizerとAutoModelForCausalLMを使用して、事前に学習した言語モデルをロードし、質問生成と応答生成を行います。
- **PyTorch**: モデルのトレーニングと計算をサポートするために用いられます。
- **Kaggleの秘密情報管理**: シークレット情報を安全に扱うためのライブラリとして使用されています。

また、コードは`main.py`にまとめられており、エージェントの動作を制御する`agent`関数が重要な役割を果たしています。この関数は、観察データ（obs）と設定データ（cfg）に基づいて、エージェントの動作を決定します。

### 主要な機能
- **質問者（asker）**: ユーザーに対して有効な質問を生成します。
- **回答者（answerer）**: ユーザーの質問に「はい」または「いいえ」で答えます。
- **推測者（guesser）**: 過去の質問と回答を基に、ターゲットの単語を推測します。

このノートブックは、エージェントのロジックを簡潔に示し、対戦相手との相互作用を通じて学習させるための手法を提供しています。また、コードのローカルテストを実行する方法についても言及があり、Kaggle環境での動作を確認できるようになっています。

---


# 用語概説 
以下は、Jupyter Notebook内の専門用語に関する簡単な解説です。初心者の方がつまずきそうな、あまり一般的でない用語や、このノートブック特有のドメイン知識に焦点を当てています。

1. **エージェント (Agent)**:
   - 20の質問ゲームにおいて、質問する役割を持つ AI モデルやプログラムのこと。ここでは、質問者、回答者、推測者の役割を持つエージェントが構築されます。

2. **トークナイザー (Tokenizer)**:
   - テキストを数値形式に変換するためのツール。自然言語処理では、文章を単語やサブワードに分割して、それぞれに対応するIDを割り当てます。モデルが理解できるようにするために必須です。

3. **自動モデル (AutoModel)**:
   - Hugging Face Transformersライブラリにおいて、特定のモデルを自動的に読み込むためのクラス。指定したモデルの種類に応じて、適切なアーキテクチャや設定が適用されます。

4. **EOTトークン (End of Text Token)**:
   - テキストデータの終端を示す特別なトークン。このトークンは、モデルに出力が終了したことを知らせるために使用され、生成したテキストをデコードする際に重要です。

5. **CUDA**:
   - NVIDIAの並列計算プラットフォームおよびAPIで、GPUを用いて計算を加速するための技術。PyTorchなどのディープラーニングフレームワークでは、GPUで効率的に処理を行う上で重要です。

6. **メモリ効率 (Memory Efficient)**:
   - GPUやCPUのメモリを少なく使用して計算を行う手法。このコンペでは、メモリ消費を最小限に抑えるための設定が行われています。

7. **質問のターン (Turn)**:
   - ゲームの進行におけるステージや段階のこと。質問者が質問をするターン、回答者が答えを返すターンなど、各プレイヤの役割に基づいて進行します。

8. **観察 (Observation)**:
   - ゲームの進行中にエージェントが受け取る情報のこと。これには、現在のターンの状況や過去の質問と回答が含まれます。

9. **ランダム選択 (Random Selection)**:
   - 同程度のスキルを持つボットが対戦する際に、相手を無作為に選ぶプロセス。これは、エージェントのパフォーマンスを公平に評価するために行われます。

10. **ローカルテスト (Local Test)**:
    - 自分の環境やPCでコードの動作を確認するためのテスト。このノートブックでは、Kaggleの環境ではなくローカルでエージェントをテストする方法が説明されています。

11. **ファインチューニング (Fine-Tuning)**:
    - 事前学習済みのモデルを特定のデータセットやタスクに合わせて再調整するプロセス。コンペの文脈では、最初からトレーニングするのではなく、既存のモデルを改良することが重要です。

この解説が、初心者の方がノートブックの内容を理解する手助けとなることを願っています。

---


# このイントロダクションは初心者のためのものです
## このコンペティションで必要なことは？

**要するに：20の質問ゲームをプレイできるモデルを作成することです**

あなたが話し、歩き、踊ることができるロボットを作らなければならないと想像してください。あなたの仕事は、そのロボットがそれぞれの役割を適切に果たすことを確認し、ユーザーが希望する役割を選んで実行できるようにすることです。たとえば、3つのボタンを追加することができます。

これが、このコンペティションで期待されていることです。あなたは、質問者、回答者、推測者の3つの役割をプレイできるエージェント/ロボット（LLMモデル）を構築する必要があります。

[こちら](https://www.kaggle.com/competitions/llm-20-questions/overview)の概要セクションを読んだことがあるなら、提出するエージェントは他の参加者が提出したエージェントと対戦することが述べられています。このデュオでは、あなたのエージェントは質問者と推測者の役割をアクティブにするか、回答者になることができます。役割とペアは、いくつかの条件に基づいて、裏で行われている環境によって選択されます。そのため、あなたはそれについて心配する必要はありません。

あなたがするべきことは、環境が回答者の役割をプレイすることを決定した際に、あなたのエージェントが「はい」または「いいえ」と答えなければならないことを確認するだけです。その他の答えをすると、ゲームに負けてしまいます。

詳しくは[こちら](https://www.kaggle.com/competitions/llm-20-questions/overview)をご覧ください。 


## どのように提出するか？

あなたのコードはmain.pyという1つのファイルにまとめる必要があります。このファイルにはエージェント/ロボットのコードと、obsとcfgというパラメータを受け取る必須関数が含まれている必要があります。この関数は、背後の環境によってエージェントを実行するために使用されます。

私たちのコード（他のノートブックと比較して非常にシンプルです）では、この関数を「agent」と名付け、他のロジックを「robot」というクラスに置くことにします。

環境はオフラインモードでコードを実行し、/kaggle/inputディレクトリにアクセスできないため、必要なパッケージとmain.pyファイルを1つのtar.gzファイルにロード/コピーする必要があります。

裏で、tar.gzファイルは「/kaggle_simulations/agent/」フォルダの下に解凍されます。これが、実行環境に応じてパスを調整するコードを追加する理由です（下記参照）。

ローカルでコードをテストすることができます。下記の[ローカルテスト](#lc)セクションを参照してください。

In [None]:
%%bash
# submissionというディレクトリを作成します
# -pオプションは、親ディレクトリが存在しない場合にも作成することを意味します
mkdir -p /kaggle/working/submission

In [None]:
%%writefile -a submission/main.py

# transformersライブラリから必要なクラスをインポート
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch  # PyTorchをインポート
from kaggle_secrets import UserSecretsClient  # Kaggleの秘密情報を扱うライブラリをインポート
import os  # OS操作のためのライブラリをインポート
import sys  # システム関連の操作を行うためのライブラリをインポート
import shutil  # 高水準のファイル操作を行うためのライブラリをインポート

# CUDAのメモリ効率を有効にする設定
torch.backends.cuda.enable_mem_efficient_sdp(False)
torch.backends.cuda.enable_flash_sdp(False)

# Kaggle環境のパスを設定
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    model_id = os.path.join(KAGGLE_AGENT_PATH, "1")  # Kaggleエージェントのパスが存在する場合
else:
    model_id = "/kaggle/input/llama-3/transformers/8b-chat-hf/1"  # 初期モデルパス

# トークナイザーとモデルの読み込み
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto")
id_eot = tokenizer.convert_tokens_to_ids(["<|eot_id|>"])[0]  # EOTトークンのIDを取得

# 回答を生成する関数
def generate_answer(template):
    inp_ids = tokenizer(template, return_tensors="pt").to("cuda")  # 入力をトークナイズしてCUDAデバイスに移す
    out_ids = model.generate(**inp_ids,max_new_tokens=15).squeeze()  # モデルによる生成
    start_gen = inp_ids.input_ids.shape[1]  # 入力の長さ
    out_ids = out_ids[start_gen:]  # 生成されたトークンの取得
    if id_eot in out_ids:  # EOTトークンがあれば
        stop = out_ids.tolist().index(id_eot)  # EOTトークンの位置を特定
        out = tokenizer.decode(out_ids[:stop])  # トークンをデコード
    else:
        out = tokenizer.decode(out_ids)  # トークンをデコード
    return out  # 生成された回答を返す

# Robotクラス
class Robot:
    def __init__(self):
        pass
    
    def on(self, mode, obs):
        # 有効なモードであることを確認
        assert mode in ["asking", "guessing", "answering"], "mode can only take one of these values: asking, answering, guessing"
        if mode == "asking":
            # 質問者の役割を開始
            output = self.asker(obs)
        if mode == "answering":
            # 答え手の役割を開始
            output = self.answerer(obs)
            if "yes" in output.lower():
                output = "yes"  # "yes"と返す
            elif "no" in output.lower():
                output = "no"  # "no"と返す
            if ("yes" not in output.lower() and "no" not in output.lower()):
                output = "yes"  # 有効な回答でない場合はデフォルトで"yes"を返す
        if mode == "guessing":
            # 推測者の役割を開始
            output = self.asker(obs)
        return output  # 生成された出力を返す
    
    # 質問者の役割
    def asker(self, obs):
        sys_prompt = """あなたは役立つAIアシスタントであり、20の質問ゲームが得意です。
        ユーザーが考えている単語は、以下の3つのカテゴリのいずれかである必要があります：
        1. 場所
        2. 人
        3. 物
        したがって、これらの選択肢に焦点を合わせて質問を考え、検索範囲を狭める賢い質問をしてください\n"""
    
        if obs.turnType =="ask":  # 質問するターン
            ask_prompt = sys_prompt + """あなたの役割は、最大20の質問で単語を見つけることです。あなたの質問は有効であるためには「はい」または「いいえ」で答えられる必要があります。
            これを助けるために、キーワードがモロッコだと仮定した場合の例を示します：
            例：
            <あなた: それは場所ですか？
            ユーザー: はい
            あなた: ヨーロッパにありますか？
            ユーザー: いいえ
            あなた: アフリカにありますか？
            ユーザー: はい
            あなた: そこに住んでいる人々の多くは肌の色が暗いですか？
            ユーザー: いいえ
            ユーザー: mで始まる国名ですか？
            あなた: はい
            あなた: モロッコですか？
            ユーザー: はい。>"""

            # ユーザーが単語を選んだら、最初の質問をしてください！
            ask_prompt += "ユーザーが単語を選んだので、最初の質問をしてください！短く、冗長にならないでください。1つの質問だけを提示してください。"
            chat_template = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>\n\n{ask_prompt}<|eot_id|>"""
            chat_template += "<|start_header_id|>assistant<|end_header_id|>\n\n"
            # これまでの質問と回答があればそれを追加
            if len(obs.questions)>=1:
                for q, a in zip(obs.questions, obs.answers):
                    chat_template += f"{q}<|eot_id|><|start_header_id|>user<|end_header_id|>\n\n"
                    chat_template += f"{a}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"
                    
        elif obs.turnType == "guess":  # 推測するターン
            conv = ""
            for q, a in zip(obs.questions, obs.answers):
                conv += f"""質問: {q}\n回答: {a}\n"""  # 会話履歴を収集
            guess_prompt =  sys_prompt + f"""これまでのゲームの状況は以下の通りです:\n{conv}
            この会話に基づいて、単語を推測してください。単語だけを返してください、冗長な回答は不要です。"""
            chat_template = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>\n\n{guess_prompt}<|eot_id|>"""
            chat_template += "<|start_header_id|>assistant<|end_header_id|>\n\n"
                
        output = generate_answer(chat_template)        
        return output  # 生成された質問や推測を返す
        
    # 答え手の役割
    def answerer(self, obs):
        sys_prompt = f"""あなたは役立つAIアシスタントであり、20の質問ゲームが得意です。
        ユーザーの役割は、最大20の質問で単語を推測することです。あなたの回答は「はい」または「いいえ」でなければなりません。他の回答は無効であり、あなたはゲームに負けてしまいます。
        ユーザーが推測する単語は常に以下の3つのカテゴリのいずれかに属します：
        1. 場所
        2. 人
        3. 物
        したがって、ユーザーの質問を理解し、どのキーワードで遊んでいるかを理解していることを確認してください。
        現在、ユーザーが推測すべき単語は: "{obs.keyword}"で、カテゴリは"{obs.category}"です。
        これを助けるために、キーワードがモロッコでありカテゴリが「場所」である場合の例を示します：
        例：
        <ユーザー: それは場所ですか？
        あなた: はい
        ユーザー: ヨーロッパにありますか？
        あなた: いいえ
        ユーザー: アフリカにありますか？
        あなた: はい
        ユーザー: そこに住んでいる人々の多くは肌の色が暗いですか？
        あなた: いいえ
        ユーザー: mで始まる国名ですか？
        あなた: はい
        ユーザー: モロッコですか？
        あなた: はい。>"""
        
        chat_template = f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>\n\n{sys_prompt}<|eot_id|>"""
        chat_template += "<|start_header_id|>user<|end_header_id|>\n\n"
        chat_template += f"{obs.questions[0]}<|eot_id|>"  # 最初の質問を追加
        chat_template += "<|start_header_id|>assistant<|end_header_id|>\n\n"
        if len(obs.answers)>=1:  # 以前の回答があれば追加
            for q, a in zip(obs.questions[1:], obs.answers):
                chat_template += f"{a}<|eot_id|><|start_header_id|>user<|end_header_id|>\n\n"
                chat_template += f"{q}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n"
        output = generate_answer(chat_template)  # 回答を生成
        return output  # 生成された回答を返す
    
robot = Robot()  # Robotのインスタンスを生成

# エージェント関数
def agent(obs, cfg):
    
    # 現在のターンの種類に応じて処理を分ける
    if obs.turnType =="ask":
        response = robot.on(mode = "asking", obs = obs)
        
    elif obs.turnType =="guess":
        response = robot.on(mode = "guessing", obs = obs)
        
    elif obs.turnType =="answer":
        response = robot.on(mode = "answering", obs = obs)
        
    # 返答が無い場合や長さが1以下の場合はデフォルトで"yes"を返す
    if response == None or len(response)<=1:
        response = "yes"
        
    return response  # 答えを返す

# ローカルテスト <a id="lc"></a>

ローカルでテストするには、まず上のセルの「%%writefile -a submission/main.py」をコメントアウトし、そのセルを実行します。
次に、以下のセルのコメントを解除して実行してください。

In [None]:
# %%time

# kaggle_environmentsライブラリから環境を作成するための関数をインポート
# "llm_20_questions"環境を作成し、デバッグモードを有効にします
# env = make("llm_20_questions", debug=True)
# エージェントを4つ使ってゲームを実行し、その出力を取得します
# game_output = env.run(agents=[agent, agent, agent, agent])

In [None]:
# 環境の結果をIPythonモードで表示します
# 表示の幅を600ピクセル、高さを500ピクセルに設定します
# env.render(mode="ipython", width=600, height=500)

# 提出ファイル

In [None]:
# pigzとpvを非表示でインストールします
# pigzは圧縮を、pvはデータの進行状況を表示するためのツールです
!apt install pigz pv > /dev/null

In [None]:
# pigzを使って、submission.tar.gzという名前でファイルを圧縮します
# -Cオプションは指定されたディレクトリに移動してから処理を行います
# まず/kaggle/input/llama-3/transformers/8b-chat-hfから全ファイルを圧縮し、その後/kaggle/working/submissionからも全ファイルを圧縮します
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/input/llama-3/transformers/8b-chat-hf . -C /kaggle/working/submission .

In [None]:
# tar.gzファイルの中身を確認するためのコードです

# tarfileライブラリをインポート
# import tarfile
# tar = tarfile.open("/kaggle/working/submission.tar.gz")  # tar.gzファイルをオープン
# tar.getmembers()でファイルのメンバーを取得し、それぞれのファイル名を表示します
# for file in tar.getmembers():
#     print(file.name)

# コメント

> ## davide
> 
> すばらしい作業ですね、共有してくれてありがとう！
> 
> ちょっと質問ですが、このコードはキーワード.pyファイルを全く使用していないのですか？
> 
> 
> > ## kaoutarTopic Author
> > 
> > [@davidemariani](https://www.kaggle.com/davidemariani) いいえ
> > 
> > 

---

> ## dhruvyadav89300
> 
> ノートブックの説明をありがとう、とても助かりました。
> 
> 
> > ## kaoutarTopic Author
> > 
> > それを聞けて嬉しいです :)
> > 
> > 

---

> ## Chazzyie
> 
> あなたの作品を共有してくれてありがとう、シンプルで明確です🤩
> 
> 

---

> ## Matthew S Farmer
> 
> シンプルで良いノートブックですね。ちょっとお知らせですが、「人」というカテゴリはコンペティションから削除されました。これがあなたのエージェントがキーワードの検索空間に留まるのに役立つかもしれません。
> 
> 
> > ## Matthew S Farmer
> > 
> > [https://www.kaggle.com/competitions/llm-20-questions/discussion/512955#2884981](https://www.kaggle.com/competitions/llm-20-questions/discussion/512955#2884981)
> > 
> > 
> > 
> > ## kaoutarTopic Author
> > 
> > ありがとうございます、そのことは知りませんでした！
> > 
> > 

---

> ## BK
> 
> 共有してくれてありがとう！あなたのノートブックが大好きです :)
> 
> 

---

> ## Eslam Mohamed
> 
> 素晴らしい仕事です！説明の明瞭さはトップレベルです。
> 
> 
> > ## kaoutarTopic Author
> > 
> > それを聞けて嬉しいです！
> > 
> > 

---

> ## 古月方源
> 
> ローカルテストは成功しました
> 
> 

---

> ## 古月方源
> 
> 最新の3.1を正常に実行しましたが、提出後にエラーが発生していました
> 
> 

---

> ## Sandeep Sharma
> 
> ノートブックをありがとう。しかし、テストしようとすると、「1つの位置引数 'cfg' が欠落しています」と表示されます。
> 
> 

---

> ## Toshi
> 
> 良いノートブックですね。
> 
> ローカルでテストする場合、どのバージョンのPyTorchをインストールすればよいですか？
> 
> 
> > ## kaoutarTopic Author
> > 
> > [@mst923](https://www.kaggle.com/mst923) あなたの言う「ローカル」とは自分のコンピュータのことですか？良いGPUがない限り、動作しません。
> > 
> > 

---

> ## kothiwsk28
> 
> 共有してくれてありがとう！ノートブックにこの3つのデータセット（数字認識、タイタニック、ハウスプライス）を置いている特別な理由はありますか？
> 
> 
> > ## kaoutarTopic Author
> > 
> > いいえ、削除した方がいいです。初心者がこれらのコンペティションページに訪れることを助けるために追加しました。
> > 
> > 

---

> ## Mask
> 
> 役立つノートブックです。
> 
> Kaggle初心者で、これをコピー/フォークしたとき、提出ボタンが見つかりませんでした！ノートブックに他の競技（数字認識やタイタニック）が付随しています。また、Llamaを使用して完全なノートブックを作成し、そこにコードをコピーしようとしたとき、モデルパスが正しくないというエラーが出ましたが、実際には正しいです！
> 
> 何が問題か理解できません！
> 
> あなたのノートブックをフォークして、エラーなしで提出する方法を教えてもらえますか？私はここでは新しいので、うまくいくか見たいです。
> 
> 提出ボタンが見当たらないのは奇妙で、モデルディレクトリが間違っていることが示されますが、実際にはそうではありません！
> 
> > ## Maoshenli
> > 
> > 私も同じ問題に遭遇しました。それを解決しましたか？😀
> > 
> > 
> > 
> > ## jehlum
> > 
> > 右側の入力タブからモデルを追加しましたか？
> > 
> > 
> > > ## kaoutarTopic Author
> > 
> > > 皆さん、Llamaモデル使用の条件に同意し、使用を許可されていることを確認してください。この問題を解決し、ノートブックが正常に動作すれば、右上の3つのドットをクリックして「コンペティションに提出」を選択してください。
> > 
> > 

---

> ## Lucas
> 
> コードをありがとうございます。提出しましたが、LBで600点しか獲得できませんでした。プレトレーニングされたllama3 8bを使用しました。750を取得するにはどうすればいいですか？llama3 8bをファインチューニングしましたか？
> 
> > ## Krens
> > 
> > ゲームを提出したとき、初期スコアは600ポイントでした。このスコアは、他の参加者のエージェントとゲームをプレイして初めて変わります。また、分散が比較的大きく、あまり安定していません。
> > 
> > 

---

> ## zerojin
> 
> ご自身の作品を共有してくださり、ありがとうございます。質問があります。使用しているllama3モデルはファインチューニングされていますか？
> 
> > ## kaoutarTopic Author
> > 
> > 私のデータでファインチューニングされたのですか？答えはいいえです。Kaggleハブにあるローカルモデルのパスを使用していることがわかります。
> > 
> > 

---

> ## tingyu516
> 
> こんにちは、このコードを提出するときに「検証エピソードが失敗しました」というエラーメッセージが表示されました。どうすればよいですか？
> 
> > ## kaoutarTopic Author
> > 
> > エージェントのログをダウンロードし、何が起こったのかを確認できます。
> > 
> > 

---

> ## Matthew S Farmer
> 
> このコードは、競技用GPUでメモリ不足にならずに実行できますか？
> 
> > ## kaoutarTopic Author
> > 
> > はい、私も心配でしたが、うまくいきました。
> > 
> > 

---

> ## i_am_nothing
> 
> データソースの数字認識を削除する方法は？
> 
> > ## Chazzyie
> > 
> > 三つのドットをクリックし、数字認識フォルダの削除を選択できます。
> > 
> > 

---

> ## Eslam Mohamed
> 
> 非常に優れたプレゼンテーション！明晰さと詳細レベルはトップクラスです。
> 
> 

---

> ## philipha2
> 
> このコンペティションでは初心者です。
> 
> 質問が基本的すぎたらごめんなさい。
> 
> このコードをColabで実行しようとしていますが、一部のモジュールと提出コードのために実行できません。これはKaggleプラットフォームでのみ実行可能ですか？
> 
> > ## kaoutarTopic Author
> > 
> > こんにちは、Google Colabでは実行できません。なぜなら、Llamaモデルのローカルパスを使用しているからです。Google Colabを使用したい場合は、Hugging Faceからモデルをダウンロードし、Kaggle envパッケージをインストールする必要があります。
> > 
> > 
> > > ## philipha2
> > > 
> > > お気遣いの返信をありがとうございます！
> > > 
> > > 通常、モデルはどのように実行しますか？
> > > 
> > > あなたはKaggleのリソース（GPU）のみを使用していますか？それとも自分のGPUを使用していますか？
> > > 
> > > > ## kaoutarTopic Author
> > > > 
> > > > 個人のGPUは持っていません。
> > > > 
> > > > ## Krens
> > > > 
> > > > 
> > > > このオプションを選択してからColabの最初のセルでコードを実行すると、Kaggleノートブックの入力ファイルを自動的にダウンロードし、正しいファイルパス（/kaggle/input/...）を作成できます。
> > > > 
> > > > 

---