# 要約 
このJupyterノートブックは、Kaggleの「LLM 20 Questions」コンペティションにおけるエージェントの作成、テスト、およびデバッグに焦点を当てています。特に、シンプルな推測エージェントをPythonで定義し、Kaggleの環境を用いてゲームを実行する方法を示しています。

### 取り組んでいる問題
ノートブックでは、言語モデルを用いた「20の質問」ゲームにおけるエージェントの設計と実行に関する問題に取り組んでいます。具体的には、エージェントが限られた質問の中で正しい単語を推測するスキルを持つことが重要です。エージェントは「ask」「guess」「answer」の3つのターンタイプに対応する必要があります。

### 使用している手法
1. **シンプルなエージェントの作成**:
    - 4つのシンプルなエージェント（`simple_agent1`, `simple_agent2`, `simple_agent3`, `simple_agent4`）が定義され、各エージェントは固定の質問を行い、推測を行います。

2. **環境の構築**:
    - `kaggle_environments`ライブラリを使用して、「llm_20_questions」の環境を作成し、推測に必要なキーワードやオプションを初期化します。

3. **ゲームの実行**:
    - `env.run()`メソッドを使用して、作成したエージェントを用いてゲームを実行します。
    - 各エージェントのレスポンスやゲームの結果を収集するための構造が用意されている。

4. **デバッグ機能**:
    - エージェントの動作を確認するためのデバッグ手法が導入されており、ターンごとにエージェントの状態や反応を詳細に観察できる機能が含まれています。

5. **提出用エージェントの準備**:
    - エージェントのロジックを`main.py`として保存し、その周辺に必要な情報を持ったサポートファイルをまとめて提出する手順が説明されています。

### ライブラリ
- `kaggle_environments`: Kaggleの競技環境を作成し、エージェントをテストするためのライブラリです。
- `csv`, `os`, `sys`: Pythonの標準ライブラリを利用してファイルやディレクトリの扱いを行います。

このノートブックは、エージェントを試作し、ゲームを通じたインタラクションを理解するためのステップバイステップガイドとして機能します。

---


# 用語概説 
以下は、ノートブック内で取り上げられている機械学習・深層学習関連の用語に関する簡単な解説です。特に初心者がつまずきがちな点や、実務経験が少ないと馴染みのない専門用語に焦点を当てています。

1. **エージェント (Agent)**:
   - 環境内で行動をとるプログラムやモデルを指します。このノートブックでは、20 Questionsゲームに参加するための質問者や回答者として機能するPython関数のことを指しています。

2. **環境 (Environment)**:
   - エージェントが相互作用する外部システムやフレームワークのことです。この場合、Kaggle上の「llm_20_questions」ゲームを実行するためのプラットフォームを指します。

3. **ターンタイプ (turnType)**:
   - ゲーム内でエージェントがどの役割を担っているかを示す状態です。「ask」（質問をする）、 「guess」（単語を推測する）、 「answer」（はい/いいえで回答する）などがあります。

4. **キーワード (Keyword)**:
   - ゲームで当てるべき単語のことです。エージェントはこれを推測することが目的となるため、具体的な言葉を指します。

5. **構成 (Configuration)**:
   - 環境やエージェントを初期化するためのオプション設定です。このノートブックでは、エピソードのステップ数やタイムアウト時間などを調整するために使われます。

6. **デバッグ (Debug)**:
   - プログラムやモデルの動作を確認し、エラーを修正する過程です。特に、エージェントの行動や環境の設定に関する問題を見つけるために用いられます。

7. **エピソード (Episode)**:
   - ゲームの一回の実行を指し、エージェントが行動をとる一連の過程を表します。この文脈では、エンドツーエンドでエージェントが活動するゲームの進行を意味します。

8. **サポートファイル (Support Files)**:
   - エージェントが利用する追加のデータやリソースを含むファイルのことです。例としては、モデルの重みや、エージェントが利用する情報を含んだCSVファイルなどがあります。

9. **オプション引数 (Optional Arguments)**:
   - 関数やメソッドを呼び出す際に指定できる追加的なパラメータ。指定しなければデフォルトの値が使用される場合が多いです。

10. **モード (Mode)**:
   - データを表示する形式や状況を指定します。このノートブックでは、環境のレンダリングを行う際の設定（`mode="ipython"`など）を指します。

これらの用語は、特にこのコンペティションに特有の情報や専用のフレームワークに関連しているため、初心者にはなじみが薄く、理解するのが難しいかもしれません。それぞれの用語の意味や役割を理解することで、ノートブックやコンペティションの内容を効果的に把握できるようになります。

---


# 環境のヒント: NotebookでLLM 20 Questionsを実行する方法

Kaggleの環境を使用してLLM 20 Questionsやその他のコンペティションでエージェントをテストやデバッグする際は、ノートブックで環境を実行できると便利です。以下に、役立つヒントや説明を示します。

# シンプルなエージェントを作成する

実験だけしたい場合、エージェントはPython関数として非常にシンプルにすることができます。エージェントは二つの入力（obsとcfg）を持つ関数で、テキストレスポンスを出力します。

エージェントは、三つのturnTypes（「ask」、「guess」、「answer」）を処理できる必要があります。「answer」のレスポンスは「yes」または「no」でなければなりません。

以下に四つのシンプルなエージェントを示します。


In [None]:
def simple_agent1(obs, cfg):
    # エージェントが推測者でturnTypeが"ask"の場合
    if obs.turnType == "ask": response = "それはアヒルですか？"
    elif obs.turnType == "guess": response = "アヒル"
    elif obs.turnType == "answer": response = "いいえ"
    return response

def simple_agent2(obs, cfg):
    # エージェントが推測者でturnTypeが"ask"の場合
    if obs.turnType == "ask": response = "それは鳥ですか？"
    elif obs.turnType == "guess": response = "鳥"
    elif obs.turnType == "answer": response = "いいえ"
    return response

def simple_agent3(obs, cfg):
    # エージェントが推測者でturnTypeが"ask"の場合
    if obs.turnType == "ask": response = "それは豚ですか？"
    elif obs.turnType == "guess": response = "豚"
    elif obs.turnType == "answer": response = "いいえ"
    return response

def simple_agent4(obs, cfg):
    # エージェントが推測者でturnTypeが"ask"の場合
    if obs.turnType == "ask": response = "それは牛ですか？"
    elif obs.turnType == "guess": response = "牛"
    elif obs.turnType == "answer": response = "いいえ"
    return response

# ゲーム環境の作成と構成

Kaggleの環境は、`make()`関数を使用して*環境*名（`"llm_20_questions"`）といくつかのオプションのデフォルト（*configuration*や*info*など）を指定して作成されます。コンペティションと同じようにゲームを実行したい場合は、デフォルトをそのまま使用できます。


In [None]:
import kaggle_environments
env = kaggle_environments.make(environment="llm_20_questions")
# （"No pygame installed"というエラーは無視できます）

環境を初期化すると、当てるべきキーワードが設定されます。これを`kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword`で確認したり変更したりすることができます。


In [None]:
print("このセッションのキーワードは: ")
print(kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword)
print(" ")
print("一部のキーワードには、受け入れられる代替推測（alts）のリストがあります。")
print("このセッションでは、altsのリストは:")
print(kaggle_environments.envs.llm_20_questions.llm_20_questions.alts)

# LLM 20 Questionsを実行する（デフォルト）

作成した環境（`env`）でゲームを実行します。ゲームを実行する際は、4つのエージェントのリストを提出する必要があります：
* "Agent1"（チーム1の推測者）、 
* "Agent2"（チーム1の回答者）、 
* "Agent3"（チーム2の推測者）、 
* "Agent4"（チーム2の回答者）。 

コンペティションでは、ランダムにチームメイトとペアになり、推測者または回答者の役割を果たします。

（このコンペティションを始めた当初、私はエージェントがチームのために推測者と回答者の両方の役割を果たすと思い込んでいました。しかし、コンペティションでは他の誰かとペアになります。成功するか失敗するかは、ランダムなパートナーとの協力にかかっています。）


In [None]:
%%time
game_output = env.run(agents=[simple_agent1, simple_agent2, simple_agent3, simple_agent4])

この例では、シンプルなエージェントが即座に応答するため、ゲームはすぐに終了します。大規模なLLMをエージェントとして使用した実際のゲームでは、各ステップに1分かかることもあるので、総ゲーム時間は1時間に達する可能性があります。

各ステップのデータは`game_output`で確認できます。

ゲームを視覚的に観察したい場合は、レンダリングできます。


In [None]:
env.render(mode="ipython", width=600, height=500)

# 提出するエージェントの作成

コンペティションにエージェントを提出するには、エージェントのPythonコードを`main.py`というファイルに書き、それをサポートファイルと一緒に`submission.tar.gz`にまとめる必要があります。

以下はシンプルな例です。もちろん、実際のコンペティションでは、公式スターターノートブック（https://www.kaggle.com/code/muhammadehsan000/llm-20-questions-starter）で使用されるようなリアルなLLMを利用することになるでしょう。ノートブックでLLMエージェントを実行するにはより多くの時間とメモリが必要ですので、プレイヤー1としてLLMエージェントをテストする場合、プレイヤー2にはシンプルなエージェントを置くことを検討してください。

* `/kaggle/working/submission`というディレクトリを作成し、その中にサポートファイルを置くための`lib`というサブディレクトリを作成します。


In [None]:
import os
submission_directory = "/kaggle/working/submission"
submission_subdirectory = "lib"

# メインディレクトリが存在しない場合は作成
if not os.path.exists(submission_directory):
    os.mkdir(submission_directory)
    subdirectory_path = os.path.join(submission_directory, submission_subdirectory)
    os.mkdir(subdirectory_path)

In [None]:
# libディレクトリに保存する例のファイルを作成
import csv
with open(os.path.join(subdirectory_path, "example.csv"), mode='w') as file:
    writer = csv.writer(file)
    writer.writerow(["牛", "馬"])

* エージェントのためのmain.pyのPythonコードを書く
* 環境はmain.pyの最後の関数をエージェントとして使用します。この場合は`agent_fun()`です。


In [None]:
%%writefile /kaggle/working/submission/main.py

import os
import sys
import csv
import random


# 提出/libディレクトリに他のファイル（例：モデルの重み）を置く場合は、パスを設定する必要があります
KAGGLE_COMPETITION_PATH = "/kaggle_simulations/agent/" # コンペティション用パス
if os.path.exists(KAGGLE_COMPETITION_PATH):  # コンペティション内で実行している場合
    subdirectory_path = os.path.join(KAGGLE_COMPETITION_PATH, "lib")
else: # ノートブック内で実行している場合
    subdirectory_path = os.path.join("/kaggle/working/submission/", "lib")
sys.path.insert(0, subdirectory_path)


# 例のファイルをロードする
with open(os.path.join(subdirectory_path, "example.csv"), mode='r') as file:
    reader = csv.reader(file)
    guess_list = list(reader)
    guess_list = guess_list[0]

# 例のファイルからランダムな「動物」をグローバル変数として設定
animal = random.choice(guess_list)
    
# main.py内の最後の関数がエージェント関数となります
def agent_fn(obs, cfg):
    
    # エージェントが推測者でturnTypeが"ask"の場合
    if obs.turnType == "ask":
        response = f'それは{animal}のようですか？'
    # エージェントが推測者でturnTypeが"guess"の場合
    elif obs.turnType == "guess":
        if obs.answers[-1] == "yes":
            response = animal
        else:
            response = "ペンギン"
    # エージェントが回答者の場合
    elif obs.turnType == "answer":
        if obs.keyword in obs.questions[-1]:
            response = "yes"
        else:
            response = "no"
        
    return response

この`main.py`ファイルとエージェントは、`/lib/example.csv`のサポートファイルと一緒に提出する準備が整いました。


In [None]:
!apt install pigz pv > /dev/null
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .

このJupyterノートブックから、Team 1の両方のプレイヤーとして`main.py`内のエージェントを実行することができ、Team 2にはsimple_agent3とsimple_agent4を使用します。


In [None]:
game_output = env.run(agents=["/kaggle/working/submission/main.py", "/kaggle/working/submission/main.py", simple_agent3, simple_agent4])
env.render(mode="ipython", width=600, height=500)

# デバッグのヒント

設計やデバッグを行うときは、通常、環境を作成する際にいくつかのオプションの引数を変更したいと思います。これらには以下が含まれます：

`env = make(environment, configuration=None, info=None, steps=None, logs=None, debug=False, state=None)`

`env.specification`で仕様を確認して、環境内で定義された`configuration`や他のオブジェクトについて知ることができます。説明やデフォルト値も表示されます。

新しいエージェントで作業する際は、短いエピソードを実行するために構成を変更し、`debug=True`に設定して、エージェントによって出力される詳細な情報を確認することをお勧めします。

デバッグに適した新しい環境を以下に示します。


In [None]:
# デバッグ用に、2ラウンドのみのゲームをプレイします
debug_config = {'episodeSteps': 7,     # 初期ステップに加えて各ラウンドの3ステップ（ask/answer/guess）
                'actTimeout': 5,       # 各ラウンドのエージェントの時間（デフォルトは60秒）
                'runTimeout': 60,      # エピソードの最大時間（デフォルトは1200秒）
                'agentTimeout': 3600}  # 廃止されたフィールド（デフォルトは3600）

env = kaggle_environments.make("llm_20_questions", configuration=debug_config, debug=True)

注意してください、セッションですでに当てるべきキーワードが設定されています。したがって別のゲームを実行すると、同じキーワードを当てることになります！


In [None]:
print(kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword)

デバッグ中にキーワードを手動で設定したり、キーワードリストからランダムに選択したりすることもできます。


In [None]:
keyword = "アヒル"
alts = ["そのアヒル","アヒル"]
kaggle_environments.envs.llm_20_questions.llm_20_questions.category = "例"
kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword_obj = {'keyword': keyword, 'alts': alts}
kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword = keyword
kaggle_environments.envs.llm_20_questions.llm_20_questions.alts = alts

エージェントにデバッグ用の情報を印刷させることもできます。simple agent 1に`obs`の情報を表示するprint文を追加しました。


In [None]:
def simple_verbose_agent1(obs, cfg):
    
    # エージェントが推測者でturnTypeが"ask"の場合
    if obs.turnType == "ask":
        response = "それはアヒルですか？"
    # エージェントが推測者でturnTypeが"guess"の場合
    elif obs.turnType == "guess":
        response = "アヒル"
    # エージェントが回答者の場合
    elif obs.turnType == "answer":
        response = "いいえ"
    
    # デバッグ情報を印刷
    print("====================")
    print(f"step = {obs.step}")
    print(f"turnType = {obs.turnType}")
    print("obs =")
    print(obs)
    print(" ")
    print(f'response = "{response}"')
    
    
    return response

このsimple_verbose_agent1をTeam 1の両方のプレイヤーとして使用すると、3つのターンタイプ（ask/guess/answer）の情報を観察できます。


In [None]:
game_output = env.run(agents=[simple_verbose_agent1, simple_verbose_agent1, simple_agent3, "/kaggle/working/submission/main.py"])

In [None]:
env.render(mode="ipython", width=600, height=500)