# 要約 
このJupyterノートブックは、Kaggleの「LLM 20 Questions」コンペティションにおけるエージェントの開発とテストを目的としています。ノートブックでは、シンプルなエージェントをPython関数として実装し、ゲーム環境を構築する方法について説明しています。

### 取り組む問題
主な問題は、エージェントが「20の質問」ゲームを効果的にプレイできるようにすることです。具体的には、エージェントが質問する（"ask"）、推測する（"guess"）、回答する（"answer"）という3つのターンタイプを理解し、それに応じた適切な応答を生成する必要があります。

### 使用される手法とライブラリ
- **Kaggle Environments:** Kaggleの特定の環境を構築するために`kaggle_environments`ライブラリを使用し、`make()`関数で環境を作成しています。このライブラリは、エージェントが競争するコンペティションのルールに従った実行を可能にします。
- **エージェントの実装:** 4つのシンプルなエージェント（`simple_agent1`, `simple_agent2`, `simple_agent3`, `simple_agent4`）が定義されており、それぞれが異なる質問を設定して回答します。エージェントは、特定の質問について「はい」または「いいえ」形式の回答を返します。
- **デバッグおよび提出準備:** コンペティション向けにエージェントを提出するためのファイル構成や、エージェントの動作を確認する際のデバッグ方法も示されています。例えば、`main.py`やサポートファイルを作成し、提出用に圧縮します。

### ゲームの実行
ノートブックでは、作成した環境でエージェントを使用してゲームを実行し、ゲームの結果を視覚的に表示する方法も解説しています。最終的に、デバッグ用の設定を用意して、エージェントの応答を詳細に観察することができるようになっています。

全体として、このノートブックは、LLMを活用したエージェント開発の基礎を学び、実装する際の便利なリファレンスとなります。また、開発プロセスの中で発生する可能性のある問題に対しても、効果的な解決策を提供しています。

---


# 用語概説 
以下は、ノートブックに関連する専門用語や概念であり、機械学習・深層学習の初心者がつまずきそうなものの簡単な解説です。

1. **obs (observation)**:
   - ゲームの状況やコンテキストを表すデータ構造。エージェントがゲームの状態に基づいて判断を行うための情報を含む。具体的には、ターンタイプ、質問の履歴、キーワードなどが含まれる。

2. **cfg (configuration)**:
   - 環境の設定や動作に関するパラメータを表す。具体的にはゲームのルール、設定値、デバッグオプションなどが含まれる。エージェントが自身の動作を調整するために使用される情報。

3. **turnType**:
   - エージェントの現在のターンの種類を示す指標。通常、"ask" (質問)、"guess" (推測)、"answer" (回答)の3つのタイプが存在し、エージェントの行動を決定する。

4. **environment**:
   - エージェントが模擬的にゲームを行うための設定されたシステム。Kaggle環境ライブラリを利用しているため、特定のルールセットや条件が定義された状態でゲームを実行できる。

5. **agent_fn**:
   - エージェントの主な関数。ゲーム内でエージェントの行動を定義するもので、"ask"、"guess"、"answer"に基づいてエージェントがどのように応答するかを決定する。

6. **kaggle_environments**:
   - Kaggleが提供する環境ライブラリ。これを使うことにより、様々なコンペティションのシミュレーションを実行できる。環境の作成やエージェントの実行に役立つモジュールが含まれる。

7. **submission.tar.gz**:
   - 提出ファイルのフォーマット。コンペティションに参加するためにエージェントのコードや必要なリソースを圧縮してこの形式で提出する。

8. **env.run()**:
   - 作成した環境内でエージェントを実行する関数。指定したエージェントのリストを受け取り、ゲームを開始しその出力を得る。

9. **obs.questions**:
   - エージェントがこれまでに行った質問のリスト。推測の際に過去の質問を基に判断するために使用される。

10. **debug**:
    - コードやエージェントの動作を詳しく確認するためのモード。通常、冗長な情報を出力したり、特別な設定で環境を実行したりすることによってサポートされる。

11. **episode**:
    - 環境内での一連のゲームプレイ。通常、特定の条件が満たされるまで続くサイクルを指し、エージェントがどのように動作したかを観察・評価するための単位。

これらの用語や概念はノートブックの内容に固有ではないが、特にこの競技においては理解が必要な要素です。

---


# 環境のヒント：ノートブックでLLM 20 Questionsを実行する

![robots_playing_20qs_small.png](attachment:0869cff5-c499-4b2c-bccd-227e14e8aa90.png)

LLM 20 QuestionsやKaggleの環境を利用した他のコンペティションでエージェントをテストおよびデバッグするためには、ノートブックで環境を実行できることが役立ちます。以下に、役立つかもしれないヒントや説明を示します。

# シンプルなエージェントの作成

実験を行いたいだけの場合、エージェントはPython関数として非常にシンプルにすることができます。あなたのエージェントは、obsとcfgの2つの入力を持つ関数であり、テキストの応答を出力します。

エージェントは、3つのturnTypes（"ask"、"guess"、"answer"）を扱える必要があります。answerの応答は「yes」または「no」でなければなりません。

以下は、4つのシンプルなエージェントの例です：

In [None]:
def simple_agent1(obs, cfg):
    # エージェントが推測者で、turnTypeが"ask"の場合
    if obs.turnType == "ask": 
        response = "Is it a duck?"  # 「それはアヒルですか？」と尋ねる
    elif obs.turnType == "guess": 
        response = "duck"  # 推測として「アヒル」と回答する
    elif obs.turnType == "answer": 
        response = "no"  # 答えは「いいえ」であると返す
    return response

def simple_agent2(obs, cfg):
    # エージェントが推測者で、turnTypeが"ask"の場合
    if obs.turnType == "ask": 
        response = "Is it a bird?"  # 「それは鳥ですか？」と尋ねる
    elif obs.turnType == "guess": 
        response = "bird"  # 推測として「鳥」と回答する
    elif obs.turnType == "answer": 
        response = "no"  # 答えは「いいえ」であると返す
    return response

def simple_agent3(obs, cfg):
    # エージェントが推測者で、turnTypeが"ask"の場合
    if obs.turnType == "ask": 
        response = "Is it a pig?"  # 「それは豚ですか？」と尋ねる
    elif obs.turnType == "guess": 
        response = "pig"  # 推測として「豚」と回答する
    elif obs.turnType == "answer": 
        response = "no"  # 答えは「いいえ」であると返す
    return response

def simple_agent4(obs, cfg):
    # エージェントが推測者で、turnTypeが"ask"の場合
    if obs.turnType == "ask": 
        response = "Is it a cow?"  # 「それは牛ですか？」と尋ねる
    elif obs.turnType == "guess": 
        response = "cow"  # 推測として「牛」と回答する
    elif obs.turnType == "answer": 
        response = "no"  # 答えは「いいえ」であると返す
    return response

# ゲーム環境の作成と設定

Kaggleの環境は、`make()`関数を使用して作成され、*環境*の名前（`"llm_20_questions"`）と、*設定*や*情報*といったいくつかのオプションのデフォルトを指定します。コンペティションと同様のゲームを実行したい場合は、デフォルトをそのまま使用することができます。

In [None]:
import kaggle_environments  # Kaggle環境ライブラリをインポートします
env = kaggle_environments.make(environment="llm_20_questions")  # "llm_20_questions"という環境を作成します
# （"No pygame installed"というエラーは無視しても構いません）

環境を初期化すると、推測すべきキーワードが設定されます。このキーワードは、`kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword`で確認したり変更したりすることができます。

In [None]:
print("このセッションのキーワードは次の通りです：")
print(kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword)  # 現在のキーワードを表示します
print(" ")
print("いくつかのキーワードには、受け入れられる別の推測（alts）のリストがあります。")
print("このセッションのaltsのリストは次の通りです：")
print(kaggle_environments.envs.llm_20_questions.llm_20_questions.alts)  # 受け入れられる別の推測のリストを表示します

# LLM 20 Questionsの実行（デフォルト）

作成した環境（`env`）を使用して、この環境でゲームを実行します。ゲームを実行する際には、4つのエージェントのリストを提出する必要があります：
* "Agent1"（チーム1の推測者）、 
* "Agent2"（チーム1の回答者）、 
* "Agent3"（チーム2の推測者）、 
* "Agent4"（チーム2の回答者）。 

コンペティションでは、あなたは無作為にチームメイトとペアになり、推測者または回答者の役割を果たします。

（私がこのコンペティションを始めたとき、誤ってあなたのエージェントがチームの推測者と回答者の両方の役割を果たすと思っていました。しかし、実際には他の人とペアになります。あなたの能力によって、無作為なパートナーとの協力がうまくいくかどうかが決まります。）

In [None]:
%%time  # このセルの実行時間を計測します
game_output = env.run(agents=[simple_agent1, simple_agent2, simple_agent3, simple_agent4])  # エージェントを使ってゲームを実行し、その出力を取得します

この例のゲームは、シンプルなエージェントが即座に応答するため、迅速に完了します。しかし、大きなLLMをエージェントとして使用した実際のゲームでは、各ステップごとに1分かかることがあり、ゲーム全体が1時間かかる可能性があります！

ゲームの各ステップのデータは`game_output`で確認できます。

ゲームを視覚的に観察したい場合は、描画することができます。

In [None]:
env.render(mode="ipython", width=600, height=500)  # ゲームを視覚的に表示するために、IPythonモードでレンダリングします。幅600、高さ500のサイズで表示します。

# 提出可能なエージェントの作成

コンペティションにエージェントを提出するには、エージェントのPythonコードを`main.py`というファイルに記述し、それをサポートファイルと一緒に`submission.tar.gz`に圧縮する必要があります。

以下にシンプルな例を示します。もちろん、実際のコンペティションでは、公式のスターターノートブック（https://www.kaggle.com/code/ryanholbrook/llm-20-questions-starter-notebook）でのように、実際のLLMを使用することを望むでしょう。ノートブックでLLMエージェントを実行するには、より多くの時間とメモリが必要となるため、プレイヤー1として自分のLLMエージェントをテストする際には、プレイヤー2としてシンプルなエージェントを使用することをお勧めします。

* サポートファイルを配置するためのサブディレクトリ`lib`を持つ`/kaggle/working/submission`というディレクトリを作成します。

In [None]:
import os  # osライブラリをインポートします
submission_directory = "/kaggle/working/submission"  # 提出用ディレクトリのパスを指定します
submission_subdirectory = "lib"  # サブディレクトリの名前を指定します
# メインディレクトリが存在しない場合は作成します
if not os.path.exists(submission_directory):  
    os.mkdir(submission_directory)  # メインディレクトリを作成します
    subdirectory_path = os.path.join(submission_directory, submission_subdirectory)  # サブディレクトリのパスを作成します
    os.mkdir(subdirectory_path)  # サブディレクトリを作成します

In [None]:
# libディレクトリに保存するための例ファイルを作成します
import csv  # csvライブラリをインポートします
with open(os.path.join(subdirectory_path, "example.csv"), mode='w') as file:  # サブディレクトリ内に"example.csv"というファイルを作成します
    writer = csv.writer(file)  # CSVライターオブジェクトを作成します
    writer.writerow(["cow", "horse"])  # "cow"と"horse"というヘッダー行を書き込みます

* あなたのエージェントのための`main.py`というPythonコードを書いてください。
* 環境は`main.py`内の最後の関数をあなたのエージェントとして使用します。この場合は`agent_fun()`です。

In [None]:
%%writefile /kaggle/working/submission/main.py

import os
import sys
import csv
import random

# もしlibディレクトリに他のファイル（例えばモデルの重み）を置く場合、そのパスを設定する必要があります
KAGGLE_COMPETITION_PATH = "/kaggle_simulations/agent/" # コンペティションのパス
if os.path.exists(KAGGLE_COMPETITION_PATH):  # コンペティション内で実行されている場合
    subdirectory_path = os.path.join(KAGGLE_COMPETITION_PATH, "lib")  
else:  # ノートブック内で実行されている場合
    subdirectory_path = os.path.join("/kaggle/working/submission/", "lib")
sys.path.insert(0, subdirectory_path)  # サブディレクトリのパスをシステムパスに追加します

# 例ファイルの読み込み
with open(os.path.join(subdirectory_path,"example.csv"), mode='r') as file:  # "example.csv"を読み込みます
    reader = csv.reader(file)
    guess_list = list(reader)  # CSVの内容をリストとして取得します
    guess_list = guess_list[0]  # 一次元リストにします

# 例ファイルからランダムに"animal"をグローバル変数として設定します
animal = random.choice(guess_list)

# main.pyの最後の関数がエージェント関数になります
def agent_fn(obs, cfg):
    
    # エージェントが推測者で、turnTypeが"ask"の場合
    if obs.turnType == "ask":
        response = f'Does it look like a {animal}?'  # 「それは{animal}のように見えますか？」と尋ねる
    # エージェントが推測者で、turnTypeが"guess"の場合
    elif obs.turnType == "guess":
        if obs.answers[-1]=="yes":  # 最後の応答が「はい」の場合
            response = animal  # 推測としてanimalを返す
        else:
            response = "penguin"  # それ以外の場合は「ペンギン」と返す
    # エージェントが回答者の場合
    elif obs.turnType == "answer":
        if obs.keyword in obs.questions[-1]:  # キーワードが最後の質問に含まれている場合
            response = "yes"  # 「はい」と返す
        else:
            response = "no"  # それ以外の場合は「いいえ」と返す
        
    return response  # 応答を返す

この`main.py`ファイルにはエージェントが含まれており、`/lib/example.csv`のサポートファイルと一緒に提出する準備が整いました。

In [None]:
!apt install pigz pv > /dev/null  # pigzとpvをインストールします（出力を抑制します）
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .  # 提出ファイルを圧縮してsubmission.tar.gzを作成します



このJupyterノートブックから`main.py`のエージェントをチーム1の両プレイヤーとして実行できます。また、チーム2にはsimple_agent3とsimple_agent4を使用します。

In [None]:
game_output = env.run(agents=["/kaggle/working/submission/main.py", "/kaggle/working/submission/main.py", simple_agent3, simple_agent4])  # チーム1の2人のプレイヤーとしてmain.pyエージェントを実行し、チーム2にはsimple_agent3とsimple_agent4を使用します
env.render(mode="ipython", width=600, height=500)  # ゲームの結果を視覚的に表示します

# デバッグのヒント

デザインやデバッグを行う際には、環境を作成する際にいくつかのオプション引数を変更したいことが通常です。これには以下が含まれます：

`env = make(environment, configuration=None, info=None, steps=None, logs=None, debug=False, state=None)`

`env.specification`で仕様を確認すると、環境内で定義されている`configuration`や他のオブジェクトについて学ぶことができます。その中には説明とデフォルト値が示されています。

新しいエージェントに取り組む際には、構成を変更して少ないステップで短いエピソードを実行することをお勧めします。また、`debug=True`を設定することで、エージェントによって印刷される冗長な出力を確認できます。

ここにデバッグに適した新しい環境があります。

In [None]:
# デバッグ用に、2ラウンドだけでゲームをプレイします
debug_config = {'episodeSteps': 7,     # 初期ステップに加えて、ラウンドごとに3ステップ（質問/回答/推測）
                'actTimeout': 5,       # ラウンドごとのエージェントのタイムアウト（秒）；デフォルトは60
                'runTimeout': 60,      # エピソードの最大実行時間（秒）；デフォルトは1200
                'agentTimeout': 3600}  # 廃止されたフィールド；デフォルトは3600

env = kaggle_environments.make("llm_20_questions", configuration=debug_config, debug=True)  # デバッグ設定で環境を作成します

注意してください。このセッションでは、すでに推測すべきキーワードが設定されています。ですので、別のゲームを実行すると、同じキーワードを推測することになります！

In [None]:
print(kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword)  # 現在のキーワードを表示します

デバッグを行う際には、キーワードを手動で設定したり、キーワードリストからランダムに選択したりすることが望ましい場合があります。

In [None]:
keyword = "Duck"  # キーワードを「Duck」に設定します
alts = ["The Duck", "A Duck"]  # 受け入れられる別の推測のリストを設定します
kaggle_environments.envs.llm_20_questions.llm_20_questions.category = "Example"  # カテゴリーを「Example」に設定します
kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword_obj = {'keyword': keyword, 'alts': alts}  # キーワードオブジェクトを設定します
kaggle_environments.envs.llm_20_questions.llm_20_questions.keyword = keyword  # キーワードを設定します
kaggle_environments.envs.llm_20_questions.llm_20_questions.alts = alts  # 受け入れられる推測のリストを設定します

エージェントがデバッグ用にいくつかの情報を印刷できるようにします。`obs`内で利用可能な情報を示すために、シンプルエージェント1に印刷文を追加しました。

In [None]:
def simple_verbose_agent1(obs, cfg):
    
    # エージェントが推測者で、turnTypeが"ask"の場合
    if obs.turnType == "ask":
        response = "Is it a duck?"  # 「それはアヒルですか？」と尋ねる
    # エージェントが推測者で、turnTypeが"guess"の場合
    elif obs.turnType == "guess":
        response = "duck"  # 推測として「アヒル」と回答する
    # エージェントが回答者の場合
    elif obs.turnType == "answer":
        response = "no"  # 答えは「いいえ」であると返す
    
    # デバッグ情報を印刷します
    print("====================")
    print(f"step = {obs.step}")  # 現在のステップを表示します
    print(f"turnType = {obs.turnType}")  # 現在のターンタイプを表示します
    print("obs =")  # obsの内容を表示します
    print(obs)  
    print(" ")
    print(f'response = "{response}"')  # 応答を表示します
    
    return response  # 応答を返す

simple_verbose_agent1をチーム1の両プレイヤーとして配置することで、3つのターンタイプ（質問/推測/回答）それぞれを観察することができます。

In [None]:
game_output = env.run(agents=[simple_verbose_agent1, simple_verbose_agent1, simple_agent3, "/kaggle/working/submission/main.py"])  # チーム1の両プレイヤーにsimple_verbose_agent1を使用し、チーム2にはsimple_agent3とmain.pyエージェントを使用してゲームを実行します。

In [None]:
env.render(mode="ipython", width=600, height=500)  # ゲームの結果を視覚的に表示します。

---

# コメント

> ## bluekeroro
> 
> [@rturley](https://www.kaggle.com/rturley) 共有してくれてありがとう！！ですが、llm_20_questions.pyとllm_20_questions.jsの2つの入力データファイルはどのように機能するのか、少し質問があります。
> 
> 
> > ## RS TurleyTopic Author
> > 
> > どういたしまして！
> > 
> > それらはコンペティションに付属する標準のファイルです。上記の例のノートブックでは直接使用されていません。
> > 
> > しかし、それらはkaggle_environmentsからこの特定の環境を実行するために必要なコンポーネントであるため、デバッグの際に参照するのに役立ちます。例えば、GitHubリポジトリで確認できます（[https://github.com/Kaggle/kaggle-environments/tree/master/kaggle_environments/envs/llm_20_questions](https://github.com/Kaggle/kaggle-environments/tree/master/kaggle_environments/envs/llm_20_questions)）。
> > 
> > 特に：
> > 
> > - llm_20_questions.pyにはゲームのメインコードが含まれており、大文字と小文字が重要かどうかなどの詳細を確認できます。
> > 
> > - llm_20_questions.jsには過去のゲームをレンダリングするためのJavaScriptが含まれています。以前のKaggle環境コンペティションでは、エージェントの視覚的動作を観察する際に追加情報を表示するためにデフォルトのレンダリングを変更することが時々有用でしたが、今回はテキストを印刷することがより役立つと思います。
> > 
> > 
> > > ## bluekeroro
> > > 
> > > わかりました。親切で詳細な説明をありがとうございます。
> > > 
> > > 
> > > 

---

> ## Matin Mahmoudi ✨
> 
> あなたのノートブックは魅力的なアプローチを提供していますね、[@rturley](https://www.kaggle.com/rturley)。インタラクティブな要素と明確な説明により、非常にユーザーフレンドリーです。素晴らしい友人！
> 
> 

---

> ## Payam Amanat
> 
> 有益で非常に役立つノートブックですね、[@rturley](https://www.kaggle.com/rturley)。共有してくれてありがとうございます。
> 
> あなたのノートブックについての意見を知ることができると素晴らしいです。
> 
> 

---

> ## Zeeshan Latif
> 
> [@rturley](https://www.kaggle.com/rturley) あなたの詳細で明確なプレゼンテーションは非常に有益です。ありがとうございます！
> 
> 
> > ## RS TurleyTopic Author
> > 
> > 役に立てて嬉しいです！
> > 
> > 
> 
