# 要約 
このJupyter Notebookは、「20の質問」ゲームをプレイするためのエージェントを開発することを目的としています。特に、ターン制のエージェントアプローチを用いて、人、場所、または物を特定するために、大規模言語モデルや新しいプログラミング手法を活用しています。

### 問題定義
- **ターゲットの特定**: キーワードのリストから、エージェントが人、場所、または物を特定します。
- **考えられる解決策**:
  - 大規模言語モデルをGISデータや製品情報とファインチューニングすることで、正確な推測を支援。
  - 地理情報システムのデータセットを用いた場所の識別。
  - キーワードのセグメンテーションを通じた新しいアプローチの提案。

### 使用される手法とライブラリ
- **Pandas**: キーワードのデータフレーム管理。
- **JSON**: キーワードリストの読み込みと管理。
- **Torch**: Gemmaモデルを使用したニューラルネットワークの構築。
- **Kaggle Environments**: ゲーム環境のシミュレーション。
- **Gemma**: 特に自然言語処理に特化した大規模言語モデルとして使用。

### エージェントの設計
- **質問者エージェント**: 人物、場所、または物を特定するための質問を生成。
- **回答者エージェント**: 質問に対して「はい」または「いいえ」で応答。
- 各エージェントは、セッション管理とレスポンス解析を行い、ゲームのラウンドに沿ったインタラクションを実現します。

### 実行と環境
- 環境設定を行い、複数のエージェントを同時に実行することでゲームの進行をシミュレーションし、各エージェントのパフォーマンスを観察します。

このアプローチは、対話システムの開発やゲームAIの研究などにおいて、興味深い応用を持つものです。

---


# 用語概説 
以下に、提出されたJupyterノートブックに関連する専門用語について、初心者がつまずきそうなものの簡単な解説を示します。

1. **ターン制**:
   - ゲームや対話の中で、プレイヤーが順番に行動を行う形式を指します。このノートブックでは、質問者と回答者が交互にアクションを行う「20の質問」ゲームの進行方法を指しています。

2. **GIS座標**:
   - 地理情報システム（GIS）で使用される座標で、地球上の位置を数値的に表現するためのものです。具体的には、緯度（Lat）と経度（Lon）を用いて位置を特定します。

3. **ファインチューニング**:
   - 学習済みモデルのパラメータを、新しいデータに合わせて再調整することです。特に、事前学習したモデルを特定のタスク（ここでは、言語モデルを使ったゲーム）に適応させるために行います。

4. **トークン**:
   - 自然言語処理において、テキストを意味のある単位に分割したものです。単語やサブワードなどが含まれます。モデルが理解可能な形式にするためのデータ構造です。

5. **逆引きの非監視モデル**:
   - ラベルなしのデータを使用して学習するモデルで、特定の出力を示さないデータから特徴やパターンを抽出し、推測を行います。逆引きとは、入力から出力を推測することを指します。

6. **Few-shot learning**:
   - 限られた学習例（数例）から一般化する能力を持つモデルを指します。このノートブックでは、一部の例を使用してモデルの推論を助ける方法が示されています。

7. **イエスまたはノーの質問**:
   - 2つの選択肢（「はい」または「いいえ」）から答える形式の質問で、この形式は推測ゲームで一般的です。

8. **サンプリングパラメータ**:
   - モデルから生成される出力の多様性や特性を調整するための設定です。具体的には、温度（temperature）、確率（top_p）、および上位k（top_k）が含まれます。

9. **ガーベジコレクション**:
   - メモリ管理の手法の一つで、不要になったオブジェクトを自動的に削除することを指します。この処理により、メモリリークを防ぐことができます。

10. **エージェント**:
    - 特定のタスクや役割を持っているプログラムまたはモデルを指します。この場合、質問者エージェントと回答者エージェントがゲームでそれぞれ異なる役割を果たしています。

これらの解説を通じて、初心者でも理解しやすくすることが意図されています。もし他に特定の用語についての説明が必要であれば、お知らせください。

---


## 問題定義:
ターン制のエージェントアプローチを使用して「20の質問」ゲームをプレイしながら、キーワードのリストから人、場所、または物を特定するために、大規模言語モデルまたは新しいプログラミングアプローチを使用します。

考えられる解決策:

* 大規模言語モデルを、写真からのランドマークや都市のGIS座標中心点でファインチューニングし、国、都市、州、ランドマークの推測をより適切に合わせることができます。

* GIS座標を使用した電話のテキスト会話データセットも、場所を特定するために使用でき、言語、特定の会話パターン、または俗語の地域性を識別する可能性があります。

* 物については、製品説明や製品レビューが使用可能です。

* 人については、ウィキペディアやLinkedIn、出会い系サイトなどのソーシャルネットワーキングが利用されます。

* ファインチューニングなしの他のアプローチとしては、トークンを識別して「20の質問」の範囲内でキーワードに迅速に到達するためのセグメンテーションを行う優れた検索信号を生み出すことが考えられます。これに基づいて、現在の使用モデルの重みや埋め込みを使用した逆引きの非監視モデルが可能です。

例:
* https://www.cia.gov/the-world-factbook/
* https://public-nps.opendata.arcgis.com/datasets/nps::national-register-of-historic-places-points/explore


## キーワードリスト



In [None]:
import pandas as pd
import json

from importlib.machinery import SourceFileLoader
keywords = SourceFileLoader("keywords",'/kaggle/input/llm-20-questions/llm_20_questions/keywords.py').load_module()
df = json.loads(keywords.KEYWORDS_JSON)
words = []
for c in df:
    print(c['category'], len(c['words']))
    for w in c['words']:
        words.append([c['category'], w["keyword"], w["alts"], "", "", 0.0, 0.0])
df = pd.DataFrame(words, columns=['Category','Word','Alternatives', "Cat1", "Cat2", "Lat", "Lon"])
df.tail()

## テンプレートフォーマット
* https://www.promptingguide.ai/models/gemma


In [None]:
template_special_tokens = ['<bos>','<start_of_turn>user','<start_of_turn>model','<end_of_turn>','<eos>']
#エージェント1 - 推測者（モデル？）
#エージェント2 - 回答者（ユーザー？）
#エージェント3 - 推測者（モデル？）
#エージェント4 - 回答者（ユーザー？）

def agentx(obs, cfg):
    if obs.turnType == "ask": response = ""  # 質問の際のレスポンスを初期化
    elif obs.turnType == "guess": response = ""  # 推測の際のレスポンスを初期化
    elif obs.turnType == "answer": response = ""  # 回答の際のレスポンスを初期化
    else: response = "私は幻覚を見ていますか？ **はい**"  # 不明なターンタイプへのレスポンス
    return response

## 20の質問提出モデル


In [None]:
%%bash
cd /kaggle/working
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece  # 必要なパッケージのインストール
git clone https://github.com/google/gemma_pytorch.git > /dev/null  # GemmaのPyTorchバージョンをクローン
mkdir /kaggle/working/submission/lib/gemma/  # Gemma用のディレクトリを作成
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/  # Gemmaのファイルを移動

In [None]:
%%writefile submission/main.py

import torch, itertools, contextlib
import os, sys, re, gc
from typing import Iterable
from pathlib import Path
gc.enable()  # ガーベジコレクションを有効にする

KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"  # Kaggleエージェントのパス設定
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))  # Kaggleエージェントのライブラリをパスに追加
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/2b-it/2")  # 重みのパス設定
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")  # ローカルライブラリのパスに追加
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/2b-it/2"  # 重みのパス設定

from gemma.config import get_config_for_2b  # Gemmaの設定をインポート
from gemma.model import GemmaForCausalLM  # Gemmaモデルをインポート

# ゲームの履歴を保存するために、オープンファイルを使用して凝縮・補完することができる（open('gamemaster.dat'), open('player.dat')）
class AgentFormatter:
    def __init__(self, sp: str = None, fse: Iterable = None):
        self._system_prompt = sp  # システムプロンプトの初期化
        self._few_shot_examples = fse  # Few-shotの例の初期化
        self._turn_user = f"<start_of_turn>user\n{{}}<end_of_turn>\n"  # ユーザーのターン形式
        self._turn_model = f"<start_of_turn>model\n{{}}<end_of_turn>\n"  # モデルのターン形式
        self.reset()  # フォーマッタをリセット
    def __repr__(self):
        return self._state  # 現在の状態を表示
    def user(self, prompt):
        self._state += self._turn_user.format(prompt)  # ユーザーからの入力を追加
        return self
    def model(self, prompt):
        self._state += self._turn_model.format(prompt)  # モデルからの入力を追加
        return self
    def reset(self):
        self._state = ""  # 状態をリセット
        if self._system_prompt is not None:
            self.user(self._system_prompt)  # システムプロンプトがある場合、ユーザーターンとして追加
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')  # Few-shotの例を追加
        return self
    def apply_turns(self, turns: Iterable, start_agent: str):
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]  # ターンの順番を決定
        formatters = itertools.cycle(formatters)  # 順番にサイクルする
        for fmt, turn in zip(formatters, turns):
            fmt(turn)  # 各ターンを適用
        return self

@contextlib.contextmanager
def _set_default_tensor_type(dtype: torch.dtype):
    torch.set_default_dtype(dtype)  # デフォルトテンソル型を設定
    yield
    torch.set_default_dtype(torch.float)  # デフォルトを戻す

class Agent:
    def __init__(self, sp=None, fse=None):
        self._device = torch.device('cuda:0')  # CUDAデバイスを指定
        self.formatter = AgentFormatter(sp=sp, fse=fse)  # エージェントフォーマッタの初期化
        print("モデルの初期化中")
        model_config = get_config_for_2b()  # モデルの設定を取得
        model_config.tokenizer = WEIGHTS_PATH + '/tokenizer.model'  # トークナイザーのパスを設定
        with _set_default_tensor_type(model_config.get_dtype()):  # デフォルトテンソル型を設定
            model = GemmaForCausalLM(model_config)  # Gemmaのモデルを初期化
            model.load_weights(WEIGHTS_PATH + '/gemma-2b-it.ckpt')  # 重みをロード
            self.model = model.to(self._device).eval()  # デバイスにモデルを設定し評価モードに
    def __call__(self, obs, *args):
        self._start_session(obs)  # セッションを開始
        prompt = str(self.formatter)  # フォーマットされたプロンプトを取得
        response = self._call_llm(prompt)  # LLMにプロンプトを渡してレスポンスを取得
        response = self._parse_response(response, obs)  # レスポンスをパース
        print(obs.turnType, response)  # レスポンスを表示
        return response
    def _call_llm(self, prompt, max_nt=40, **sampler_kwargs):
        if sampler_kwargs is None:
            sampler_kwargs = {'temperature': 0.9, 'top_p': 0.9, 'top_k': 50,}  # サンプリングパラメータ
        response = self.model.generate(
            prompt, device=self._device, output_len=max_nt, **sampler_kwargs,)  # モデルからレスポンスを生成
        return response
    def _parse_keyword(self, response: str):
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)  # キーワードリストから最も近い一致をチェック
        if match is None: keyword = ''
        else: keyword = match.group().lower()  # 一致するキーワードを小文字に変換
        return keyword
    def _parse_response(self, response: str, obs: dict):
        if obs.turnType == 'ask':
            match = re.search(".+?\?", response.replace('*', ''))  # 質問形式のレスポンスをパース
            if match is None: question = "それは場所ですか？"  # 質問がない場合
            else: question = match.group()  # 質問を設定
            return question
        elif obs.turnType == 'guess':
            guess = self._parse_keyword(response)  # 推測をパース
            if guess is None or len(guess) <= 1: 
                return "推測なし"  # 推測できない場合のレスポンス
            else: 
                return guess  # 推測を返す
        elif obs.turnType == 'answer':
            answer = self._parse_keyword(response)  # 答えをパース
            return 'はい' if 'はい' in answer else 'いいえ'  # 「はい」または「いいえ」を返す
        else: raise ValueError("未知のターンタイプ:", obs.turnType)  # エラー処理

def interleave_unequal(x, y):
    return [item for pair in itertools.zip_longest(x, y) for item in pair if item is not None]  # 不均等なリストを交互に結合する関数

class QuestionerAgent(Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)  # 親クラスの初期化
    def _start_session(self, obs):
        self.formatter.reset()  # フォーマッタをリセット
        self.formatter.user("あなたは20の質問ゲームの質問者としてプレイしています。")  # 質問者としての初期プロンプト
        turns = interleave_unequal(obs.questions, obs.answers)  # 質問と回答を交互に取り出す
        self.formatter.apply_turns(turns, start_agent='model')  # ターンを適用
        if obs.turnType == 'ask':
            self.formatter.user("あなたは、人物、場所、または物を見つけるためにイエスまたはノーの質問をするターンです。")  # 質問のターン
        elif obs.turnType == 'guess':
            self.formatter.user("あなたは人物、場所、または物を推測するターンです。推測を「**もの**」のように二重アスタリスクで囲んでください。")  # 推測のターン
    def _parse_response(self, response: str, obs: dict):
        if obs.turnType == 'ask':
            match = re.search(".+?\?", response.replace('*', ''))  # 質問をパース
            if match is None: question = "それは場所ですか？"  # デフォルト質問
            else: question = match.group()  # 質問を取得
            return question
        elif obs.turnType == 'guess':
            guess = self._parse_keyword(response)  # 推測をパース
            if guess is None or len(guess) <= 1: 
                return "推測なし" 
            else: 
                return guess  # 推測を返す
        elif obs.turnType == 'answer':
            answer = self._parse_keyword(response)  # 答えをパース
            return 'はい' if 'はい' in answer else 'いいえ'  # 答えを返す
        else: raise ValueError("未知のターンタイプ:", obs.turnType)  # エラー処理

class AnswererAgent(Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)  # 親クラスの初期化
    def _start_session(self, obs):
        self.formatter.reset()  # フォーマッタをリセット
        self.formatter.user(f"あなたは20の質問ゲームの回答者としてプレイしています。キーワードは{obs.keyword}で、カテゴリは{obs.category}です。")  # 初期プロンプト
        turns = interleave_unequal(obs.questions, obs.answers)  # ターンを交互に適用
        self.formatter.apply_turns(turns, start_agent='user')  # ユーザーのターンを適用
        self.formatter.user(f"質問はキーワード{obs.keyword}について、カテゴリは{obs.category}です。イエスまたはノーで答え、答えを二重アスタリスクで囲んでください。")  # 質問プロンプト
    def _parse_response(self, response: str, obs: dict):
        answer = self._parse_keyword(response)  # 答えをパース
        return 'はい' if 'はい' in answer else 'いいえ'  # 答えを返す

sp = "あなたは20の質問ゲームをプレイしています。このゲームでは、回答者がキーワードを考え、質問者がイエスまたはノーの質問をします。キーワードは特定の人物、場所、または物です。"
fse = [
    "あなたは20の質問ゲームの質問者としてプレイしています。人物、場所、または物のキーワードを見つけるために最初の質問をしてください。",
    "これは人物ですか？", "**いいえ**",
    "これは場所ですか？", "**はい**",
    "これは国ですか？", "**はい** 推測してみてください。",
    "**フランス**", "正解です！",
]
agent = None

def get_agent(name: str):
    global agent
    if agent is None and name == 'questioner':
        agent = QuestionerAgent(sp=sp, fse=fse,)  # 質問者エージェントの初期化
    elif agent is None and name == 'answerer':
        agent = AnswererAgent(sp=sp, fse=fse,)  # 回答者エージェントの初期化
    assert agent is not None, "エージェントが初期化されていません。"  # エージェントの初期化確認
    return agent

def agent_fn(obs, cfg):
    if obs.turnType == "ask": response = get_agent('questioner')(obs)  # 質問のターンに応じたエージェントを取得
    elif obs.turnType == "guess": response = get_agent('questioner')(obs)  # 推測のターンに応じたエージェントを取得
    elif obs.turnType == "answer": response = get_agent('answerer')(obs)  # 回答のターンに応じたエージェントを取得
    
    if response is None or len(response) <= 1: return "いいえ"  # レスポンスが不明または短い場合
    else: return response  # レスポンスを返す

# テスト


In [None]:
!pip install -q pygame  # pygameのインストール
!pip install -q 'kaggle_environments>=1.14.8'  # Kaggle環境のインストール

In [None]:
#コードを実行
%run submission/main.py  # メインファイルを実行

In [None]:
from kaggle_environments import make  # Kaggle環境をインポート
env = make("llm_20_questions", debug=True)  # 環境を作成
agent = "/kaggle/working/submission/main.py"
env.reset()  # 環境のリセット
logs = env.run([agent, agent, agent, agent])  # 4つのエージェントを実行
#while not env.done: #ここにテストのステップを追加
env.render(mode="ipython", width=800, height=800)  # 環境を描画

# パッケージ


In [None]:
!apt install pigz pv > /dev/null  # pigzとpvのインストール

In [None]:
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ gemma/pytorch/2b-it/2  # tar圧縮

---

# コメント 

> ## DataDiva007
> 
> データサイエンスプロジェクトに取り組むことはとても中毒性があり、ここに来てとても楽しいです！
> 
> 

---

> ## SuM
> 
> すばらしい仕事 [@jazivxt](https://www.kaggle.com/jazivxt)🎉
> 
> 共有してくれてありがとう、これは初心者にとって重要なインスピレーションを与えます😃
> 
> 

---

> ## Neel Patel
> 
> 素晴らしい作業、提出前にモデルをテストするのに非常に役立ちます。 :)

> 

---

> ## Hassan shahidi
> 
> 素晴らしいノートブック [@jazivxt](https://www.kaggle.com/jazivxt)
> 
> 

---

> ## Prajwal Kanade
> 
> すばらしい情報です、
> 
> 素晴らしい仕事 [@jazivxt](https://www.kaggle.com/jazivxt) 
> 
> 

---

> ## Utkarsh Jain
> 
> 興味深いノートブック！！非常に洞察に満ちています！！
> 
> 

---

> ## huoyeqianxun
> 
> CUDAのメモリ不足のようです…
> 
> ノートブックで4つのエージェントを実行できませんか？？？
> 
> 

---