# 要約 
### Jupyter Notebookの要約

このノートブックは、Kaggleのコンペティション「LLM 20 Questions」に参加するためのAIエージェントを作成するプロセスを示しています。主に、ターゲットワードを推測するための質問を生成し、回答を行う二つのエージェント（質問者エージェントと回答者エージェント）の実装が行われています。

#### 問題
コンペティションでは、「20の質問」ゲームの形式で人、場所、物などのターゲットワードを特定することが求められており、AIがこのゲームにおいて効果的な質問を行い、正しい答えを導き出すことが求められています。

#### 手法
1. **ライブラリとセットアップ**：
   - `immutabledict`と`sentencepiece`を用いてライブラリをインストール。
   - `gemma_pytorch`リポジトリから必要なモデルをクローンし、指定のディレクトリに配置。

2. **エージェントの定義**：
   - `GemmaFormatter`クラスは、ユーザーとモデルの対話形式を管理し、質問や応答を整理する役割を果たしています。
   - `GemmaAgent`クラスは基本的なエージェント機能を提供し、質問者エージェント(`GemmaQuestionerAgent`)と回答者エージェント(`GemmaAnswererAgent`)がこのクラスを継承して特化した機能を追加しています。

3. **モデルの利用**：
   - `GemmaForCausalLM`モデルを使用して、生成されたプロンプトに基づき応答を生成するメカニズムが組み込まれています。

4. **エージェントの戦略**：
   - 質問の生成やターゲットワードの推測を行うためのプロンプトの設定が行われており、ゲームの進行に従ってエージェントが自動的に更新されます。

5. **ファイルの生成**：
   - 最終的に、`submission.tar.gz`ファイルが作成され、提出用のアーカイブとして用意されます。このファイルにはエージェントのコードと必要なリソースが含まれ、競技への提出のために使用されます。

全体として、このノートブックは「20の質問」のゲームに特化したAIエージェントを開発するために必要な設定と構築の過程を明示的に示しており、利用するライブラリや手法も具体的に記されています。

---


# 用語概説 
以下は、Jupyter Notebookの内容に関連するいくつかの専門用語の解説です。初心者がつまずきやすい、比較的マイナーな用語やドメイン特有の知識に焦点を当てています。

1. **submission.tar.gz**:
   - コンペティションに提出するための圧縮ファイル形式。この形式は、ファイルサイズを小さくして送信時の効率を上げるためによく使用される。

2. **immutabledict**:
   - 基本的にはPythonの辞書型（dict）ですが、変更不可能（イミュータブル）な特性を持つ。この特徴によりデータの整合性が保たれ、特に並行処理環境でのバグを減らすのに役立つ。

3. **sentencepiece**:
   - 自然言語処理（NLP）で使用されるトークナイザの一種で、テキストデータをサブワードユニットに分割するためのツール。これにより、未知の単語への対応力が向上し、モデルの汎化能力が高まる。

4. **GemmaForCausalLM**:
   - 「Causal Language Model（因果言語モデル）」のために設計された特定のモジュール。与えられた文脈から次の単語を予測するタスクに特化している。LLM（大規模言語モデル）の一部として機能する。

5. **プロンプトフォーマット**:
   - モデルからの応答を生成するために入力される形式化されたテキスト。特にモデルを有効に利用するためには、一貫したプロンプトが重要であり、それが結果に大きな影響を与える。

6. **contextlib**:
   - Pythonの標準ライブラリで、コンテキストマネージャをサポートするモジュール。リソースの管理（例えばファイルのオープンやデータベース接続）を簡潔に行うための便利なツールを提供する。

7. **torch.dtype**:
   - PyTorchで使用されるデータ型の設定を指す。この設定は、計算精度やメモリ使用量に影響する。

8. **myfitter**:
   - 定義されていないおそらくカスタムな機能またはモジュール名として、ユーザーが提供するデータの形式に準拠するためのコードである可能性がある。このようなカスタム関数を作成することで、特定のユースケースに特化した操作が可能になる。

9. **interleave_unequal**:
   - 二つのリストを交互に組み合わせる際に、リストの長さが異なる場合でも、ペアができる限り組み合わせるための関数。データ処理や分析を行う際に、特に異なる長さのデータを扱うときに有用。

10. **エージェント**:
    - ここでのエージェントとは、特定の役割（質問者、回答者など）を持つAIコンポーネントを指す。これにより、複数のエージェントが協調して作業を行い、目的を達成するためのプロセスが効率化される。

11. **GemmaAgent**:
    - Gemma プロジェクトに関連する一連のエージェントの基本となるクラス。これを継承することで、特定の役割を持ったランタイムエージェント（質問者や回答者）を実装する。

これらの用語は、コンペティションやノートブックの文脈において特に重要であり、理解することで作業全体の理解を深める助けとなるでしょう。

---


このノートブックは、**LLM 20 Questions**のエージェント作成プロセスを示しています。このノートブックを実行すると、`submission.tar.gz`ファイルが生成されます。このファイルは、右側の**コンペティションへの提出**ヘッディングから直接提出できます。あるいは、ノートブックビューワーから*Output*タブをクリックし、`submission.tar.gz`を見つけてダウンロードします。競技のホームページの左上にある**エージェントを提出**をクリックして、ファイルをアップロードし、提出を行ってください。

In [None]:
```bash
%%bash
# /kaggle/workingディレクトリに移動します
cd /kaggle/working

# immutabledictとsentencepieceを、submission/libディレクトリにインストールします
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece

# GitHubからgemma_pytorchリポジトリをクローンします。
# 出力は表示しないようにしています
git clone https://github.com/google/gemma_pytorch.git > /dev/null

# gemmaを格納するディレクトリを作成します
mkdir /kaggle/working/submission/lib/gemma/

# gemma_pytorchからgemmaのファイルをsubmission/lib/gemma/に移動します
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/
``` 

# このコードは、必要なライブラリをインストールし、指定されたリポジトリからコードをクローンするプロセスを示しています。
# 最後に、クローンしたファイルを特定のディレクトリに移動させています。

In [None]:
%%writefile submission/main.py
# セットアップ
import os
import sys

# **重要:** コードがノートブックとシミュレーション環境の両方で機能するように
# システムパスをこのように設定してください。
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

import contextlib
import os
import sys
from pathlib import Path

import torch
from gemma.config import get_config_for_7b, get_config_for_2b
from gemma.model import GemmaForCausalLM

if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"

# プロンプトフォーマット
import itertools
from typing import Iterable


class GemmaFormatter:
    _start_token = '<start_of_turn>'
    _end_token = '<end_of_turn>'

    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self._turn_user = f"{self._start_token}user\n{{}}{self._end_token}\n"
        self._turn_model = f"{self._start_token}model\n{{}}{self._end_token}\n"
        self.reset()

    def __repr__(self):
        return self._state

    def user(self, prompt):
        self._state += self._turn_user.format(prompt)
        return self

    def model(self, prompt):
        self._state += self._turn_model.format(prompt)
        return self

    def start_user_turn(self):
        self._state += f"{self._start_token}user\n"
        return self

    def start_model_turn(self):
        self._state += f"{self._start_token}model\n"
        return self

    def end_turn(self):
        self._state += f"{self._end_token}\n"
        return self

    def reset(self):
        self._state = ""
        if self._system_prompt is not None:
            self.user(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self

    def apply_turns(self, turns: Iterable, start_agent: str):
        # どちらのエージェントがターンを開始するかを決定します
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)
        for fmt, turn in zip(formatters, turns):
            fmt(turn)
        return self


# エージェント定義
import re


@contextlib.contextmanager
def _set_default_tensor_type(dtype: torch.dtype):
    """与えられたdtypeにデフォルトのtorch dtypeを設定します。"""
    torch.set_default_dtype(dtype)
    yield
    torch.set_default_dtype(torch.float)


class GemmaAgent:
    def __init__(self, variant='7b-it-quant', device='cuda:0', system_prompt=None, few_shot_examples=None):
        self._variant = variant
        self._device = torch.device(device)
        self.formatter = GemmaFormatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)

        print("モデルを初期化しています")
        model_config = get_config_for_2b() if "2b" in variant else get_config_for_7b()
        model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")
        model_config.quant = "quant" in variant

        with _set_default_tensor_type(model_config.get_dtype()):
            model = GemmaForCausalLM(model_config)
            ckpt_path = os.path.join(WEIGHTS_PATH , f'gemma-{variant}.ckpt')
            model.load_weights(ckpt_path)
            self.model = model.to(self._device).eval()

    def __call__(self, obs, *args):
        self._start_session(obs)
        # フォーマッタによって生成された完全なプロンプトを得ます
        prompt = str(self.formatter)
        # LLMを呼び出して応答を取得します
        response = self._call_llm(prompt)
        # 取得した応答を解析します
        response = self._parse_response(response, obs)
        print(f"{response=}")
        return response

    def _start_session(self, obs: dict):
        raise NotImplementedError

    def _call_llm(self, prompt, max_new_tokens=32, **sampler_kwargs):
        # サンプラーの設定が行われていない場合のデフォルト値を設定します
        if sampler_kwargs is None:
            sampler_kwargs = {
                'temperature': 0.01,
                'top_p': 0.1,
                'top_k': 1,
        }
        # モデルによる応答生成を行います
        response = self.model.generate(
            prompt,
            device=self._device,
            output_len=max_new_tokens,
            **sampler_kwargs,
        )
        return response

    def _parse_keyword(self, response: str):
        # 応答からキーワードを取り出します
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)
        if match is None:
            keyword = ''
        else:
            keyword = match.group().lower()
        return keyword

    def _parse_response(self, response: str, obs: dict):
        raise NotImplementedError


def interleave_unequal(x, y):
    # 2つのリストを交互に組み合わせます
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None
    ]


class GemmaQuestionerAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user("20の質問をプレイしましょう。あなたは質問者の役割を演じています。")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='model')
        if obs.turnType == 'ask':
            self.formatter.user("はい・いいえで答えられる質問をしてください。")
        elif obs.turnType == 'guess':
            self.formatter.user("今、キーワードを推測してください。推測を二重アスタリスクで囲んでください。")
        self.formatter.start_model_turn()

    def _parse_response(self, response: str, obs: dict):
        if obs.turnType == 'ask':
            # 質問を取り出します
            match = re.search(".+?\?", response.replace('*', ''))
            if match is None:
                question = "人ですか？"
            else:
                question = match.group()
            return question
        elif obs.turnType == 'guess':
            # キーワードの推測を取り出します
            guess = self._parse_keyword(response)
            return guess
        else:
            raise ValueError("不明なターンタイプ:", obs.turnType)


class GemmaAnswererAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user(f"20の質問をプレイしましょう。あなたは回答者の役割を演じています。キーワードは{obs.keyword}で、カテゴリーは{obs.category}です。")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='user')
        self.formatter.user(f"このキーワード{obs.keyword}に関する質問です。はい・いいえで回答し、回答を二重アスタリスクで囲んでください。")
        self.formatter.start_model_turn()

    def _parse_response(self, response: str, obs: dict):
        # 応答の解析を行います
        answer = self._parse_keyword(response)
        return 'yes' if 'yes' in answer else 'no'


# エージェントの作成
system_prompt = "あなたは20の質問ゲームをプレイするためのAIアシスタントです。このゲームでは、回答者がキーワードを考え、質問者のはい・いいえの質問に回答します。キーワードは特定の人物、場所、または物です。"

few_shot_examples = [
    "20の質問を開始しましょう。あなたは質問者の役割を演じています。最初の質問をしてください。",
    "それは人ですか？", "**いいえ**",
    "それは場所ですか？", "**はい**",
    "それは国ですか？", "**はい** さあ、キーワードを推測してください。",
    "**フランス**", "正解!",
]


# **重要:** 必要なエージェントだけをロードするために、エージェントをグローバルに定義します。
# 両方をロードすると、メモリ不足になる可能性があります。
agent = None


def get_agent(name: str):
    global agent
    
    # エージェントが初期化されていない場合、それに応じてエージェントを作成します
    if agent is None and name == 'questioner':
        agent = GemmaQuestionerAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    elif agent is None and name == 'answerer':
        agent = GemmaAnswererAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    assert agent is not None, "エージェントが初期化されていません。"

    return agent


def agent_fn(obs, cfg):
    # オブザベーションのターンタイプに応じてエージェントの呼び出しを行います
    if obs.turnType == "ask":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)
    if response is None or len(response) <= 1:
        return "はい"
    else:
        return response
``` 

# このコードは、20の質問ゲームに使用するAIエージェントを構成するための完全なスクリプトを提供しています。
# ゲームの進行状況に応じて、質問者と回答者のエージェントを管理し、プロンプトを生成する機能があります。

In [None]:
# pigzとpvをインストールします
# pigzは圧縮ツールで、pvはデータの進行状況を表示するためのツールです。
# 出力は表示しないようにしています
!apt install pigz pv > /dev/null
``` 

# このコマンドは、システムにpigzとpvという2つのパッケージをインストールするために使用されます。
# pigzは並列圧縮を行うためのツールで、pvはパイプされたデータの進行状況を視覚的に表示するためのツールです。

In [None]:
# 指定したディレクトリを圧縮してsubmission.tar.gzというファイルを作成します。
# pigzを使用して圧縮を行い、pvで進行状況を表示します。
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ gemma/pytorch/7b-it-quant/2
``` 

# このコマンドは、/kaggle/working/submissionディレクトリ内のすべてのファイルを圧縮し、さらに/kaggle/input/gemma/pytorch/7b-it-quant/2ディレクトリも含めて、submission.tar.gzというアーカイブを作成します。
# pigzを使用して圧縮を行うことで、処理速度を向上させ、同時にpvを利用してアーカイブ作成の進行状況を視覚的に示すことができます。