# 要約 
このJupyterノートブックは、Kaggleの「LLM 20 Questions」コンペティションに参加するためのAIエージェントを構築する過程を示しています。ノートブックは、主に「20の質問」ゲームでの質問者と回答者のロールを持つエージェントを作成するためのコードと手法を提供しています。

### 取り組んでいる問題
このノートブックの目的は、AIが「20の質問」ゲームをプレイできるようにすることです。具体的には、質問者エージェントと回答者エージェントが、それぞれ質問を投げかけ、はい/いいえの回答を得ることで、対象のキーワードを推測する能力を持つエージェントを設計しています。エージェントが正確に、かつ迅速に答えを導き出すためには、効果的な質問戦略と情報収集能力が求められます。

### 使用されている手法とライブラリ
- **Gemma**: プロジェクトの中核には、Gemmaというライブラリが含まれており、特に自然言語生成（NLG）に特化したモデル（GemmaForCausalLM）が利用されています。
- **PyTorch**: ディープラーニングフレームワークとしてPyTorchが使用され、モデルのトレーニングと推論が行われます。
- **Bashスクリプト**: ノートブック内での環境設定やライブラリのインストールにBashスクリプトが使用されており、GemmaリポジトリをGitHubからクローンするための手順が含まれています。
- **Torchのテンソル設定**: コードはデフォルトのテンソル型を指定するコンテキストマネージャを使用しており、モデルの初期化時に適切なデータ型が確保されています。

### 構造
ノートブックは以下の構成要素を含みます：
1. **環境設定**: 必要なライブラリのインストールやリポジトリのクローンが行われる部分。
2. **エージェントクラス**: `GemmaAgent`という基本クラスと、そのサブクラスとして質問者と回答者用のエージェントが定義されており、ゲームのロジックに基づいた動作が実装されています。
3. **エージェントの管理**: グローバルに定義されたエージェントを管理し、必要に応じてインスタンスを取得するための関数も実装されています。

### 全体の流れ
ノートブックを実行すると、まずは必要なライブラリがインストールされ、Gemmaのモデルが初期化されます。その後、質問者エージェントや回答者エージェントが機能するように定義され、最終的に圧縮ファイルが生成されて提出用のファイル（`submission.tar.gz`）が作成されます。このプロセスは、Kaggleコンペティションにおけるエージェント提出を意図しています。

このノートブックは、特にNLPを利用したゲーム戦略の構築において、実践的な例を通して学ぶための素晴らしい出発点です。

---


# 用語概説 
以下は、Jupyterノートブックの内容に関連する専門用語の解説です。これにより、機械学習や深層学習の初心者がつまずきやすい部分を補足します。

1. **エージェント (Agent)**:
   - マシンラーニングや強化学習において、環境内で行動を選択し、報酬を最大化することを目的とした存在。ここでは、質問者または回答者の役割を担うAIシステムを指します。

2. **プロンプト (Prompt)**:
   - モデルに対して与える入力文。質問や指示などが含まれ、AIがそれに基づいて応答を生成します。特に、LLM（大規模言語モデル）では適切なプロンプトが重要な結果を生む要因となります。

3. **Few-Shot Learning**:
   - 与えられたわずかな例（ショット）から学習し、未知のデータに対する予測を行う手法。モデルは少数の例を利用して新しいタスクに対応できるよう進化します。

4. **モデル (Model)**:
   - 機械学習アルゴリズムの結果として得られる数理的構造。訓練データをもとに学習を行い、予測や分類を行う能力を持つもの。

5. **トークナイザー (Tokenizer)**:
   - テキストを構成する最小単位（トークン）に分割するプロセスやツール。言語モデルがテキストを理解するために、単語やサブワード、文字レベルなどのトークン化を行います。

6. **サンプリング手法 (Sampling Methods)**:
   - モデルからの出力を生成する際に使用される手法。例として、temperature（温度）、top-p、top-kがあり、生成の多様性や一貫性に影響を与えます。

7. **コンテキストマネージャ (Context Manager)**:
   - 一時的な環境を管理するためのフレームワーク。リソースの割当てや解放、エラーハンドリングを容易にします。

8. **ユーザーターン (User Turn) と モデルターン (Model Turn)**:
   - 20の質問ゲームにおけるターンの表現。ユーザーが発言する際のターンとモデルがそれに応じて返答する際のターンです。

9. **スコア評価を更新 (Update Skill Evaluation)**:
   - ボットのパフォーマンスを評価し、そのスコアや信頼性を数値化して更新するプロセス。通常、対戦結果に基づいて調整されます。

10. **エピソード (Episode)**:
    - 1回のゲームプレイを指し、これには一連のターンとやり取りが含まれます。エージェントはこのエピソードを通じて学習し、改善を図ります。

これらの用語は、ノートブック内のコードやコメントの文脈において重要な役割を果たしており、理解を深めるために知識として備えておくと良いでしょう。

---


2024年5月20日

* **ノートブックの提出を試みましたが、エラー*Validation Episode failed*が返されました。**

このノートブックは、**LLM 20 Questions**のエージェント作成プロセスを示しています。このノートブックを実行すると、`submission.tar.gz`ファイルが生成されます。ノートブックビューワーで*Output*タブをクリックし、`submission.tar.gz`を見つけてダウンロードしてください。コンペティションのホームページ左上にある**Submit Agent**をクリックして、ファイルをアップロードし、提出を行ってください。

In [None]:
%%bash
# 作業ディレクトリに移動します
cd /kaggle/working

# 必要なライブラリをインストールします。-qオプションは出力を抑えます。
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece

# GemmaのPyTorchリポジトリをGitHubからクローンします。出力は/dev/nullにリダイレクトされ、表示されません。
git clone https://github.com/google/gemma_pytorch.git > /dev/null

# Gemma用のディレクトリを作成します
mkdir /kaggle/working/submission/lib/gemma/

# クローンしたGemmaのファイルを新しく作成したディレクトリに移動します
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/

**上記のコードのChatGPTによる説明**

このコードはBashスクリプトで、作業環境を設定し、必要なPythonライブラリをインストールし、特定のライブラリ（GitHubリポジトリから）を使用するための準備を行います。以下は各行の詳細な説明です：
1. `%%bash`:
   - これはJupyterノートブックで使用されるマジックコマンドで、次の行はBashコマンドとして解釈されることを示します。
2. `cd /kaggle/working`:
   - 現在のディレクトリを`/kaggle/working`に変更します。このディレクトリはKaggleのカーネル（ノートブック）で計算中にファイルを保存したりアクセスしたりするためによく使用されます。
3. `pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece`:
   - `pip`を使用して、`immutabledict`および`sentencepiece`の最新バージョンを静かに（`-q`）インストールします（`install`）。
   - `-t /kaggle/working/submission/lib`オプションは、ライブラリをインストールするターゲットディレクトリを指定します。この場合は`/kaggle/working/submission/lib`です。
4. `git clone https://github.com/google/gemma_pytorch.git > /dev/null`:
   - GitHubから`gemma_pytorch`リポジトリをクローンします。
   - `> /dev/null`部分は、出力を`/dev/null`にリダイレクトし、クローンコマンドの出力を抑制して、ノートブックやスクリプトの出力をすっきりと保ちます。
5. `mkdir /kaggle/working/submission/lib/gemma/`:
   - `/kaggle/working/submission/lib/`内に`gemma`という名前の新しいディレクトリを作成します。このディレクトリにはクローンしたリポジトリのファイルが保存されます。
6. `mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/`:
   - クローンした`gemma_pytorch`リポジトリ内の`gemma`ディレクトリから必要なすべてのファイル（`*`）を、新しく作成した`/kaggle/working/submission/lib/gemma/`ディレクトリに移動します。

### 概要
- スクリプトは作業ディレクトリを設定します。
- 特定のパスに`immutabledict`と`sentencepiece`ライブラリをインストールします。
- GitHubからリポジトリをクローンします。
- クローンしたリポジトリのファイルのためのディレクトリを作成します。
- クローンしたリポジトリから必要なファイルを作成したディレクトリに移動します。

このセットアップは、Kaggleノートブックでの機械学習タスクやその他の計算タスクに必要な特定の依存関係やライブラリを準備するために使用される可能性があります。

In [None]:
%%writefile submission/main.py
# 設定
import os
import sys

# **重要:** これに従ってシステムパスを設定してください。これにより、ノートブックとシミュレーション環境の両方でコードが機能します。
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

import contextlib
import os
import sys
from pathlib import Path

import torch
from gemma.config import get_config_for_7b, get_config_for_2b
from gemma.model import GemmaForCausalLM

if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"

# プロンプトのフォーマット
import itertools
from typing import Iterable


class GemmaFormatter:
    _start_token = '<start_of_turn>'
    _end_token = '<end_of_turn>'

    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self._turn_user = f"{self._start_token}user\n{{}}{self._end_token}\n"
        self._turn_model = f"{self._start_token}model\n{{}}{self._end_token}\n"
        self.reset()

    def __repr__(self):
        return self._state

    def user(self, prompt):
        self._state += self._turn_user.format(prompt)
        return self

    def model(self, prompt):
        self._state += self._turn_model.format(prompt)
        return self

    def start_user_turn(self):
        self._state += f"{self._start_token}user\n"
        return self

    def start_model_turn(self):
        self._state += f"{self._start_token}model\n"
        return self

    def end_turn(self):
        self._state += f"{self._end_token}\n"
        return self

    def reset(self):
        self._state = ""
        if self._system_prompt is not None:
            self.user(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self

    def apply_turns(self, turns: Iterable, start_agent: str):
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)
        for fmt, turn in zip(formatters, turns):
            fmt(turn)
        return self


# エージェント定義
import re


@contextlib.contextmanager
def _set_default_tensor_type(dtype: torch.dtype):
    """デフォルトのtorch dtypeを指定されたdtypeに設定します。"""
    torch.set_default_dtype(dtype)
    yield
    torch.set_default_dtype(torch.float)


class GemmaAgent:
    def __init__(self, variant='7b-it-quant', device='cuda:0', system_prompt=None, few_shot_examples=None):
        self._variant = variant
        self._device = torch.device(device)
        self.formatter = GemmaFormatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)

        print("モデルの初期化中")
        model_config = get_config_for_2b() if "2b" in variant else get_config_for_7b()
        model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")
        model_config.quant = "quant" in variant

        with _set_default_tensor_type(model_config.get_dtype()):
            model = GemmaForCausalLM(model_config)
            ckpt_path = os.path.join(WEIGHTS_PATH , f'gemma-{variant}.ckpt')
            model.load_weights(ckpt_path)
            self.model = model.to(self._device).eval()

    def __call__(self, obs, *args):
        self._start_session(obs)
        prompt = str(self.formatter)
        response = self._call_llm(prompt)
        response = self._parse_response(response, obs)
        print(f"{response=}")
        return response

    def _start_session(self, obs: dict):
        raise NotImplementedError

    def _call_llm(self, prompt, max_new_tokens=32, **sampler_kwargs):
        if sampler_kwargs is None:
            sampler_kwargs = {
                'temperature': 0.01,
                'top_p': 0.1,
                'top_k': 1,
        }
        response = self.model.generate(
            prompt,
            device=self._device,
            output_len=max_new_tokens,
            **sampler_kwargs,
        )
        return response

    def _parse_keyword(self, response: str):
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)
        if match is None:
            keyword = ''
        else:
            keyword = match.group().lower()
        return keyword

    def _parse_response(self, response: str, obs: dict):
        raise NotImplementedError


def interleave_unequal(x, y):
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None
    ]


class GemmaQuestionerAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user("20の質問をしましょう。あなたは質問者の役割を果たします。")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='model')
        if obs.turnType == 'ask':
            self.formatter.user("はい/いいえで答えられる質問をしてください。")
        elif obs.turnType == 'guess':
            self.formatter.user("さあ、キーワードを推測してみてください。推測は二重のアスタリスクで囲んでください。")
        self.formatter.start_model_turn()

    def _parse_response(self, response: str, obs: dict):
        if obs.turnType == 'ask':
            match = re.search(".+?\?", response.replace('*', ''))
            if match is None:
                question = "それは人ですか？"
            else:
                question = match.group()
            return question
        elif obs.turnType == 'guess':
            guess = self._parse_keyword(response)
            return guess
        else:
            raise ValueError("未知のターンタイプ:", obs.turnType)


class GemmaAnswererAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user(f"20の質問をしましょう。あなたは答える側の役割を果たします。キーワードは{obs.keyword}で、カテゴリは{obs.category}です。")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='user')
        self.formatter.user(f"そのキーワード{obs.keyword}に関する質問です。はいまたはいいえで答えてください。答えは二重のアスタリスクで囲んでください、例えば**はい**または**いいえ**。")
        self.formatter.start_model_turn()

    def _parse_response(self, response: str, obs: dict):
        answer = self._parse_keyword(response)
        return 'はい' if 'はい' in answer else 'いいえ'

**上記のコードのChatGPTによる説明**

このスクリプトは、20の質問ゲームをプレイするために設計されたAIエージェントの設定と動作を定義しています。エージェントは、質問者または回答者のいずれかになります。以下はコードの各部分の詳細な説明です：

### 1. ファイル作成
```python
%%writefile submission/main.py
```
- このJupyterノートブックのマジックコマンドは、以下のコードを`submission`ディレクトリ内の`main.py`というファイルに書き込みます。

### 2. 設定
```python
import os
import sys
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")
```
- 必要なモジュールをインポートします。
- ノートブックとKaggleシミュレーション環境の両方での互換性を確保するため、必要なライブラリが格納されているディレクトリをシステムパスに設定します。

### 3. ライブラリと設定のインポート
```python
import contextlib
from pathlib import Path
import torch
from gemma.config import get_config_for_7b, get_config_for_2b
from gemma.model import GemmaForCausalLM
if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"
```
- 追加のライブラリをインポートします。
- 環境に基づいてモデルの重みのパスを定義します。

### 4. プロンプトフォーマットクラス
```python
import itertools
from typing import Iterable
class GemmaFormatter:
    _start_token = '<start_of_turn>'
    _end_token = '<end_of_turn>'
    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self._turn_user = f"{self._start_token}user\n{{}}{self._end_token}\n"
        self._turn_model = f"{self._start_token}model\n{{}}{self._end_token}\n"
        self.reset()
    def __repr__(self):
        return self._state
    def user(self, prompt):
        self._state += self._turn_user.format(prompt)
        return self
    def model(self, prompt):
        self._state += self._turn_model.format(prompt)
        return self
    def start_user_turn(self):
        self._state += f"{self._start_token}user\n"
        return self
    def start_model_turn(self):
        self._state += f"{self._start_token}model\n"
        return self
    def end_turn(self):
        self._state += f"{self._end_token}\n"
        return self
    def reset(self):
        self._state = ""
        if self._system_prompt is not None:
            self.user(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self
    def apply_turns(self, turns: Iterable, start_agent: str):
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)
        for fmt, turn in zip(formatters, turns):
            fmt(turn)
        return self
```
- `GemmaFormatter`は、定義済みのトークンを使用してユーザーとモデルの間の会話をフォーマットします。
- メソッドは、ユーザーとモデルのプロンプトを追加し、ターンを開始または終了し、会話の状態をリセットする機能を提供します。

### 5. エージェント定義
```python
import re
@contextlib.contextmanager
def _set_default_tensor_type(dtype: torch.dtype):
    torch.set_default_dtype(dtype)
    yield
    torch.set_default_dtype(torch.float)
class GemmaAgent:
    def __init__(self, variant='7b-it-quant', device='cuda:0', system_prompt=None, few_shot_examples=None):
        self._variant = variant
        self._device = torch.device(device)
        self.formatter = GemmaFormatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)
        print("モデルの初期化中")
        model_config = get_config_for_2b() if "2b" in variant else get_config_for_7b()
        model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")
        model_config.quant = "quant" in variant
        with _set_default_tensor_type(model_config.get_dtype()):
            model = GemmaForCausalLM(model_config)
            ckpt_path = os.path.join(WEIGHTS_PATH , f'gemma-{variant}.ckpt')
            model.load_weights(ckpt_path)
            self.model = model.to(self._device).eval()
    def __call__(self, obs, *args):
        self._start_session(obs)
        prompt = str(self.formatter)
        response = self._call_llm(prompt)
        response = self._parse_response(response, obs)
        print(f"{response=}")
        return response
    def _start_session(self, obs: dict):
        raise NotImplementedError
    def _call_llm(self, prompt, max_new_tokens=32, **sampler_kwargs):
        if sampler_kwargs is None:
            sampler_kwargs = {
                'temperature': 0.01,
                'top_p': 0.1,
                'top_k': 1,
            }
        response = self.model.generate(
            prompt,
            device=self._device,
            output_len=max_new_tokens,
            **sampler_kwargs,
        )
        return response
    def _parse_keyword(self, response: str):
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)
        if match is None:
            keyword = ''
        else:
            keyword = match.group().lower()
        return keyword
    def _parse_response(self, response: str, obs: dict):
        raise NotImplementedError
def interleave_unequal(x, y):
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None
    ]
```
- `GemmaAgent`クラスは、モデルを初期化し、プロンプトをフォーマットし、モデルとのインタラクションを処理します。
- `_set_default_tensor_type`コンテキストマネージャは、PyTorchのデフォルトテンソルタイプを一時的に設定します。
- `__call__`メソッドは、観察（`obs`）に基づいてモデルからの応答を生成します。
- `_start_session`および `_parse_response`メソッドは、サブクラスによって実装されることを意図しているプレースホルダーです。
- `interleave_unequal`関数は、2つのリストから要素をインタリーブし、長い方のリストからの残りの要素でギャップを埋めます。

### 6. 質問者と回答者エージェント
```python
class GemmaQuestionerAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user("Let's play 20 Questions. You are playing the role of the Questioner.")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='model')
        if obs.turnType == 'ask':
            self.formatter.user("Please ask a yes-or-no question.")
        elif obs.turnType == 'guess':
            self.formatter.user("Now guess the keyword. Surround your guess with double asterisks.")
        self.formatter.start_model_turn()
    def _parse_response(self, response: str, obs: dict):
        if obs.turnType == 'ask':
            match = re.search(".+?\?", response.replace('*', ''))
            if match is None:
                question = "Is it a person?"
            else:
                question = match.group()
            return question
        elif obs.turnType == 'guess':
            guess = self._parse_keyword(response)
            return guess
        else:
            raise ValueError("Unknown turn type:", obs.turnType)
class GemmaAnswererAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user(f"Let's play 20 Questions. You are playing the role of the Answerer. The keyword is {obs.keyword} in the category {obs.category}.")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='user')
        self.formatter.user(f"The question is about the keyword {obs.keyword} in the category {obs.category}. Give yes-or-no answer and surround your answer with double asterisks, like **yes** or **no**.")
        self.formatter.start_model_turn()
    def _parse_response(self, response: str, obs: dict):
        answer = self._parse_keyword(response)
        return 'yes' if 'yes' in answer else 'no'
```
- `GemmaQuestionerAgent`と`GemmaAnswererAgent`は`GemmaAgent`のサブクラスであり、それぞれの役割に合わせた`_start_session`および`_parse_response`メソッドが実装されています。

In [None]:
# エージェントの作成
system_prompt = "あなたは20の質問ゲームをプレイするために設計されたAIアシスタントです。このゲームでは、回答者がキーワードを考え、質問者によるはい/いいえの質問に応じて応答します。キーワードは特定の人、場所、または物です。"

few_shot_examples = [
    "20の質問をしましょう。あなたは質問者の役割を果たします。最初の質問をしてください。",
    "それは人ですか？", "**いいえ**",
    "それは場所ですか？", "**はい**",
    "それは国ですか？", "**はい** さあ、キーワードを推測してください。",
    "**フランス**", "正解!",
]


# **重要:** エージェントをグローバルに定義して、必要なエージェントだけを読み込むようにします。
# 両方を読み込むと、OOM（メモリオーバー）に繋がる可能性があります。
agent = None


def get_agent(name: str):
    global agent
    
    if agent is None and name == 'questioner':
        agent = GemmaQuestionerAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    elif agent is None and name == 'answerer':
        agent = GemmaAnswererAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    assert agent is not None, "エージェントが初期化されていません。"

    return agent


def agent_fn(obs, cfg):
    if obs.turnType == "ask":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)
    if response is None or len(response) <= 1:
        return "はい"
    else:
        return response

**上記のコードのChatGPTによる説明**
このコードの部分は、20の質問ゲームをプレイするために使用されるAIエージェントの作成と管理を担当しています。エージェントのインスタンス化方法と、提供された観察に基づいてゲームのロジックをどのように扱うかを定義しています。以下は詳細な説明です。

### 1. システムプロンプトと少数ショットの例の定義
```python
system_prompt = "あなたは20の質問ゲームをプレイするために設計されたAIアシスタントです。このゲームでは、回答者がキーワードを考え、質問者によるはい/いいえの質問に応じて応答します。キーワードは特定の人、場所、または物です。"

few_shot_examples = [
    "20の質問をしましょう。あなたは質問者の役割を果たします。最初の質問をしてください。",
    "それは人ですか？", "**いいえ**",
    "それは場所ですか？", "**はい**",
    "それは国ですか？", "**はい** さあ、キーワードを推測してください。",
    "**フランス**", "正解!",
]
```
- `system_prompt`: AIに20の質問ゲームのコンテキストを提供します。
- `few_shot_examples`: AIがゲームの形式と応答方法を理解するのに役立つ一連の例。この少数ショット学習により、モデルはいくつかの例から一般化できます。

### 2. グローバルエージェント変数
```python
agent = None
```
- 現在のエージェントを保存するためのグローバル変数`agent`を定義します。これにより、エージェントを複数回再読み込みすることを避け、メモリオーバー（OOM）エラーを引き起こすのを防ぎます。

### 3. 適切なエージェントを取得する関数
```python
def get_agent(name: str):
    global agent
    
    if agent is None and name == 'questioner':
        agent = GemmaQuestionerAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    elif agent is None and name == 'answerer':
        agent = GemmaAnswererAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    assert agent is not None, "エージェントが初期化されていません。"
    return agent
```
- `get_agent(name: str)`: 指定されたエージェント（`questioner`または`answerer`）のインスタンスを返す関数。
    - グローバル変数`agent`が`None`で、要求されたエージェントのタイプが`questioner`の場合、`GemmaQuestionerAgent`のインスタンスを作成します。
    - 同様に、エージェントのタイプが`answerer`の場合、`GemmaAnswererAgent`のインスタンスを作成します。
    - 両方のエージェントは`system_prompt`と`few_shot_examples`で初期化されます。
    - エージェントが常に返されることを保証し、初期化試行後に`agent`が`None`でないことを確認します。

### 4. メインエージェント関数
```python
def agent_fn(obs, cfg):
    if obs.turnType == "ask":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)
    if response is None or len(response) <= 1:
        return "はい"
    else:
        return response
```
- `agent_fn(obs, cfg)`: 現在のゲーム状態（`obs`）に基づいてエージェントとのインタラクションを処理するメイン関数。
    - `obs.turnType`が`"ask"`の場合、`questioner`エージェントを呼び出して質問を生成します。
    - `obs.turnType`が`"guess"`の場合、再び`questioner`エージェントを呼び出して推測を行います。
    - `obs.turnType`が`"answer"`の場合、`answerer`エージェントを呼び出して回答を生成します。
    - エージェントは必要な役割に基づいて`get_agent`を使用して取得されます。
    - エージェントの応答が`None`または短すぎる場合は`"はい"`を返します。
    - それ以外の場合は、エージェントによって生成された応答を返します。

### 概要
- このコードセグメントは、20の質問をプレイするためのAIエージェントを初期化し、管理します。
- エージェント用のシステムプロンプトと例を定義します。
- メモリの問題を避けるために、エージェントのインスタンスを1つだけ読み込むことを保証します。
- `get_agent`関数は、必要に応じたエージェントタイプを動的に初期化します。
- `agent_fn`関数はゲームのロジックを処理し、現在のターンタイプに基づいて適切なエージェントを呼び出します。

In [None]:
# pigzとpvをインストールします。出力は/dev/nullにリダイレクトされ、表示されません。
!apt install pigz pv > /dev/null

**上記のコードのChatGPTによる説明**
このコード行は、`apt`パッケージマネージャを使用して2つのパッケージ`pigz`と`pv`をインストールするシェルコマンドです。以下は詳細な説明です。

### コマンドの内訳
```bash
!apt install pigz pv > /dev/null
```
#### 1. `!`
- 行の先頭にある`!`は、このコマンドがシェルで実行されるべきことを示します。これはJupyterノートブックで利用可能な機能で、コードセルから直接シェルコマンドを実行することができます。

#### 2. `apt install pigz pv`
- `apt`: これはAdvanced Package Tool（APT）のコマンドラインインターフェースで、DebianベースのLinuxディストリビューション（例：Ubuntu）で使用されるパッケージ管理システムです。
- `install`: このサブコマンドは、`apt`に1つまたは複数のパッケージをインストールしたいことを指示します。
- `pigz`: これは最初にインストールするパッケージの名前です。`pigz`とは「gzipの並列実装」という意味です。これは、データを圧縮するためのツールで、従来の`gzip`よりも迅速に圧縮を行うために複数のCPUコアを使用します。
- `pv`: これは2番目にインストールするパッケージの名前です。`pv`は「Pipe Viewer」の略で、パイプラインを通過するデータの進行状況を監視するための端末ベースのツールです。データ転送の進行状況、スループットレート、推定完了時間などを視覚的に表示します。

#### 3. `> /dev/null`
- このコマンドの部分は、標準出力（stdout）を`/dev/null`にリダイレクトします。
- `/dev/null`は、Unix系オペレーティングシステムにおける特別なファイルで、書き込まれたすべてのデータを破棄します。これは、表示したくない出力を抑制するためによく使用されます。
- この文脈では、`> /dev/null`により、`apt install`コマンドによって生成される出力（例：ダウンロード進行状況、インストールメッセージなど）がターミナルやJupyterノートブックに表示されないようにします。

### コマンドの目的
このコマンドの目的は、`pigz`と`pv`パッケージを静かにインストールすることです。出力を表示しないようにすることで、インストールログで出力が clutter されないようにできます。

### 実用的な使用例
- **`pigz`**: 大きなファイルを迅速に圧縮する必要がある場合に、複数のCPUコアを活用するのに便利です。
- **`pv`**: 長時間実行されるプロセスにおいて、データ転送やパイプラインの進行状況を監視するのに役立ちます。

このコマンドを使用することで、これらのツールが次の使用のためにシステムに利用可能であることを確認しながら、インストールメッセージで出力が clutter されることを防ぎます。

In [None]:
# 圧縮プログラムとしてpigzを使用し、pvによる進捗表示を行いながら、submission.tar.gzファイルを作成します。
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/gemma/pytorch/7b-it-quant/2

**上記のコードのChatGPTによる説明**
このシェルコマンドは、`tar`コマンドを使用して圧縮されたtarball（`submission.tar.gz`）を作成し、`pigz`と`pv`を組み合わせて高速かつ監視された圧縮を行います。以下はコマンドの各部分の詳細な説明です。

### コマンドの内訳
```bash
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ gemma/pytorch/7b-it-quant/2
```
#### 1. `!`
- これは、後続のコマンドがシェルで実行されるべきことを示します。これはJupyterノートブックで利用可能な特徴です。

#### 2. `tar`
- `tar`コマンドは、tarballアーカイブを作成、維持、変更、および抽出するために使用されます。

#### 3. `--use-compress-program='pigz --fast --recursive | pv'`
- このオプションは、使用する圧縮プログラムを指定します。この場合、`pv`を通じてパイプで接続された`pigz`を使用します。
- `'pigz --fast --recursive'`: `pigz`（`gzip`の並列実装）を使用して圧縮します。`--fast`フラグは、圧縮率よりも速度を優先することを`pigz`に指示し、`--recursive`はディレクトリを再帰的に処理することを保証します。
- `'| pv'`: `pigz`の出力を`pv`にパイプして、圧縮の進行状況を監視します。`pv`はデータ転送の進行状況を表示し、長時間実行されるプロセスに便利です。

#### 4. `-cf submission.tar.gz`
- `-c`: 新しいアーカイブを作成します。
- `-f submission.tar.gz`: 作成するアーカイブファイルの名前を指定します（`submission.tar.gz`）。

#### 5. `-C /kaggle/working/submission .`
- `-C /kaggle/working/submission`: アーカイブにファイルを追加する前に、ディレクトリ`/kaggle/working/submission`に移動します。
- `.`: 現在のディレクトリ（`-C`オプションによって`/kaggle/working/submission`となっている）をアーカイブに追加します。

#### 6. `-C /kaggle/input/ gemma/pytorch/7b-it-quant/2`
- `-C /kaggle/input/`: アーカイブにファイルを追加する前に、ディレクトリ`/kaggle/input/`に移動します。
- `gemma/pytorch/7b-it-quant/2`: アーカイブに`/kaggle/input/`に相対的な`gemma/pytorch/7b-it-quant/2`ディレクトリを追加します。

### コマンドの目的
このコマンドは、以下を含む圧縮tarball（`submission.tar.gz`）を作成するために使用されます：
1. `/kaggle/working/submission`からのすべてのファイルとディレクトリ。
2. `/kaggle/input/`からの`gemma/pytorch/7b-it-quant/2`ディレクトリ。

`pigz`を使用して圧縮することにより、並列処理による高速な圧縮速度の恩恵を受けます。`pv`は圧縮プロセスの視覚的な進捗インジケーターを提供します。

### 実用的な使用例
- **圧縮速度**: `pigz`は複数のCPUコアを利用することで圧縮プロセスを高速化します。
- **進捗監視**: `pv`は圧縮の進行状況を監視するのに役立ち、プロセスにどのくらいの時間がかかるのかを見るのが容易になります。
- **特定のファイルのアーカイブ**: `-C`を使用することで、現在の作業ディレクトリを変更することなく特定のディレクトリをアーカイブに含めることができ、複数の場所からファイルを追加できる柔軟性があります。

---

# コメント

> ## Matin Mahmoudi ✨
> 
> 実装のための素晴らしいスタートノートブックで、とても有益です [@regisvargas](https://www.kaggle.com/regisvargas)。あなたの他の作品も確認しましたし、全てにアップボートしました。素晴らしい、友人よ。
> 
> 
> > ## Regis Vargas（トピック作成者）
> > 
> > 励ましの言葉、ありがとうございます。私は多くの困難に直面していますが、一日一日自分を奮い立たせようとしています。
> > 
> > 

---