# 要約 
このJupyterノートブックは、Kaggleの「20の質問」コンペティションにおけるAIエージェントの設計と実装に取り組んでいます。ノートブックでは、質問者エージェントと回答者エージェントをそれぞれの役割に基づいて構築しており、以下のような手法やライブラリが使用されています。

### 問題と目的
ノートブックは「20の質問」 permainan内で、ターゲットワードを推測するための戦略的な質問を生成し、その回答を処理することを目的としています。エージェントは「はい」または「いいえ」で回答される質問を通じて、正しいキーワードをできるだけ早く当てることを目指します。

### 使用されている手法とライブラリ
1. **gemma_pytorch**: GoogleのGemmaモデルを用いて、対話型の推測を行います。モデルは、異なるバリエーション（例えば、7bと2b）で構成され、事前トレーニングされたものが使用されています。
2. **Torch**: PyTorchに基づくディープラーニングフレームワークを使用しており、これにより強力な機械学習モデルを活用しています。
3. **インタラクティブな質問生成**: 質問者エージェントが文脈に基づいて質問を生成し、回答者エージェントがその質問に対応する回答を提供する形式が採用されています。
4. **確率的な考慮**: 回答の「はい」または「いいえ」に基づいて、エージェントのキーワードに関する確率を更新し、推測を絞り込むための戦略を実装しています。

### 構成要素
- **GemmaFormatter**: 質問と回答のフォーマットを管理するクラス。
- **GemmaAgent**: 質問者エージェントと回答者エージェントを統合する基底クラス。
- **GemmaQuestionerAgent と GemmaAnswererAgent**: 質問を生成するための質問者エージェントと、回答を提供するための回答者エージェント。

### その他の機能
- **デバッグ機能**: 環境設定とシンプルなエージェントを用いて、動作確認を行います。
- **パッケージ管理**: code cellsで、必要なライブラリや依存関係のインストールを行っています。

ノートブックは、エージェントの設計過程における挑戦や試行錯誤をドキュメント化しており、毎日新しい試みを行っていることがメモとして記録されています。全体として、このノートブックは言語モデルを用いて「20の質問」ゲームに取り組む新しいアプローチを探求するためのものです。

---


# 用語概説 
以下に、Jupyter notebookの内容に関連する機械学習・深層学習の用語の解説を示します。特に初心者がつまずきやすいマイナーなものや、実務ではあまり触れないがこのノートブックに特有の用語に焦点を当てました。

### 用語解説

1. **immutabledict**:
   - 不可変な辞書を提供するためのライブラリです。通常の辞書と異なり、一度作成すると変更ができず、鍵や値の追加や削除ができないため、データの不変性を保ちたい場合に使用されます。

2. **sentencepiece**:
   - 文をトークン化するためのライブラリです。特に、ニューラルネットワークを用いる言語モデルにおいて、単語をサブワード単位で処理できるように設計されています。これにより、未知の単語を処理しやすくし、トレーニングデータを効果的に利用することができます。

3. **Gemma**:
   - 提供されたnote内に含まれている、一種の言語モデルフレームワークです。特に因果推論に基づいた生成モデルの実装を意図しているようで、利用することで20の質問ゲームに対応したAIエージェントを構築することができます。

4. **Causal LM (因果言語モデル)**:
   - テキスト生成タスクにおいて、次の単語を予測するために過去の単語のみを用いるモデルです。特定の文脈に基づいて、因果関係を重視した生成が可能です。

5. **tokenizer**:
   - 入力文をトークン（単語やサブワードなど）に変換する処理を行うコンポーネントです。このコンポーネントがなければ、モデルは理解できる形でデータを受け取れません。

6. **default tensor type**:
   - PyTorchにおけるデフォルトのテンソルデータ型のことです。異なるデータ型で計算処理を行う際に、デフォルトを設定することでコードの簡潔性やエラーを防ぐことができます。

7. **interleave_unequal**:
   - 不均等な長さのリストを交互に結合する関数名です。異なる情報を持つ2つのリストを統合し、データを均一に扱うための技術です。

8. **few-shot examples**:
   - モデルのトレーニング時に、少数の例を提供して特定のタスクに対する適応度を高める手法のことです。これにより、モデルは新しいタスクを学習する際に必要なデータ量を大幅に削減できます。

9. **contextual questions**:
   - ある状況や文脈に基づいた質問のことです。20の質問ゲームのような状況において、過去の回答や質問と関連付けて情報を引き出すために重要です。

10. **quantization**:
    - モデルのパラメータを圧縮し、メモリ使用量を削減したり、推論速度を向上させたりする技術です。特にハードウェア制約のある環境でのデプロイにおいて非常に重要です。

これらの用語は、初心者が実務に入る前に理解しておくと有益です。各用語は特定の処理やモデルの構成要素に関連しているため、それぞれの機能や役割を理解することで、よりスムーズにJupyter notebookの内容を追うことができるでしょう。

---


メモ：

これは難しい挑戦です！さまざまなプロンプトを試し、「はい」または「いいえ」の回答に確率の重みを加え、LLMのパラメータを調整し、質問の精緻化を試みました。評価ログにはチームのペアリングが含まれているため、LLMのパフォーマンスを理解するのは難しいです。現在のバージョンにデバッグを追加しました。毎日新しいことに挑戦しています！素晴らしい学びの経験です。

In [None]:
%%bash
# 作業ディレクトリに移動します
cd /kaggle/working

# immutabledict と sentencepiece ライブラリを新しくインストールします
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece

# gemma_pytorch リポジトリをクローンします（出力を表示しない）
git clone https://github.com/google/gemma_pytorch.git > /dev/null

# gemma ライブラリ用のディレクトリを作成します
mkdir /kaggle/working/submission/lib/gemma/

# gemma_pytorch の内容を gemma ディレクトリに移動します
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/

In [None]:
%%writefile submission/main.py

import os
import sys

# Kaggleエージェントのパスを定義
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

import contextlib
import os
import sys
from pathlib import Path

import torch
from gemma.config import get_config_for_7b, get_config_for_2b
from gemma.model import GemmaForCausalLM

# 重みのパスを設定
if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"

import itertools
from typing import Iterable

def interleave_unequal(x, y):
    # 2つの不均等なリストを交互に結合します
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None
    ]

class GemmaFormatter:
    _start_token = '<start_of_turn>'
    _end_token = '<end_of_turn>'

    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        # システムプロンプトと少数ショットの例を初期化
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self._turn_user = f"{self._start_token}user\n{{}}{self._end_token}\n"
        self._turn_model = f"{self._start_token}model\n{{}}{self._end_token}\n"
        self.reset()

    def __repr__(self):
        return self._state

    def user(self, prompt):
        # ユーザーのプロンプトを追加
        self._state += self._turn_user.format(prompt)
        return self

    def model(self, prompt):
        # モデルのプロンプトを追加
        self._state += self._turn_model.format(prompt)
        return self

    def start_user_turn(self):
        # ユーザーのターンを開始
        self._state += f"{self._start_token}user\n"
        return self

    def start_model_turn(self):
        # モデルのターンを開始
        self._state += f"{self._start_token}model\n"
        return self

    def end_turn(self):
        # ターンを終了
        self._state += f"{self._end_token}\n"
        return self

    def reset(self):
        # フォーマッターをリセットし、初期状態を設定
        self._state = ""
        if self._system_prompt is not None:
            self.user(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self

    def apply_turns(self, turns: Iterable, start_agent: str):
        # ターンを適用
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)
        for fmt, turn in zip(formatters, turns):
            fmt(turn)
        return self

import re

@contextlib.contextmanager
def _set_default_tensor_type(dtype: torch.dtype):
    """指定されたデータ型にデフォルトのtorch dtypeを設定します。"""
    torch.set_default_dtype(dtype)
    yield
    torch.set_default_dtype(torch.float)

from collections import defaultdict

# エージェントの作成
    
class GemmaAgent:
    def __init__(self, variant='7b-it-quant', device='cuda:0', system_prompt=None, few_shot_examples=None):
        # エージェントの初期化
        self._variant = variant
        self._device = torch.device(device)
        self.formatter = GemmaFormatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)
        self.question_history = []  # 質問履歴
        self.answer_history = []    # 回答履歴
        self.keyword_probabilities = defaultdict(float)  # キーワードの確率
        
        print("モデルを初期化しています")
        model_config = get_config_for_7b()
        model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")
        model_config.quant = "quant" in variant

        with _set_default_tensor_type(model_config.get_dtype()):
            self.model = GemmaForCausalLM(model_config)
            ckpt_path = os.path.join(WEIGHTS_PATH , f'gemma-{variant}.ckpt')
            self.model.load_weights(ckpt_path)
            self.model = self.model.to(self._device).eval()
            
        self.tokenizer = self._initialize_tokenizer(model_config.tokenizer)

    def __call__(self, obs, *args):
        self._start_session(obs)
        prompt = str(self.formatter)
        response = self._call_llm(prompt)
        response = self._parse_response(response, obs)
        print(f"{response=}")
        return response

    def _start_session(self, obs: dict):
        # セッションを開始
        self.formatter.reset()
        if 'system_prompt' in obs:
            self.formatter.user(obs['system_prompt'])
        if 'few_shot_examples' in obs:
            self.formatter.apply_turns(obs['few_shot_examples'], start_agent='user')
        self.formatter.start_user_turn()

    def _call_llm(self, prompt, max_new_tokens=50, sampler_kwargs=None):
        # LLMを呼び出す
        if sampler_kwargs is None:
            sampler_kwargs = {
                'temperature': 0.6,
                'top_p': 0.9,
                'top_k': 50,
                'repetition_penalty': 0.8,
                'num_beams': 3,
                'early_stopping': False,
                'do_sample': True
            }
        response = self.model.generate(
            prompt,
            device=self._device,
            output_len=max_new_tokens,
            **sampler_kwargs,
        )
        return response

    def _parse_keyword(self, response: str):
        # レスポンスからキーワードを解析
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)
        return match.group().lower() if match else ''

    def parse_response(self, response: str, obs: dict):
        # レスポンスを解析して適切な出力を生成
        keyword = self._parse_keyword(response)
        turn_type = obs.get('turnType')
        if turn_type == "ask":
            question = self._generate_question(keyword)
            self.question_history.append(question)
            return question
        elif turn_type == "guess":
            return f"**{keyword}**"
        elif turn_type == "answer":
            last_question = obs.get('questions', [])[-1]
            answer = self._analyze_answer(last_question, keyword)
            self.answer_history.append(answer)
            return answer
        else:
            return "無効なターンタイプ"
    
    def _analyze_answer(self, question: str, context: str):
        # 回答を分析して返します
        question_lower = question.lower()
        keyword = self._parse_keyword(context)
        if "what" in question_lower:
            return f"ヒント: それは{keyword}です"
        elif "where" in question_lower:
            return f"ヒント: それは{keyword}に関連しています"
        else:
            answer = "Yes" if "is" in question_lower else "No"
            self.answer_history.append(answer)
            for keyword in self.keyword_probabilities:
                self._update_probabilities(keyword, answer)
            return answer
        
    def _update_probabilities(self, keyword: str, answer: str):
        # 確率を更新します
        if keyword in self.keyword_probabilities:
            self.keyword_probabilities[keyword] += 0.4 if answer == "Yes" else -0.25
            self.keyword_probabilities[keyword] = max(0.0, min(1.0, self.keyword_probabilities[keyword]))
        
        total_prob = sum(self.keyword_probabilities.values())
        if total_prob > 0:
            for key in self.keyword_probabilities:
                self.keyword_probabilities[key] /= total_prob
    
    def _suggest_keyword(self):
        # 確率の最も高いキーワードを提案します
        return max(self.keyword_probabilities, key=self.keyword_probabilities.get, default="")

    def _refine_question(self, question: str, answers: list):
        # 質問を改善します
        if answers:
            last_answer = answers[-1].lower()
            if last_answer == "no":
                if "is it" in question.lower():
                    question = question.replace("Is it", "Could it be")
                elif "does it" in question.lower():
                    question = question.replace("Does it", "Might it")
            elif last_answer == "yes":
                if "is it" in question.lower():
                    question = question.replace("Is it", "Is it specifically")
                elif "does it" in question.lower():
                    question = question.replace("Does it", "Does it specifically")
        
        return question

    def _generate_question(self, context: str):
        # 文脈から新しい質問を生成します
        if self.question_history:
            last_question = self.question_history[-1]
            if last_question in context:
                return "前の質問の答えに基づいて、次の論理的または創造的な質問をしてください..."
        
        input_ids = self.tokenizer.encode_plus(
            context,
            add_special_tokens=True,
            max_length=512,
            return_attention_mask=True,
            return_tensors='pt'
        )
        output = self.model.generate(input_ids['input_ids'], attention_mask=input_ids['attention_mask'])
        question = self.tokenizer.decode(output[0], skip_special_tokens=True)
        question = self._refine_question(question, self.answer_history)
        self.question_history.append(question)
        return question

    def _make_decision(self, obs: dict, context: str):
        # 決定を行います
        turn_type = obs.get('turnType')
        if turn_type == "ask":
            return self._generate_question(context)
        elif turn_type == "guess":
            return f"**{self._suggest_keyword()}**"
        elif turn_type == "answer":
            question = obs.get('questions', [])[-1]
            return self._analyze_answer(question, context)
        return "無効なターンタイプ"

# 質問者エージェント

class GemmaQuestionerAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        # 質問者としてセッションを開始します
        self.formatter.reset()
        self.formatter.user("20の質問ゲームをプレイしましょう。あなたは質問者の役割を果たしています。")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='model')
        if obs.turnType == 'ask':
            self.formatter.user(f"キーワードを発見するために、{obs.questions} と {obs.answers} の文脈に基づいてはい・いいえの質問をしてください。この質問は、「砂漠で雨が降りますか？」や「あなたは幸せですか？」のようなものではなく、できるだけ具体的な情報を得るための質問にしてください。質問を二重アスタリスクで囲んでください。")
        elif obs.turnType == 'guess':
            self.formatter.user("キーワードを推測してください。推測を二重アスタリスクで囲んでください。")
        self.formatter.start_model_turn()

    def _parse_response(self, response: str, obs: dict):
        # 質問者のレスポンスを解析します
        if obs.turnType == 'ask':
            match = re.search(".+?\?", response.replace('*', ''))
            if match is None:
                question = "それは場所ですか？"
            else:
                question = match.group()
            return question
        elif obs.turnType == 'guess':
            guess = self._parse_keyword(response)
            return guess
        else:
            raise ValueError("不明なターンタイプ:", obs.turnType)

# 回答者エージェント
            
class GemmaAnswererAgent(GemmaAgent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        # 回答者としてセッションを開始します
        self.formatter.reset()
        self.formatter.user(f"20の質問をプレイしましょう。あなたは回答者の役割を果たしています。キーワードは{obs.keyword}で、カテゴリは{obs.category}です。")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='user')
        self.formatter.user(f"このキーワード{obs.keyword}に関して、文脈に基づいてはい・いいえの回答をしてください。")
        self.formatter.start_model_turn()

    def _parse_response(self, response: str, obs: dict):
        # 回答者のレスポンスを解析します
        answer = self._parse_keyword(response)
        return '**yes**' if '**yes**' in answer else '**no**'


# システムプロンプトと少数ショットの例の設定
system_prompt = "あなたはキーワードを発見するためのはい・いいえの質問をするAIアシスタントです。キーワードは特定の人、場所、または物です。質問者であれば毎回キーワードを推測してみてください。まずカテゴリを特定し、その後、キーワードの最初の文字についての質問を使用して推測を絞り込みます。"

few_shot_examples = [
    ("Is it a person?", "Yes"),
    ("Is this person a male?", "Yes"),
    ("Is this person an actor?", "No"),
    ("Is this person a politician?", "Yes"),
    ("Is this person currently alive?", "No"),
    ("Is it a place?", "Yes"),
    ("Is this place a city?", "Yes"),
    ("Is this city in the United States?", "Yes"),
    ("Is this city the capital of a state?", "No"),
    ("Is this city on the east coast?", "Yes"),
    ("Is this place a country?", "Yes"),
    ("Is this country in Europe?", "Yes"),
    ("Is this country a member of the European Union?", "Yes"),
    ("Is it known for its historical landmarks?", "Yes"),
    ("Is it a geographical feature?", "Yes"),
    ("Is it a mountain?", "No"),
    ("Is it a river?", "Yes"),
    ("Is this river in Africa?", "Yes"),
    ("Is this river the longest river in the world?", "Yes"),
    ("Does this river begin with the letter n?", "Yes"),
    ("Is the keyword the Nile River?", "Yes"),
    ("Is it a thing?", "Yes"),
    ("Is this thing man-made?", "Yes"),
    ("Is it used for communication?", "Yes"),
    ("Is it a type of technology?", "Yes"),
    ("Is it smaller than a bread box?", "Yes"),
    ("Does this thing begin with the letter s?", "Yes"),
    ("Is it a type of vehicle?", "No"),
    ("Is it found indoors?", "Yes"),
    ("Is it used for entertainment?", "No")
]

agent = None

def get_agent(name: str):
    global agent
    
    if agent is None and name == 'questioner':
        agent = GemmaQuestionerAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples
        )
    elif agent is None and name == 'answerer':
        agent = GemmaAnswererAgent(
            device='cuda:0',
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples
        )
    assert agent is not None, "エージェントが初期化されていません。"

    return agent

def agent_fn(obs, cfg):
    # エージェントの行動を決定
    if obs.turnType == "ask":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)
    if response is None or len(response) <= 1:
        return "yes"
    else:
        return response

# 提出物

In [None]:
!apt install pigz pv > /dev/null
# pigzとpvパッケージをインストールします。
# pigzは並列圧縮をサポートするgzipのバージョンで、データ圧縮の速度を向上させます。
# pvはデータの転送の進捗を表示するツールです。入力と出力の間でパイプラインを通じてデータを転送する際に役立ちます。

In [None]:
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ gemma/pytorch/7b-it-quant/2
# ここでは、pigzを使用してsubmissionディレクトリを圧縮し、pvでその進捗を表示しながら、submission.tar.gzというアーカイブを作成しています。
# -Cオプションは、指定するディレクトリに移動してからファイルを追加するために使用されます。
# 最初の-Cは、/kaggle/working/submissionディレクトリを対象とし、次の-Cは、/kaggle/input/gemma/pytorch/7b-it-quant/2ディレクトリに移動して、このディレクトリのファイルもアーカイブに含めるために使用されます。

# デバッグ

In [None]:
# from kaggle_environments import make

# def simple_agent(obs, cfg):
#     if obs.turnType == "ask":
#         response = "Is it a duck?"
#     elif obs.turnType == "guess":
#         response = "duck"
#     elif obs.turnType == "answer":
#         response = "no"
#     return response


# debug_config = {'episodeSteps': 61,
#                 'actTimeout': 60,      
#                 'runTimeout': 1200,    
#                 'agentTimeout': 3600}  

# env = make(environment="llm_20_questions", configuration=debug_config, debug=True)

# game_output = env.run(agents=[agent_fn, simple_agent, simple_agent, simple_agent])

# env.render(mode="ipython", width=1080, height=700)