# 要約 
このJupyter Notebookでは、Kaggleの「20の質問」ゲームに挑むためのAIエージェントを開発しています。具体的には、言語モデルを利用した質問者（Questioner）と回答者（Answerer）のエージェントを設計し、ターゲットとなる単語をできるだけ少ない質問で推測する能力を実装しています。

### 問題の説明
コンペティションの「20の質問」ゲームは、質問者がターゲットとなる単語を推測するためにはい/いいえの質問を行うという推理ゲームであり、エージェントは戦略的に質問を展開しなければなりません。このノートブックは、AIエージェントがこのゲームをプレイできるように設計されています。

### 使用している手法とライブラリ
- **Transformersライブラリ**: `transformers`を使用して、あらかじめ訓練されたモデル（Llama3）をロードし、言語生成に利用しています。このモデルは、質問に基づいて回答を生成する能力を備えています。
- **PyTorch**: モデルのセットアップと動作にPyTorchが使用され、特にGPUを使ってメモリ効率の良い実行を行うための設定がされています。
- **カスタムフォーマッタ**: `Llama3Formatter`クラスや`Llama3Agent`クラスを使用して、プロンプトのフォーマットやデータの構造化を担当します。

### エージェントの設計
1. **質問者エージェント（Llama3QuestionerAgent）**: 質問者としての戦略を実装し、ターゲットとなる単語のカテゴリや文字の考慮を行いながら、解答を導出する能力を持っています。
2. **回答者エージェント（Llama3AnswererAgent）**: 提供された質問に対して、適切に「はい」または「いいえ」を応答するように設計されています。

エージェントは、状態をリセットし、過去の質問と回答をトラッキングしながら、プレイヤーとしてのロールを果たします。

このノートブックは、AIエージェントが「20の質問」ゲームにおいてどのように振る舞うかをシミュレートするために、関連するコードやロジックを実装している重要なリソースとなっています。

---


# 用語概説 
以下は、Jupyter Notebookの内容に基づき、初心者がつまずきそうな専門用語の解説です。

### 専門用語解説

1. **システムパス**:
   - Pythonプログラムがモジュールやライブラリを探すためのディレクトリのリスト。システムパスを設定することで、特定のディレクトリからモジュールをインポートできるようにする。

2. **トークナイザー**:
   - 自然言語処理（NLP）において、テキストを単語やサブワードなどのトークンに分割するためのツール。モデルに入力する前に、テキストデータを適切な形式に変換する。

3. **Causal LM**:
   - 「因果言語モデル」の略で、特定の単語やトークンを生成するために、前のトークンを上下文として用いるモデル。主に生成タスクに使用される。

4. **デバイスマップ**:
   - 複数のGPUやCPUがある環境で、どのデバイス上で計算を実行するかを指定する方法。`device_map="auto"`は、自動で最適なデバイスを選択するよう指示。

5. **torch_dtype**:
   - PyTorchにおいて、テンソルのデータ型を指定するための引数。`torch.bfloat16`は、一般的な32ビット浮動小数点数よりも少ないメモリでデータを表現できる形式で、特にトレーニングでの計算効率を向上させる。

6. **メモリ効率を最適化する機能**:
   - GPUのメモリ使用量を減らし、より大きなモデルやバッチサイズを扱うことが可能になるようにするオプション。`enable_mem_efficient_sdp`や`enable_flash_sdp`はそれに関連。

7. **イテラブル**:
   - ループなどで反復処理できるオブジェクト。リスト、タプル、辞書などが該当します。`Iterable`はPythonの型ヒントにも使われ、反復可能であることを示します。

8. **プロンプト**:
   - モデルに対して出力を生成させるための入力データ。文脈情報や質問など、モデルが応答を生成する際に参照する情報を提供します。

9. **アスタリスク**:
   - 特に回答フォーマットにおいて使われる記号。ユーザーからのテキストを強調するために用いられ、通常は太字として表示されます。

10. **ターン**:
    - 人間同士の対話における発話の一つ一つを指し、モデルとユーザ間の連続的なやりとりを管理するための概念。

11. **最大新規トークン数**:
    - モデルが生成できる新しいトークンの最大数を制限するパラメータ。過度に長い生成を防ぎ、必要な情報を効率的に取得するために使う。

12. **不均一な要素の交互に取り出す関数**:
    - 異なる長さの二つのリストから、可能な限り交互に要素を取り出す関数。この関数は、特定の操作をする際に有用です。

これらの用語は、全体として自然言語処理や機械学習の文脈で頻繁に登場するものであり、特に初学者にとっては重要な概念を理解する助けとなるでしょう。

---


<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%bash
mkdir -p /kaggle/working/submission

```

</div>
<div class="column-right">

# 日本語訳

```python
%%bash
mkdir -p /kaggle/working/submission
```

</div>
</details>

In [None]:
%%bash
mkdir -p /kaggle/working/submission

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile submission/main.py
# Setup
import os
import sys

# **IMPORTANT:** Set up your system path like this to make your code work
# both in notebooks and in the simulations environment.
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# https://github.com/Lightning-AI/litgpt/issues/327
torch.backends.cuda.enable_mem_efficient_sdp(False)
torch.backends.cuda.enable_flash_sdp(False)

if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "llama-3/transformers/8b-chat-hf/1")
else:
    WEIGHTS_PATH = "/kaggle/input/llama-3/transformers/8b-chat-hf/1"

# Prompt Formatting
import itertools
from typing import Iterable


class Llama3Formatter:
    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self.reset()

    def get_dict(self):
        return self._state

    def user(self, prompt):
        self._state.append({'role': 'user', 'content': prompt})
        return self

    def model(self, prompt):
        self._state.append({'role': 'assistant', 'content': prompt})
        return self
    
    def system(self, prompt):
        self._state.append({'role': 'system', 'content': prompt})
        return self

    def reset(self):
        self._state = []
        if self._system_prompt is not None:
            self.system(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self

    def apply_turns(self, turns: Iterable, start_agent: str):
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)
        for fmt, turn in zip(formatters, turns):
            fmt(turn)
        return self


# Agent Definitions
import re

class Llama3Agent:
    def __init__(self, system_prompt=None, few_shot_examples=None):
        self.formatter = Llama3Formatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)
        self.tokenizer = AutoTokenizer.from_pretrained(WEIGHTS_PATH)
        self.terminators = [self.tokenizer.eos_token_id, self.tokenizer.convert_tokens_to_ids("")]
        
        ### Load original model
        self.model = AutoModelForCausalLM.from_pretrained(
            WEIGHTS_PATH,
            device_map="auto",
            torch_dtype=torch.bfloat16
        )

    def __call__(self, obs, *args):
        self._start_session(obs)
        prompt = self.formatter.get_dict()
        response = self._call_llm(prompt)
        response = self._parse_response(response, obs)
        return response

    def _start_session(self, obs: dict):
        raise NotImplementedError

    def _call_llm(self, prompt, max_new_tokens=32):
        input_ids = self.tokenizer.apply_chat_template(
            prompt,
            add_generation_prompt=True,
            return_tensors="pt",
        ).to(self.model.device)
        outputs = self.model.generate(
            input_ids=input_ids,
            max_new_tokens=max_new_tokens,
            eos_token_id=self.terminators,
            do_sample=True,
            temperature=0.6,
            top_p=0.9
        )
        response = self.tokenizer.decode(outputs[0][input_ids.shape[-1]:], skip_special_tokens=True)

        return response

    def _parse_keyword(self, response: str):
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)
        if match is None:
            keyword = ''
        else:
            keyword = match.group().lower()
        return keyword

    def _parse_response(self, response: str, obs: dict):
        raise NotImplementedError


def interleave_unequal(x, y):
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None
    ]


class Llama3QuestionerAgent(Llama3Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.category_determined = False
        self.is_place = False
        self.first_char_range = (0, 25)  # A to Z in terms of index
        self.second_char_range = None
        self.final_guess = None

    def _start_session(self, obs):
        global guesses

        self.formatter.reset()
        self.formatter.user("Let's play 20 Questions. You are playing the role of the Questioner.")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='model')

        if not self.category_determined:
            self.formatter.user("Is it a place?")
        else:
            if self.second_char_range is None:
                mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                mid_char = chr(65 + mid_index)  # Convert index to alphabet (0 -> A, 1 -> B, ..., 25 -> Z)
                self.formatter.user(f"Does the keyword start with a letter before {mid_char}?")
            elif self.final_guess is None:
                mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                mid_char = chr(65 + mid_index)
                self.formatter.user(f"Does the second letter of the keyword come before {mid_char}?")
            else:
                self.formatter.user(f"Is the keyword **{self.final_guess}**?")

    def _parse_response(self, response: str, obs: dict):
        if not self.category_determined:
            answer = self._parse_keyword(response)
            self.is_place = (answer == 'yes')
            self.category_determined = True
            return "Is it a place?"
        else:
            if self.second_char_range is None:
                answer = self._parse_keyword(response)
                mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                if answer == 'yes':
                    self.first_char_range = (self.first_char_range[0], mid_index)
                else:
                    self.first_char_range = (mid_index + 1, self.first_char_range[1])

                if self.first_char_range[0] == self.first_char_range[1]:
                    self.second_char_range = (0, 25)  # Reset for second character
                    return f"Does the keyword start with {chr(65 + self.first_char_range[0])}?"
                else:
                    mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                    mid_char = chr(65 + mid_index)
                    return f"Does the keyword start with a letter before {mid_char}?"
            elif self.final_guess is None:
                answer = self._parse_keyword(response)
                mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                if answer == 'yes':
                    self.second_char_range = (self.second_char_range[0], mid_index)
                else:
                    self.second_char_range = (mid_index + 1, self.second_char_range[1])

                if self.second_char_range[0] == self.second_char_range[1]:
                    first_char = chr(65 + self.first_char_range[0])
                    second_char = chr(65 + self.second_char_range[0])
                    self.final_guess = first_char + second_char
                    return f"Does the keyword start with {first_char}{second_char}?"
                else:
                    mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                    mid_char = chr(65 + mid_index)
                    return f"Does the second letter of the keyword come before {mid_char}?"
            else:
                answer = self._parse_keyword(response)
                if answer == 'yes':
                    return f"The keyword is **{self.final_guess}**."
                else:
                    self.final_guess = None
                    return "Let's continue guessing."


class Llama3AnswererAgent(Llama3Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()
        self.formatter.user(f"Let's play 20 Questions. You are playing the role of the Answerer. The keyword is {obs.keyword} in the category {obs.category}.")
        turns = interleave_unequal(obs.questions, obs.answers)
        self.formatter.apply_turns(turns, start_agent='user')
        self.formatter.user(f"The question is about the keyword {obs.keyword} in the category {obs.category}. Give yes-or-no answer and surround your answer with double asterisks, like **yes** or **no**.")

    def _parse_response(self, response: str, obs: dict):
        answer = self._parse_keyword(response)
        return 'yes' if 'yes' in answer else 'no'


# Agent Creation
system_prompt = "You are a very smart AI assistant designed to play the 20 Questions game. In this game, the Answerer thinks of a keyword and responds to yes-or-no questions by the Questioner. The keyword is a specific place or thing."

few_shot_examples = [
    "Let's play 20 Questions. You are playing the role of the Questioner. Please ask your first question.",
    "Is the category of the keyword place?", "**no**",
    "Is it a food?", "**yes** Now guess the keyword in the category things.",
    "**Veggie Burger**", "Correct.",
]


# **IMPORTANT:** Define agent as a global so you only have to load
# the agent you need. Loading both will likely lead to OOM.
agent = None


def get_agent(name: str):
    global agent
    
    if agent is None and name == 'questioner':
        agent = Llama3QuestionerAgent(
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    elif agent is None and name == 'answerer':
        agent = Llama3AnswererAgent(
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    assert agent is not None, "Agent not initialized."

    return agent


turnRound = 1
guesses = []

def agent_fn(obs, cfg):
    global turnRound
    global guesses

    if obs.turnType == "ask":
        if turnRound == 1:
            response = "Is it a place?" # First question
        else:
            response = get_agent('questioner')(obs)
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
        turnRound += 1
        guesses.append(response)
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)
        turnRound += 1
    if response is None or len(response) <= 1:
        return "yes"
    else:
        return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile submission/main.py
# 準備
import os
import sys

# **重要:** コードがノートブックとシミュレーション環境両方で動作するように、システムパスを下記のように設定します。
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# https://github.com/Lightning-AI/litgpt/issues/327
torch.backends.cuda.enable_mem_efficient_sdp(False) # メモリ効率を最適化する機能を無効にします
torch.backends.cuda.enable_flash_sdp(False) # フラッシュSDP機能を無効にします

if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "llama-3/transformers/8b-chat-hf/1")
else:
    WEIGHTS_PATH = "/kaggle/input/llama-3/transformers/8b-chat-hf/1"

# プロンプトのフォーマット
import itertools
from typing import Iterable

# Llama3Formatterクラスを定義します
class Llama3Formatter:
    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self.reset()  # ステートをリセットします

    def get_dict(self):
        return self._state

    def user(self, prompt):
        self._state.append({'role': 'user', 'content': prompt})  # ユーザーのプロンプトを追加します
        return self

    def model(self, prompt):
        self._state.append({'role': 'assistant', 'content': prompt})  # モデルのプロンプトを追加します
        return self
    
    def system(self, prompt):
        self._state.append({'role': 'system', 'content': prompt})  # システムのプロンプトを追加します
        return self

    def reset(self):
        self._state = []  # ステートを初期化します
        if self._system_prompt is not None:
            self.system(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self

    def apply_turns(self, turns: Iterable, start_agent: str):
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)  # フォーマッタを循環させます
        for fmt, turn in zip(formatters, turns):
            fmt(turn)  # 各ターンにフォーマットを適用します
        return self

# エージェントの定義
import re

class Llama3Agent:
    def __init__(self, system_prompt=None, few_shot_examples=None):
        self.formatter = Llama3Formatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)
        self.tokenizer = AutoTokenizer.from_pretrained(WEIGHTS_PATH)  # トークナイザーを初期化します
        self.terminators = [self.tokenizer.eos_token_id, self.tokenizer.convert_tokens_to_ids("")]
        
        ### 元のモデルを読み込みます
        self.model = AutoModelForCausalLM.from_pretrained(
            WEIGHTS_PATH,
            device_map="auto",
            torch_dtype=torch.bfloat16
        )

    def __call__(self, obs, *args):
        self._start_session(obs)  # セッションを開始します
        prompt = self.formatter.get_dict()  # プロンプトを取得します
        response = self._call_llm(prompt)  # LLMを呼び出し結果を取得します
        response = self._parse_response(response, obs)  # レスポンスを解析します
        return response

    def _start_session(self, obs: dict):
        raise NotImplementedError  # 未実装の状態でエラーを発生させます

    def _call_llm(self, prompt, max_new_tokens=32):
        input_ids = self.tokenizer.apply_chat_template(
            prompt,
            add_generation_prompt=True,
            return_tensors="pt",
        ).to(self.model.device)  # モデルのデバイスにテンソルを移動します
        outputs = self.model.generate(
            input_ids=input_ids,
            max_new_tokens=max_new_tokens,
            eos_token_id=self.terminators,
            do_sample=True,
            temperature=0.6,
            top_p=0.9
        )
        response = self.tokenizer.decode(outputs[0][input_ids.shape[-1]:], skip_special_tokens=True)  # 生成されたトークンをデコードします

        return response

    def _parse_keyword(self, response: str):
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)  # キーワードを探します
        if match is None:
            keyword = ''
        else:
            keyword = match.group().lower()  # 小文字に変換します
        return keyword

    def _parse_response(self, response: str, obs: dict):
        raise NotImplementedError  # 未実装の状態でエラーを発生させます

# 不均一な要素を交互に取り出す関数
def interleave_unequal(x, y):
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None  # 不均一な要素を交互に取り出します
    ]

class Llama3QuestionerAgent(Llama3Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.category_determined = False  # カテゴリーが決定されていない状態
        self.is_place = False  # 場所かどうかのフラグ
        self.first_char_range = (0, 25)  # AからZまでのインデックス範囲
        self.second_char_range = None  # 2文字目の範囲
        self.final_guess = None  # 最終的な推測

    def _start_session(self, obs):
        global guesses  # グローバル変数を参照

        self.formatter.reset()  # フォーマッターをリセットします
        self.formatter.user("Let's play 20 Questions. You are playing the role of the Questioner.")  # ユーザーに役割を指定します
        turns = interleave_unequal(obs.questions, obs.answers)  # 質問と回答を交互に取り出します
        self.formatter.apply_turns(turns, start_agent='model')  # フォーマットを適用します

        if not self.category_determined:
            self.formatter.user("Is it a place?")  # カテゴリーが決定されていない場合の質問
        else:
            if self.second_char_range is None:
                mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2  # 中間インデックスの計算
                mid_char = chr(65 + mid_index)  # インデックスをアルファベットに変換 (0 -> A, 1 -> B, ..., 25 -> Z)
                self.formatter.user(f"Does the keyword start with a letter before {mid_char}?")
            elif self.final_guess is None:
                mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                mid_char = chr(65 + mid_index)
                self.formatter.user(f"Does the second letter of the keyword come before {mid_char}?")
            else:
                self.formatter.user(f"Is the keyword **{self.final_guess}**?")  # 最終推測を確認します

    def _parse_response(self, response: str, obs: dict):
        if not self.category_determined:
            answer = self._parse_keyword(response)  # レスポンスからキーワードを解析します
            self.is_place = (answer == 'yes')  # 'yes'の場合は場所と判定
            self.category_determined = True  # カテゴリーが決定したことを記録
            return "Is it a place?"  # 質問を返します
        else:
            if self.second_char_range is None:
                answer = self._parse_keyword(response)
                mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                if answer == 'yes':
                    self.first_char_range = (self.first_char_range[0], mid_index)  # 範囲を更新
                else:
                    self.first_char_range = (mid_index + 1, self.first_char_range[1])

                if self.first_char_range[0] == self.first_char_range[1]:
                    self.second_char_range = (0, 25)  # 2文字目の範囲をリセット
                    return f"Does the keyword start with {chr(65 + self.first_char_range[0])}?"
                else:
                    mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                    mid_char = chr(65 + mid_index)
                    return f"Does the keyword start with a letter before {mid_char}?"
            elif self.final_guess is None:
                answer = self._parse_keyword(response)
                mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                if answer == 'yes':
                    self.second_char_range = (self.second_char_range[0], mid_index)  # 2文字目の範囲を更新
                else:
                    self.second_char_range = (mid_index + 1, self.second_char_range[1])

                if self.second_char_range[0] == self.second_char_range[1]:  # 最終推測を決定
                    first_char = chr(65 + self.first_char_range[0])
                    second_char = chr(65 + self.second_char_range[0])
                    self.final_guess = first_char + second_char
                    return f"Does the keyword start with {first_char}{second_char}?"
                else:
                    mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                    mid_char = chr(65 + mid_index)
                    return f"Does the second letter of the keyword come before {mid_char}?"
            else:
                answer = self._parse_keyword(response)
                if answer == 'yes':
                    return f"The keyword is **{self.final_guess}**."  # 最終的な答えを返します
                else:
                    self.final_guess = None  # 最終推測をリセット
                    return "Let's continue guessing."  # 推測を続けることを提案します


class Llama3AnswererAgent(Llama3Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()  # フォーマッターをリセットします
        self.formatter.user(f"Let's play 20 Questions. You are playing the role of the Answerer. The keyword is {obs.keyword} in the category {obs.category}.")  # 回答者としての役割を指定します
        turns = interleave_unequal(obs.questions, obs.answers)  # 質問と回答を交互に取り出します
        self.formatter.apply_turns(turns, start_agent='user')  # フォーマットを適用します
        self.formatter.user(f"The question is about the keyword {obs.keyword} in the category {obs.category}. Give yes-or-no answer and surround your answer with double asterisks, like **yes** or **no**.") #  yes/noの回答を要求

    def _parse_response(self, response: str, obs: dict):
        answer = self._parse_keyword(response)  # レスポンスからキーワードを解析します
        return 'yes' if 'yes' in answer else 'no'  # 'yes'が含まれていれば'yes'を返します


# エージェントの作成
system_prompt = "あなたは20の質問ゲームをプレイするために設計された非常に賢いAIアシスタントです。このゲームでは、回答者がキーワードを考え、その回答者のyes-or-noの質問に対して質問者が応答します。キーワードは特定の場所または物です。"

few_shot_examples = [
    "Let's play 20 Questions. You are playing the role of the Questioner. Please ask your first question.",
    "Is the category of the keyword place?", "**no**",
    "Is it a food?", "**yes** Now guess the keyword in the category things.",
    "**Veggie Burger**", "Correct.",
]

# **重要:** エージェントをグローバルに定義します。これにより、必要なエージェントを一度だけ読み込むことができます。
# 両方を読み込むと、メモリオーバーが発生する可能性があります。
agent = None

def get_agent(name: str):
    global agent
    
    if agent is None and name == 'questioner':
        agent = Llama3QuestionerAgent(
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    elif agent is None and name == 'answerer':
        agent = Llama3AnswererAgent(
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    assert agent is not None, "エージェントが初期化されていません。"

    return agent

turnRound = 1
guesses = []

def agent_fn(obs, cfg):
    global turnRound
    global guesses

    if obs.turnType == "ask":
        if turnRound == 1:
            response = "Is it a place?" # 最初の質問
        else:
            response = get_agent('questioner')(obs)  # 質問者エージェントを呼び出します
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
        turnRound += 1  # 回合を増やします
        guesses.append(response)  # 推測を追加
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)  # 回答者エージェントを呼び出します
        turnRound += 1  # 回合を増やします
    if response is None or len(response) <= 1:
        return "yes"  # レスポンスが空または短い場合はyesを返します
    else:
        return response  # それ以外のレスポンスを返します
```

</div>
</details>

In [None]:
%%writefile submission/main.py
# 準備
import os
import sys

# **重要:** コードがノートブックとシミュレーション環境両方で動作するように、システムパスを下記のように設定します。
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# https://github.com/Lightning-AI/litgpt/issues/327
torch.backends.cuda.enable_mem_efficient_sdp(False) # メモリ効率を最適化する機能を無効にします
torch.backends.cuda.enable_flash_sdp(False) # フラッシュSDP機能を無効にします

if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "llama-3/transformers/8b-chat-hf/1")
else:
    WEIGHTS_PATH = "/kaggle/input/llama-3/transformers/8b-chat-hf/1"

# プロンプトのフォーマット
import itertools
from typing import Iterable

# Llama3Formatterクラスを定義します
class Llama3Formatter:
    def __init__(self, system_prompt: str = None, few_shot_examples: Iterable = None):
        self._system_prompt = system_prompt
        self._few_shot_examples = few_shot_examples
        self.reset()  # ステートをリセットします

    def get_dict(self):
        return self._state

    def user(self, prompt):
        self._state.append({'role': 'user', 'content': prompt})  # ユーザーのプロンプトを追加します
        return self

    def model(self, prompt):
        self._state.append({'role': 'assistant', 'content': prompt})  # モデルのプロンプトを追加します
        return self
    
    def system(self, prompt):
        self._state.append({'role': 'system', 'content': prompt})  # システムのプロンプトを追加します
        return self

    def reset(self):
        self._state = []  # ステートを初期化します
        if self._system_prompt is not None:
            self.system(self._system_prompt)
        if self._few_shot_examples is not None:
            self.apply_turns(self._few_shot_examples, start_agent='user')
        return self

    def apply_turns(self, turns: Iterable, start_agent: str):
        formatters = [self.model, self.user] if start_agent == 'model' else [self.user, self.model]
        formatters = itertools.cycle(formatters)  # フォーマッタを循環させます
        for fmt, turn in zip(formatters, turns):
            fmt(turn)  # 各ターンにフォーマットを適用します
        return self

# エージェントの定義
import re

class Llama3Agent:
    def __init__(self, system_prompt=None, few_shot_examples=None):
        self.formatter = Llama3Formatter(system_prompt=system_prompt, few_shot_examples=few_shot_examples)
        self.tokenizer = AutoTokenizer.from_pretrained(WEIGHTS_PATH)  # トークナイザーを初期化します
        self.terminators = [self.tokenizer.eos_token_id, self.tokenizer.convert_tokens_to_ids("")]
        
        ### 元のモデルを読み込みます
        self.model = AutoModelForCausalLM.from_pretrained(
            WEIGHTS_PATH,
            device_map="auto",
            torch_dtype=torch.bfloat16
        )

    def __call__(self, obs, *args):
        self._start_session(obs)  # セッションを開始します
        prompt = self.formatter.get_dict()  # プロンプトを取得します
        response = self._call_llm(prompt)  # LLMを呼び出し結果を取得します
        response = self._parse_response(response, obs)  # レスポンスを解析します
        return response

    def _start_session(self, obs: dict):
        raise NotImplementedError  # 未実装の状態でエラーを発生させます

    def _call_llm(self, prompt, max_new_tokens=32):
        input_ids = self.tokenizer.apply_chat_template(
            prompt,
            add_generation_prompt=True,
            return_tensors="pt",
        ).to(self.model.device)  # モデルのデバイスにテンソルを移動します
        outputs = self.model.generate(
            input_ids=input_ids,
            max_new_tokens=max_new_tokens,
            eos_token_id=self.terminators,
            do_sample=True,
            temperature=0.6,
            top_p=0.9
        )
        response = self.tokenizer.decode(outputs[0][input_ids.shape[-1]:], skip_special_tokens=True)  # 生成されたトークンをデコードします

        return response

    def _parse_keyword(self, response: str):
        match = re.search(r"(?<=\*\*)([^*]+)(?=\*\*)", response)  # キーワードを探します
        if match is None:
            keyword = ''
        else:
            keyword = match.group().lower()  # 小文字に変換します
        return keyword

    def _parse_response(self, response: str, obs: dict):
        raise NotImplementedError  # 未実装の状態でエラーを発生させます

# 不均一な要素を交互に取り出す関数
def interleave_unequal(x, y):
    return [
        item for pair in itertools.zip_longest(x, y) for item in pair if item is not None  # 不均一な要素を交互に取り出します
    ]

class Llama3QuestionerAgent(Llama3Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.category_determined = False  # カテゴリーが決定されていない状態
        self.is_place = False  # 場所かどうかのフラグ
        self.first_char_range = (0, 25)  # AからZまでのインデックス範囲
        self.second_char_range = None  # 2文字目の範囲
        self.final_guess = None  # 最終的な推測

    def _start_session(self, obs):
        global guesses  # グローバル変数を参照

        self.formatter.reset()  # フォーマッターをリセットします
        self.formatter.user("Let's play 20 Questions. You are playing the role of the Questioner.")  # ユーザーに役割を指定します
        turns = interleave_unequal(obs.questions, obs.answers)  # 質問と回答を交互に取り出します
        self.formatter.apply_turns(turns, start_agent='model')  # フォーマットを適用します

        if not self.category_determined:
            self.formatter.user("Is it a place?")  # カテゴリーが決定されていない場合の質問
        else:
            if self.second_char_range is None:
                mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2  # 中間インデックスの計算
                mid_char = chr(65 + mid_index)  # インデックスをアルファベットに変換 (0 -> A, 1 -> B, ..., 25 -> Z)
                self.formatter.user(f"Does the keyword start with a letter before {mid_char}?")
            elif self.final_guess is None:
                mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                mid_char = chr(65 + mid_index)
                self.formatter.user(f"Does the second letter of the keyword come before {mid_char}?")
            else:
                self.formatter.user(f"Is the keyword **{self.final_guess}**?")  # 最終推測を確認します

    def _parse_response(self, response: str, obs: dict):
        if not self.category_determined:
            answer = self._parse_keyword(response)  # レスポンスからキーワードを解析します
            self.is_place = (answer == 'yes')  # 'yes'の場合は場所と判定
            self.category_determined = True  # カテゴリーが決定したことを記録
            return "Is it a place?"  # 質問を返します
        else:
            if self.second_char_range is None:
                answer = self._parse_keyword(response)
                mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                if answer == 'yes':
                    self.first_char_range = (self.first_char_range[0], mid_index)  # 範囲を更新
                else:
                    self.first_char_range = (mid_index + 1, self.first_char_range[1])

                if self.first_char_range[0] == self.first_char_range[1]:
                    self.second_char_range = (0, 25)  # 2文字目の範囲をリセット
                    return f"Does the keyword start with {chr(65 + self.first_char_range[0])}?"
                else:
                    mid_index = (self.first_char_range[0] + self.first_char_range[1]) // 2
                    mid_char = chr(65 + mid_index)
                    return f"Does the keyword start with a letter before {mid_char}?"
            elif self.final_guess is None:
                answer = self._parse_keyword(response)
                mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                if answer == 'yes':
                    self.second_char_range = (self.second_char_range[0], mid_index)  # 2文字目の範囲を更新
                else:
                    self.second_char_range = (mid_index + 1, self.second_char_range[1])

                if self.second_char_range[0] == self.second_char_range[1]:  # 最終推測を決定
                    first_char = chr(65 + self.first_char_range[0])
                    second_char = chr(65 + self.second_char_range[0])
                    self.final_guess = first_char + second_char
                    return f"Does the keyword start with {first_char}{second_char}?"
                else:
                    mid_index = (self.second_char_range[0] + self.second_char_range[1]) // 2
                    mid_char = chr(65 + mid_index)
                    return f"Does the second letter of the keyword come before {mid_char}?"
            else:
                answer = self._parse_keyword(response)
                if answer == 'yes':
                    return f"The keyword is **{self.final_guess}**."  # 最終的な答えを返します
                else:
                    self.final_guess = None  # 最終推測をリセット
                    return "Let's continue guessing."  # 推測を続けることを提案します


class Llama3AnswererAgent(Llama3Agent):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def _start_session(self, obs):
        self.formatter.reset()  # フォーマッターをリセットします
        self.formatter.user(f"Let's play 20 Questions. You are playing the role of the Answerer. The keyword is {obs.keyword} in the category {obs.category}.")  # 回答者としての役割を指定します
        turns = interleave_unequal(obs.questions, obs.answers)  # 質問と回答を交互に取り出します
        self.formatter.apply_turns(turns, start_agent='user')  # フォーマットを適用します
        self.formatter.user(f"The question is about the keyword {obs.keyword} in the category {obs.category}. Give yes-or-no answer and surround your answer with double asterisks, like **yes** or **no**.") #  yes/noの回答を要求

    def _parse_response(self, response: str, obs: dict):
        answer = self._parse_keyword(response)  # レスポンスからキーワードを解析します
        return 'yes' if 'yes' in answer else 'no'  # 'yes'が含まれていれば'yes'を返します


# エージェントの作成
system_prompt = "あなたは20の質問ゲームをプレイするために設計された非常に賢いAIアシスタントです。このゲームでは、回答者がキーワードを考え、その回答者のyes-or-noの質問に対して質問者が応答します。キーワードは特定の場所または物です。"

few_shot_examples = [
    "Let's play 20 Questions. You are playing the role of the Questioner. Please ask your first question.",
    "Is the category of the keyword place?", "**no**",
    "Is it a food?", "**yes** Now guess the keyword in the category things.",
    "**Veggie Burger**", "Correct.",
]

# **重要:** エージェントをグローバルに定義します。これにより、必要なエージェントを一度だけ読み込むことができます。
# 両方を読み込むと、メモリオーバーが発生する可能性があります。
agent = None

def get_agent(name: str):
    global agent
    
    if agent is None and name == 'questioner':
        agent = Llama3QuestionerAgent(
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    elif agent is None and name == 'answerer':
        agent = Llama3AnswererAgent(
            system_prompt=system_prompt,
            few_shot_examples=few_shot_examples,
        )
    assert agent is not None, "エージェントが初期化されていません。"

    return agent

turnRound = 1
guesses = []

def agent_fn(obs, cfg):
    global turnRound
    global guesses

    if obs.turnType == "ask":
        if turnRound == 1:
            response = "Is it a place?" # 最初の質問
        else:
            response = get_agent('questioner')(obs)  # 質問者エージェントを呼び出します
    elif obs.turnType == "guess":
        response = get_agent('questioner')(obs)
        turnRound += 1  # 回合を増やします
        guesses.append(response)  # 推測を追加
    elif obs.turnType == "answer":
        response = get_agent('answerer')(obs)  # 回答者エージェントを呼び出します
        turnRound += 1  # 回合を増やします
    if response is None or len(response) <= 1:
        return "yes"  # レスポンスが空または短い場合はyesを返します
    else:
        return response  # それ以外のレスポンスを返します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!apt install pigz pv > /dev/null
```

</div>
<div class="column-right">

# 日本語訳

```python
!apt install pigz pv > /dev/null
```

</div>
</details>

In [None]:
!apt install pigz pv > /dev/null

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ llama-3/transformers/8b-chat-hf/1
```

</div>
<div class="column-right">

# 日本語訳

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ llama-3/transformers/8b-chat-hf/1
```

</div>
</details>

In [None]:
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission . -C /kaggle/input/ llama-3/transformers/8b-chat-hf/1

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%bash
mkdir -p /kaggle/working/submission
```

</div>
<div class="column-right">

# 日本語訳

```python
%%bash
mkdir -p /kaggle/working/submission
```

</div>
</details>

In [None]:
%%bash
mkdir -p /kaggle/working/submission