# 要約 
このJupyter Notebookは、Kaggleの「LLM 20 Questions」コンペティションのために構築されたシンプルなスタートノートブックです。コンペティションの目標である、言語モデルを用いた「20の質問」ゲームのために、大幅に簡略化されたプロンプトエンジニアリングを迅速に始めるためのフレームワークを提供しています。具体的には、プロンプトは他のより高度なノートブックから取得され、モデルをテストするための部分が設けられています。

### 取り組む問題
このノートブックは、「20の質問」ゲームにおける質問者エージェントと回答者エージェントの両方を実装し、ゲームの進行において迅速かつ正確に情報を処理する問題に取り組んでいます。特に、推測、質問、回答の各ターンにおいて、適切なプロンプトを生成し、応答を得る能力が重要です。

### 使用されている手法とライブラリ
1. **Gemmaモデル**: 必要なモデルとして`GemmaForCausalLM`が使用されます。このモデルは、具体的なタスクに最適化された言語モデルであり、質問に対する回答を生成します。
2. **Torch**: 深層学習のためのフレームワークであり、モデルの学習と実行に使用されています。
3. **ImmutableDictとSentencePiece**: 特定のライブラリがインストールされ、テキスト処理やメモリ管理の効率を高めるために使用されています。

### コードの概要
ノートブックには、エージェントが使用する異なるメソッド（`ask_agent`, `guess_agent`, `answer_agent`）が定義されており、これらがそれぞれ質問、推測、回答の役割を果たします。プロンプトは、ゲームの進行状況に応じてダイナミックに生成され、LLM（大規模言語モデル）を介して処理され、結果が返されます。

ノートブックの後半部分では、エージェントの入力データを手動で構築し、さまざまなターン（質問、推測、回答）を実行するためのテストが行われています。これにより、実際のゲームシナリオでの動作を確認し、必要に応じて改善策を提案できるようになっています。

このように、ノートブックは「20の質問」ゲームという特定の問題に対して、言語モデルを活用した効率的な対話システムの基盤を提供しています。

---


# 用語概説 
以下は、Jupyter Notebookの内容に関連する専門用語の簡単な解説です。特に初心者がつまずく可能性があるマイナーな用語や、実務経験がないと馴染みがないものに焦点を当てています。

1. **プロンプトエンジニアリング**:
   - テキスト入力（プロンプト）を工夫してAIモデルから期待される応答を得る技術。効果的なプロンプトは、モデルの応答の質を大きく改善することができる。

2. **immutabledict**:
   - イミュータブル（不変）な辞書の実装。辞書の内容を変更できないため、誤ってデータを変更してしまうリスクを減らすことができる。主にデータの整合性を保つために使用される。

3. **sentencepiece**:
   - サブワードトークナイザーで、テキストをより小さな意味的単位（サブワード）に分解する技術。特に言語モデルの前処理に利用され、新しい単語や形を柔軟に扱うことができる。

4. **GemmaForCausalLM**:
   - 特定の生成的因果言語モデル（Causal Language Model）で、出力がつながりを持ちながら生成されるように設計されている。主に自然言語生成や推論タスクに使用される。

5. **量子化（Quantization）**:
   - モデルのパラメータを低精度に変換して、メモリ使用量を削減し、推論速度を向上させるプロセス。「量子化フラグ」を設定することで、訓練済みの高精度モデルをより軽量なものに変換できる。

6. **サンプリング温度（Temperature）**:
   - モデルの出力のランダム性を制御するパラメータ。温度が高いほど多様性が増し、低いほど安定した予測が得られる。特に生成タスクでのクリエイティビティや多様性を調整するために重要。

7. **top_pサンプリング**:
   - 確率的サンプリング手法で、累積分布が指定した確率（top_p）を超えるトークンのうち、最も確率の高いものからサンプリングすることにより、多様な出力を選択する方法。

8. **デフォルトテンソルタイプ**:
   - PyTorchにおけるデフォルトのデータ型設定。特定の演算がどのデータ型で実行されるかに影響を与える。計算精度やメモリ使用効率に関連するため、使い方に注意が必要。

9. **エージェント（Agent）**:
   - 特定の役割を果たすプログラム。ここでは、質問者と回答者の役割を持ち、お互いにインタラクションするLLMを指す。

10. **状態管理（State Management）**:
   - 定義された変数やデータ（質問や回答など）の状態を維持するプロセス。ゲームの進行やモデルの応答に利用される。

これらの用語は、ノートブックの実装や設定において重要な役割を果たしており、理解しておくことで全体の理解が深まります。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Notebook to show Simple Start

Based on the excllent "LLM 20 Questions Starter Notebook"  

However this is much more simpliffied in order to help to get started with prompt engineering quickly.    

It is not as advanced as the "LLM 20 Questions Starter Notebook" and the prompts are taken directly from the "LLM 20 Questions" notebook supplied for the competition.  

At the end there are cells to help test your prompts. 

Any issues/suggestions for improvements are welcome.

</div>
<div class="column-right">

# 日本語訳

# シンプルスタートを示すノートブック

優れた「LLM 20 Questions Starter Notebook」に基づいています。

ただし、プロンプトエンジニアリングを迅速に始めるために、はるかに簡略化されています。

「LLM 20 Questions Starter Notebook」ほど高度ではなく、プロンプトはコンペティション用に提供された「LLM 20 Questions」ノートブックから直接取得されています。

最後には、プロンプトをテストするためのセルがあります。

問題や改善の提案があれば歓迎します。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%bash
cd /kaggle/working
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece
git clone https://github.com/google/gemma_pytorch.git > /dev/null
mkdir /kaggle/working/submission/lib/gemma/
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/
```

</div>
<div class="column-right">

# 日本語訳

```python
%%bash
cd /kaggle/working
# immutabledictとsentencepieceを指定したディレクトリにインストールします
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece
# gemma_pytorchリポジトリをクローンします
git clone https://github.com/google/gemma_pytorch.git > /dev/null
# gemma用のディレクトリを作成します
mkdir /kaggle/working/submission/lib/gemma/
# gemmaパッケージのファイルを移動します
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/
```

</div>
</details>

In [None]:
%%bash
cd /kaggle/working
# immutabledictとsentencepieceを指定したディレクトリにインストールします
pip install -q -U -t /kaggle/working/submission/lib immutabledict sentencepiece
# gemma_pytorchリポジトリをクローンします
git clone https://github.com/google/gemma_pytorch.git > /dev/null
# gemma用のディレクトリを作成します
mkdir /kaggle/working/submission/lib/gemma/
# gemmaパッケージのファイルを移動します
mv /kaggle/working/gemma_pytorch/gemma/* /kaggle/working/submission/lib/gemma/

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

**Add the model using Add Input**  
This is found on the right hand side of the enivronment

</div>
<div class="column-right">

# 日本語訳

**Add the model using Add Input**  
環境の右側に見つけることができます


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# %%writefile submission/main.py

import os
import sys

KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

import contextlib
import os
import sys
from dataclasses import dataclass
from typing import Literal, List

import torch
from gemma.config import get_config_for_7b
from gemma.model import GemmaForCausalLM

if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"


# Set our own dataclass so we know what is in the object
@dataclass
class ObsData:
    answers: List["str"]
    category: str
    keyword: str
    questions: List["str"]
    turn_type: Literal["ask", "guess", "answer"]
    

class Agents:
    def __init__(self):
        self.model = None
        
        # It is much better if you request a GPU session as a 7B model is rather large
        self._device = torch.device("cpu")
        if torch.cuda.is_available():
            self._device = torch.device("cuda:0")
    
    def answer_agent(self, question: str, category: str, keyword: str) -> Literal["yes", "no"]:
        info_prompt = """You are a very precise answerer in a game of 20 questions. The keyword that the questioner is trying to guess is [the {category} {keyword}]. """
        answer_question_prompt = f"""Answer the following question with only yes, no, or if unsure maybe: {question}"""
    
        prompt = "{}{}".format(
            info_prompt.format(category=category, keyword=keyword),
            answer_question_prompt
        )
        
        return self._call_llm(prompt)

    def ask_agent(self, questions: List[str], answers: List[str]) -> str:
        info_prompt = """You are playing a game of 20 questions where you ask the questions and try to figure out the keyword, which will be a real or fictional person, place, or thing. \nHere is what you know so far:\n{q_a_thread}"""
        questions_prompt = """Ask one yes or no question."""

        q_a_thread = ""
        for i in range(0, len(answers)):
            q_a_thread = "{}Q: {} A: {}\n".format(
                q_a_thread,
                questions[i],
                answers[i]
            )
    
        prompt = "{}{}".format(
            info_prompt.format(q_a_thread=q_a_thread),
            questions_prompt
        )

        return self._call_llm(prompt)

    
    def guess_agent(self, questions: List[str], answers: List[str]) -> str:
        # It is expected that the answer is surrounder by **         
        info_prompt = """You are playing a game of 20 questions where you ask the questions and try to figure out the keyword, which will be a real or fictional person, place, or thing. \nHere is what you know so far:\n{q_a_thread}"""
        guess_prompt = """Guess the keyword. Only respond with the exact word/phrase. For example, if you think the keyword is [paris], don't respond with [I think the keyword is paris] or [Is the kewyord Paris?]. Respond only with the word [paris]."""

        q_a_thread = ""
        for i in range(0, len(answers)):
            q_a_thread = "{}Q: {} A: {}\n".format(
                q_a_thread,
                questions[i],
                answers[i]
            )
        
        prompt = "{}{}".format(
            info_prompt.format(q_a_thread=q_a_thread),
            guess_prompt
        )

        return f"**{self._call_llm(prompt)}**"
    
    def _call_llm(self, prompt: str):
        self._set_model()
        
        sampler_kwargs = {
            'temperature': 0.01,
            'top_p': 0.1,
            'top_k': 1,
        }
        
        return self.model.generate(
            prompt,
            device=self._device,
            output_len=100,
            **sampler_kwargs,
        )
         
    def _set_model(self):
        if self.model is None:
            print("No model yet so setting up")
            model_config = get_config_for_7b()
            model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")
            model_config.quant = True

            # Not using a context manager blows the stack
            with self._set_default_tensor_type(model_config.get_dtype()):
                model = GemmaForCausalLM(model_config)
                ckpt_path = os.path.join(WEIGHTS_PATH , f'gemma-7b-it-quant.ckpt')
                model.load_weights(ckpt_path)
                self.model = model.to(self._device).eval()
    
    @contextlib.contextmanager
    def _set_default_tensor_type(self, dtype: torch.dtype):
        """Set the default torch dtype to the given dtype."""
        torch.set_default_dtype(dtype)
        yield
        torch.set_default_dtype(torch.float)

# The entry point so name and paramters are preset
def agent_fn(obs, cfg) -> str:
    obs_data = ObsData(
        turn_type=obs.turnType,
        questions=obs.questions,
        answers=obs.answers,
        keyword=obs.keyword,
        category=obs.category
    )
    
    if obs_data.turn_type == "ask":
        response = agents.ask_agent(questions=obs.questions, answers=obs.answers)
    if obs_data.turn_type == "guess":
        response = agents.guess_agent(questions=obs.questions, answers=obs.answers)
    if obs_data.turn_type == "answer":
        response = agents.answer_agent(question=obs.questions[-1], category=obs.category, keyword=obs.keyword)
    
    if response is None or len(response) <= 1:
        return "yes"
    
    return response

# Instantiate the agents class so the model is only set once
agents = Agents()
```

</div>
<div class="column-right">

# 日本語訳

```python
# %%writefile submission/main.py

import os
import sys

# Kaggleのエージェントのパスを指定します
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

import contextlib
import os
import sys
from dataclasses import dataclass
from typing import Literal, List

import torch
from gemma.config import get_config_for_7b
from gemma.model import GemmaForCausalLM

# 重みファイルのパスを設定します
if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"


# オブジェクトの内容を把握するために独自のデータクラスを定義します
@dataclass
class ObsData:
    answers: List["str"]  # 回答のリスト
    category: str  # カテゴリ名
    keyword: str  # キーワード
    questions: List["str"]  # 質問のリスト
    turn_type: Literal["ask", "guess", "answer"]  # ターンの種類（質問、推測、回答のいずれか）
    

class Agents:
    def __init__(self):
        self.model = None
        
        # 7Bモデルはかなり大きいのでGPUセッションをリクエストするのが理想的です
        self._device = torch.device("cpu")  # デフォルトはCPU
        if torch.cuda.is_available():
            self._device = torch.device("cuda:0")  # GPUが利用可能なら使用します
    
    def answer_agent(self, question: str, category: str, keyword: str) -> Literal["yes", "no"]:
        # 質問者が推測しているキーワードについての情報を設定します
        info_prompt = """あなたは「20の質問」ゲームにおいて非常に正確な回答者です。質問者が推測しているキーワードは[カテゴリ: {category} キーワード: {keyword}]です。"""
        answer_question_prompt = f"""以下の質問に「はい」、「いいえ」、または「わからない場合はmaybe」だけで答えてください: {question}"""
    
        # プロンプトを組み立てます
        prompt = "{}{}".format(
            info_prompt.format(category=category, keyword=keyword),
            answer_question_prompt
        )
        
        return self._call_llm(prompt)  # LLMを呼び出して応答を得る

    def ask_agent(self, questions: List[str], answers: List[str]) -> str:
        # 質問を行いキーワードを推測するための情報を設定します
        info_prompt = """あなたは「20の質問」ゲームをプレイしており、質問をしてキーワードを推測しようとしています。それは現実または架空の人物、場所、または物です。\nここまでに知っている情報:\n{q_a_thread}"""
        questions_prompt = """1つの「はい」または「いいえ」で答えられる質問をして下さい。"""

        # 質問と回答の履歴を構築します
        q_a_thread = ""
        for i in range(0, len(answers)):
            q_a_thread = "{}Q: {} A: {}\n".format(
                q_a_thread,
                questions[i],
                answers[i]
            )
    
        prompt = "{}{}".format(
            info_prompt.format(q_a_thread=q_a_thread),
            questions_prompt
        )

        return self._call_llm(prompt)  # LLMを呼び出して応答を得る

    
    def guess_agent(self, questions: List[str], answers: List[str]) -> str:
        # 推測するための情報を設定します (答えは**で囲まれます)
        info_prompt = """あなたは「20の質問」ゲームをプレイしており、質問をしてキーワードを推測しようとしています。それは現実または架空の人物、場所、または物です。\nここまでに知っている情報:\n{q_a_thread}"""
        guess_prompt = """キーワードを推測してください。正確な単語/フレーズだけを返答します。例えば、キーワードが[パリ]だと思う場合は、[私はキーワードがパリだと思う]や[キーワードはパリですか？]ではなく、単語[パリ]だけで返答してください。"""

        # 質問と回答の履歴を構築します
        q_a_thread = ""
        for i in range(0, len(answers)):
            q_a_thread = "{}Q: {} A: {}\n".format(
                q_a_thread,
                questions[i],
                answers[i]
            )
        
        prompt = "{}{}".format(
            info_prompt.format(q_a_thread=q_a_thread),
            guess_prompt
        )

        return f"**{self._call_llm(prompt)}**"  # LLMを呼び出して応答を得る（答えは**で囲まれる）

    def _call_llm(self, prompt: str):
        self._set_model()  # モデルを設定
        sampler_kwargs = {
            'temperature': 0.01,  # サンプリング温度
            'top_p': 0.1,  # 上位確率
            'top_k': 1,  # 上位kの制限
        }
        
        return self.model.generate(
            prompt,
            device=self._device,  # デバイス指定（GPUまたはCPU）
            output_len=100,  # 出力の長さ
            **sampler_kwargs,
        )
         
    def _set_model(self):
        if self.model is None:
            print("モデルがまだ設定されていないため、設定中です。")
            model_config = get_config_for_7b()
            model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")  # トークナイザーのパス
            model_config.quant = True  # 量子化フラグ

            # コンテキストマネージャを使用して、スタックが吹き飛ばないようにします
            with self._set_default_tensor_type(model_config.get_dtype()):
                model = GemmaForCausalLM(model_config)
                ckpt_path = os.path.join(WEIGHTS_PATH, f'gemma-7b-it-quant.ckpt')  # 重みのパス
                model.load_weights(ckpt_path)  # 重みを読み込みます
                self.model = model.to(self._device).eval()  # モデルをデバイスに移動して評価モードにします
    
    @contextlib.contextmanager
    def _set_default_tensor_type(self, dtype: torch.dtype):
        """指定されたdtypeにデフォルトのtorch dtypeを設定します。"""
        torch.set_default_dtype(dtype)  # dtypeを設定
        yield
        torch.set_default_dtype(torch.float)  # デフォルトのdtypeをfloatに戻します

# エントリーポイントのため、名前とパラメータが事前に設定されています
def agent_fn(obs, cfg) -> str:
    obs_data = ObsData(
        turn_type=obs.turnType,
        questions=obs.questions,
        answers=obs.answers,
        keyword=obs.keyword,
        category=obs.category
    )
    
    # ターンの種類に応じて適切なエージェントを呼び出します
    if obs_data.turn_type == "ask":
        response = agents.ask_agent(questions=obs.questions, answers=obs.answers)
    if obs_data.turn_type == "guess":
        response = agents.guess_agent(questions=obs.questions, answers=obs.answers)
    if obs_data.turn_type == "answer":
        response = agents.answer_agent(question=obs.questions[-1], category=obs.category, keyword=obs.keyword)
    
    # 応答がなかったり、長さが1以下の場合は「はい」を返します
    if response is None or len(response) <= 1:
        return "yes"
    
    return response  # 得られた応答を返します

# エージェントが1度だけ設定されるように、Agentsクラスをインスタンス化します
agents = Agents()
```

</div>
</details>

In [None]:
# %%writefile submission/main.py

import os
import sys

# Kaggleのエージェントのパスを指定します
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
else:
    sys.path.insert(0, "/kaggle/working/submission/lib")

import contextlib
import os
import sys
from dataclasses import dataclass
from typing import Literal, List

import torch
from gemma.config import get_config_for_7b
from gemma.model import GemmaForCausalLM

# 重みファイルのパスを設定します
if os.path.exists(KAGGLE_AGENT_PATH):
    WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "gemma/pytorch/7b-it-quant/2")
else:
    WEIGHTS_PATH = "/kaggle/input/gemma/pytorch/7b-it-quant/2"


# オブジェクトの内容を把握するために独自のデータクラスを定義します
@dataclass
class ObsData:
    answers: List["str"]  # 回答のリスト
    category: str  # カテゴリ名
    keyword: str  # キーワード
    questions: List["str"]  # 質問のリスト
    turn_type: Literal["ask", "guess", "answer"]  # ターンの種類（質問、推測、回答のいずれか）
    

class Agents:
    def __init__(self):
        self.model = None
        
        # 7Bモデルはかなり大きいのでGPUセッションをリクエストするのが理想的です
        self._device = torch.device("cpu")  # デフォルトはCPU
        if torch.cuda.is_available():
            self._device = torch.device("cuda:0")  # GPUが利用可能なら使用します
    
    def answer_agent(self, question: str, category: str, keyword: str) -> Literal["yes", "no"]:
        # 質問者が推測しているキーワードについての情報を設定します
        info_prompt = """あなたは「20の質問」ゲームにおいて非常に正確な回答者です。質問者が推測しているキーワードは[カテゴリ: {category} キーワード: {keyword}]です。"""
        answer_question_prompt = f"""以下の質問に「はい」、「いいえ」、または「わからない場合はmaybe」だけで答えてください: {question}"""
    
        # プロンプトを組み立てます
        prompt = "{}{}".format(
            info_prompt.format(category=category, keyword=keyword),
            answer_question_prompt
        )
        
        return self._call_llm(prompt)  # LLMを呼び出して応答を得る

    def ask_agent(self, questions: List[str], answers: List[str]) -> str:
        # 質問を行いキーワードを推測するための情報を設定します
        info_prompt = """あなたは「20の質問」ゲームをプレイしており、質問をしてキーワードを推測しようとしています。それは現実または架空の人物、場所、または物です。\nここまでに知っている情報:\n{q_a_thread}"""
        questions_prompt = """1つの「はい」または「いいえ」で答えられる質問をして下さい。"""

        # 質問と回答の履歴を構築します
        q_a_thread = ""
        for i in range(0, len(answers)):
            q_a_thread = "{}Q: {} A: {}\n".format(
                q_a_thread,
                questions[i],
                answers[i]
            )
    
        prompt = "{}{}".format(
            info_prompt.format(q_a_thread=q_a_thread),
            questions_prompt
        )

        return self._call_llm(prompt)  # LLMを呼び出して応答を得る

    
    def guess_agent(self, questions: List[str], answers: List[str]) -> str:
        # 推測するための情報を設定します (答えは**で囲まれます)
        info_prompt = """あなたは「20の質問」ゲームをプレイしており、質問をしてキーワードを推測しようとしています。それは現実または架空の人物、場所、または物です。\nここまでに知っている情報:\n{q_a_thread}"""
        guess_prompt = """キーワードを推測してください。正確な単語/フレーズだけを返答します。例えば、キーワードが[パリ]だと思う場合は、[私はキーワードがパリだと思う]や[キーワードはパリですか？]ではなく、単語[パリ]だけで返答してください。"""

        # 質問と回答の履歴を構築します
        q_a_thread = ""
        for i in range(0, len(answers)):
            q_a_thread = "{}Q: {} A: {}\n".format(
                q_a_thread,
                questions[i],
                answers[i]
            )
        
        prompt = "{}{}".format(
            info_prompt.format(q_a_thread=q_a_thread),
            guess_prompt
        )

        return f"**{self._call_llm(prompt)}**"  # LLMを呼び出して応答を得る（答えは**で囲まれる）

    def _call_llm(self, prompt: str):
        self._set_model()  # モデルを設定
        sampler_kwargs = {
            'temperature': 0.01,  # サンプリング温度
            'top_p': 0.1,  # 上位確率
            'top_k': 1,  # 上位kの制限
        }
        
        return self.model.generate(
            prompt,
            device=self._device,  # デバイス指定（GPUまたはCPU）
            output_len=100,  # 出力の長さ
            **sampler_kwargs,
        )
         
    def _set_model(self):
        if self.model is None:
            print("モデルがまだ設定されていないため、設定中です。")
            model_config = get_config_for_7b()
            model_config.tokenizer = os.path.join(WEIGHTS_PATH, "tokenizer.model")  # トークナイザーのパス
            model_config.quant = True  # 量子化フラグ

            # コンテキストマネージャを使用して、スタックが吹き飛ばないようにします
            with self._set_default_tensor_type(model_config.get_dtype()):
                model = GemmaForCausalLM(model_config)
                ckpt_path = os.path.join(WEIGHTS_PATH, f'gemma-7b-it-quant.ckpt')  # 重みのパス
                model.load_weights(ckpt_path)  # 重みを読み込みます
                self.model = model.to(self._device).eval()  # モデルをデバイスに移動して評価モードにします
    
    @contextlib.contextmanager
    def _set_default_tensor_type(self, dtype: torch.dtype):
        """指定されたdtypeにデフォルトのtorch dtypeを設定します。"""
        torch.set_default_dtype(dtype)  # dtypeを設定
        yield
        torch.set_default_dtype(torch.float)  # デフォルトのdtypeをfloatに戻します

# エントリーポイントのため、名前とパラメータが事前に設定されています
def agent_fn(obs, cfg) -> str:
    obs_data = ObsData(
        turn_type=obs.turnType,
        questions=obs.questions,
        answers=obs.answers,
        keyword=obs.keyword,
        category=obs.category
    )
    
    # ターンの種類に応じて適切なエージェントを呼び出します
    if obs_data.turn_type == "ask":
        response = agents.ask_agent(questions=obs.questions, answers=obs.answers)
    if obs_data.turn_type == "guess":
        response = agents.guess_agent(questions=obs.questions, answers=obs.answers)
    if obs_data.turn_type == "answer":
        response = agents.answer_agent(question=obs.questions[-1], category=obs.category, keyword=obs.keyword)
    
    # 応答がなかったり、長さが1以下の場合は「はい」を返します
    if response is None or len(response) <= 1:
        return "yes"
    
    return response  # 得られた応答を返します

# エージェントが1度だけ設定されるように、Agentsクラスをインスタンス化します
agents = Agents()

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# Manually run the answer agent
@dataclass
class ObsDataIn(ObsData):
    turnType: str
    
obs_data = ObsDataIn(
        turn_type="",
        turnType="answer",
        questions=["Is it a place"],
        answers=[],
        keyword="Antartica",
        category="Place"
    )

print(agent_fn(obs_data, {}))
```

</div>
<div class="column-right">

# 日本語訳

```python
# 回答エージェントを手動で実行します
@dataclass
class ObsDataIn(ObsData):
    turnType: str  # ターンの種類を追加します
    
# エージェントの入力データを構築します
obs_data = ObsDataIn(
        turn_type="",
        turnType="answer",
        questions=["はそれは場所ですか"],
        answers=[],  # 回答はまだありません
        keyword="南極",  # キーワード
        category="場所"  # カテゴリ
    )

print(agent_fn(obs_data, {}))  # エージェント関数を呼び出します
```

</div>
</details>

In [None]:
# 回答エージェントを手動で実行します
@dataclass
class ObsDataIn(ObsData):
    turnType: str  # ターンの種類を追加します
    
# エージェントの入力データを構築します
obs_data = ObsDataIn(
        turn_type="",
        turnType="answer",
        questions=["はそれは場所ですか"],
        answers=[],  # 回答はまだありません
        keyword="南極",  # キーワード
        category="場所"  # カテゴリ
    )

print(agent_fn(obs_data, {}))  # エージェント関数を呼び出します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# Manually run the question agent
@dataclass
class ObsDataIn(ObsData):
    turnType: str
    
obs_data = ObsDataIn(
        turn_type="",
        turnType="ask",
        questions=["Is it a place?"],
        answers=["Yes"],
        keyword="",
        category=""
    )

print(agent_fn(obs_data, {}))
```

</div>
<div class="column-right">

# 日本語訳

```python
# 質問エージェントを手動で実行します
@dataclass
class ObsDataIn(ObsData):
    turnType: str  # ターンの種類を追加します
    
# エージェントの入力データを構築します
obs_data = ObsDataIn(
        turn_type="",
        turnType="ask",
        questions=["それは場所ですか？"],  # 質問
        answers=["はい"],  # 回答
        keyword="",  # キーワードはまだ不明
        category=""  # カテゴリはまだ不明
    )

print(agent_fn(obs_data, {}))  # エージェント関数を呼び出します
```

</div>
</details>

In [None]:
# 質問エージェントを手動で実行します
@dataclass
class ObsDataIn(ObsData):
    turnType: str  # ターンの種類を追加します
    
# エージェントの入力データを構築します
obs_data = ObsDataIn(
        turn_type="",
        turnType="ask",
        questions=["それは場所ですか？"],  # 質問
        answers=["はい"],  # 回答
        keyword="",  # キーワードはまだ不明
        category=""  # カテゴリはまだ不明
    )

print(agent_fn(obs_data, {}))  # エージェント関数を呼び出します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# Manually run the guess agent
@dataclass
class ObsDataIn(ObsData):
    turnType: str
    
obs_data = ObsDataIn(
        turn_type="",
        turnType="guess",
        questions=["Is it a place?", "Is it in the northen hemisphere?", "Is it a city?", "Is it icy?"],
        answers=["Yes", "No", "No", "Yes"],
        keyword="",
        category=""
    )

print(agent_fn(obs_data, {}))
```

</div>
<div class="column-right">

# 日本語訳

```python
# 推測エージェントを手動で実行します
@dataclass
class ObsDataIn(ObsData):
    turnType: str  # ターンの種類を追加します
    
# エージェントの入力データを構築します
obs_data = ObsDataIn(
        turn_type="",
        turnType="guess",
        questions=["それは場所ですか？", "北半球ですか？", "都市ですか？", "氷だらけですか？"],  # 質問リスト
        answers=["はい", "いいえ", "いいえ", "はい"],  # 質問に対する回答
        keyword="",  # キーワードはまだ不明
        category=""  # カテゴリはまだ不明
    )

print(agent_fn(obs_data, {}))  # エージェント関数を呼び出します
```

</div>
</details>

In [None]:
# 推測エージェントを手動で実行します
@dataclass
class ObsDataIn(ObsData):
    turnType: str  # ターンの種類を追加します
    
# エージェントの入力データを構築します
obs_data = ObsDataIn(
        turn_type="",
        turnType="guess",
        questions=["それは場所ですか？", "北半球ですか？", "都市ですか？", "氷だらけですか？"],  # 質問リスト
        answers=["はい", "いいえ", "いいえ", "はい"],  # 質問に対する回答
        keyword="",  # キーワードはまだ不明
        category=""  # カテゴリはまだ不明
    )

print(agent_fn(obs_data, {}))  # エージェント関数を呼び出します