# 要約 
このJupyter Notebookは「LLM 20 Questions」コンペティションのためのベースラインモデルを実装しており、特に言語モデルを利用して「20の質問」ゲームのAIエージェントを構築することを目的としています。

### 問題設定
Notebookは、さまざまなLLM（大規模言語モデル）を利用し、限られた質問の中でターゲットとなる単語を推測するAIエージェントの作成に取り組んでいます。このエージェントは、質問を行い、回答を受け取り、推測を行うという一連の操作を通じて、効率的に情報を収集して正しい単語を導き出すことを目指します。

### 使用される手法とライブラリ
1. **トークン化とモデルの設定**:
   - `tokenizer.apply_chat_template`を使用して、モデルやプロンプトに特別なトークンを自動的に適用し、質問の生成をより効果的に行います。
   - サポートしているモデルは、`LLAMA3`, `Phi-3`, `Qwen-2`の各バリエーションです。

2. **ライブラリの利用**:
   - `transformers`: Hugging Faceのライブラリを使用して、モデルのダウンロードやトークナイザーの設定を行います。
   - `bitsandbytes`: メモリ使用の最適化に使用されるライブラリで、モデルを量子化する際に役立ちます。
   - `pygame`: ゲームのシミュレーションに使用され、エージェントの動作を可視化するために利用されます。
   - `kaggle_environments`: Kaggleの環境でエージェントの対戦を実行するために用います。

3. **エージェントの構造**:
   - エージェントは、質問を行う「質問者」、単語を推測する「推測者」、質問に「はい/いいえ」で応える「回答者」の3つの役割を持ち、各役割に応じたプロンプトを生成し、最適な応答を導くように設計されています。

4. **モデルの量子化**:
   - ダウンロードしたモデルをメモリに読み込み、4ビットの量子化を行うことで、ストレージの効率を向上させています。

### 構成の概要
Notebookの中では、まず必要なライブラリをインストールし、Hugging Faceからモデルをダウンロードして設定します。そして、エージェントの動作を定義するためのプロンプトを作成し、すべてのエージェントがゲーム内で適切に動作するような構造を持たせています。最後に、エージェントの提出用に必要なファイルを圧縮し、提出準備を整えます。

このNotebookは、効率的な言語モデルを利用して「20の質問」ゲームに参加するための基盤を提供し、AIエージェントの開発における重要なステップを示しています。

---


# 用語概説 
以下は、Jupyter Notebookの内容に基づいて、機械学習・深層学習の初心者がつまずきやすい専門用語の簡単な解説です。

1. **Tokenizer (トークナイザー)**
   - テキストをモデルが理解可能な形（トークン）に変換する処理を行うツール。通常、文を単語やサブワードに分割し、それぞれにIDを割り当てます。

2. **LLM (Large Language Model)**
   - 大規模なデータセットで学習した自然言語処理モデル。多くのパラメータを持ち、文脈を理解し、自然なテキストを生成する能力があります。

3. **HuggingFace Model Hub**
   - 様々な事前学習されたモデルが提供されるプラットフォーム。モデルを簡単にダウンロードや利用できるAPIが用意されています。

4. **量子化 (Quantization)**
   - モデルのサイズを縮小し、計算効率を高めるために、パラメータのビット数を減らすプロセス。例えば、32ビット浮動小数点から8ビット整数に変換することが含まれます。

5. **bitsandbytes**
   - メモリ効率よく数量化されたモデルを扱うためのPythonライブラリ。低精度の計算を行いながら、GPUリソースを節約することができます。

6. **SDP (Stochastic Dynamic Programming)**
   - 最適化や強化学習に関連する手法。モデルが以前の状態と行動の情報を学習し、次の状態の選択を行う際に役立ちます。

7. **プロンプト (Prompt)**
   - モデルに対して与える指示や質問のこと。生成するテキストの文脈や条件を設定するために使用されます。

8. **トークン (Token)**
   - モデルに入力される最小単位の要素。単語や文字列の一部などを含む。モデルはこれを元に次のトークンを生成します。

9. **デバイスマップ (Device Map)**
   - モデルの各部分をどのデバイス（CPUやGPU）で実行するか管理するための設定。

10. **ガーベジコレクション (Garbage Collection)**
    - 使用しなくなったメモリを自動的に解放するプロセス。特にPythonでは、メモリリークを防ぐために重要です。

11. **モデル識別子 (Model Identifier)**
    - Hugging Face Model Hubにおける特定のモデルを一意に示す名前。通常はリポジトリ名で表現される。

12. **ターン終了トークン (Turn Terminators)**
    - モデルが応答を終了する際に使用する特定のトークン。会話のコンテキストを保持するのに役立つ。

13. **メモリ効率 (Memory Efficiency)**
    - プログラムやモデルが使用するメモリを最適化し、限られたリソースで最大のパフォーマンスを引き出すこと。

これらの解説が、初心者が特定の用語に対する理解を深めるための助けになることを目的としています。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# LLM 20 Questions Baseline

You can change models and prompts conveniently since I used `tokenizer.apply_chat_template` to apply special tokens automatically. 


Supported models:
- `LLAMA3 variants`
- `Phi-3 variants`
- `Qwen-2 variants`

## Prerequisites
Set accelerator to GPU T4

</div>
<div class="column-right">

# 日本語訳

# LLM 20 Questions ベースライン

`tokenizer.apply_chat_template`を使用して特別なトークンを自動的に適用したので、モデルやプロンプトを便利に変更できます。 


サポートされているモデル:
- `LLAMA3 バリエーション`
- `Phi-3 バリエーション`
- `Qwen-2 バリエーション`

## 前提条件
GPU T4をアクセラレータに設定してください。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%bash
mkdir -p /kaggle/working/submission
mkdir -p /tmp/model
pip install -q bitsandbytes accelerate
pip install -qU transformers
```

</div>
<div class="column-right">

# 日本語訳

```python
%%bash
mkdir -p /kaggle/working/submission
mkdir -p /tmp/model
pip install -q bitsandbytes accelerate
pip install -qU transformers
```

</div>
</details>

In [None]:
%%bash
mkdir -p /kaggle/working/submission
mkdir -p /tmp/model
pip install -q bitsandbytes accelerate
pip install -qU transformers

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Download model

### HuggingFace Login


1. Issue HuggingFace access token (https://huggingface.co/settings/tokens)


2. Add HuggingFace access token to secrets. You can find it in `Add-ons -> secrets`




![Screenshot 2024-08-01 at 11.40.17 AM.png](attachment:fb5805e5-566e-41f1-ba50-0d9f9fade571.png)

</div>
<div class="column-right">

# 日本語訳

## モデルのダウンロード

### HuggingFace ログイン


1. HuggingFace アクセストークンを発行します (https://huggingface.co/settings/tokens)


2. HuggingFace アクセストークンをシークレットに追加します。これは `Add-ons -> secrets` で見つけることができます。




![Screenshot 2024-08-01 at 11.40.17 AM.png](attachment:fb5805e5-566e-41f1-ba50-0d9f9fade571.png)


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from kaggle_secrets import UserSecretsClient
secrets = UserSecretsClient()

HF_TOKEN: str | None  = None

try:
    HF_TOKEN = secrets.get_secret("HF_TOKEN")
except:
    pass
```

</div>
<div class="column-right">

# 日本語訳

```python
from kaggle_secrets import UserSecretsClient
secrets = UserSecretsClient()

HF_TOKEN: str | None  = None

try:
    HF_TOKEN = secrets.get_secret("HF_TOKEN")
except:
    pass
```

</div>
</details>

In [None]:
from kaggle_secrets import UserSecretsClient
secrets = UserSecretsClient()

HF_TOKEN: str | None  = None

try:
    HF_TOKEN = secrets.get_secret("HF_TOKEN")
except:
    pass

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

### Select Model

Find your desired model from [HuggingFace Model Hub](https://huggingface.co/models) and use the model name in the next command.

Supported models:
- `LLAMA3 variants`
- `Phi-3 variants`
- `Qwen-2 variants`

</div>
<div class="column-right">

# 日本語訳

### モデルを選択

[HuggingFace Model Hub](https://huggingface.co/models)から希望のモデルを見つけて、次のコマンドでモデル名を使用してください。

サポートされているモデル:
- `LLAMA3 バリエーション`
- `Phi-3 バリエーション`
- `Qwen-2 バリエーション`


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
repo_id = "meta-llama/Meta-Llama-3-8B-Instruct"
```

</div>
<div class="column-right">

# 日本語訳

```python
repo_id = "meta-llama/Meta-Llama-3-8B-Instruct"
```

</div>
</details>

In [None]:
repo_id = "meta-llama/Meta-Llama-3-8B-Instruct"

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

### Download Model via HuggingFace
To reduce disk usage, download model in `/tmp/model`

</div>
<div class="column-right">

# 日本語訳

### HuggingFace経由でモデルをダウンロード
ディスク使用量を削減するために、モデルを `/tmp/model` にダウンロードします。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from huggingface_hub import snapshot_download
from pathlib import Path
import shutil

g_model_path = Path("/tmp/model")
if g_model_path.exists():
    shutil.rmtree(g_model_path)
g_model_path.mkdir(parents=True)

snapshot_download(
    repo_id=repo_id,
    ignore_patterns="original*",
    local_dir=g_model_path,
    token=globals().get("HF_TOKEN", None)
)
```

</div>
<div class="column-right">

# 日本語訳

```python
from huggingface_hub import snapshot_download
from pathlib import Path
import shutil

g_model_path = Path("/tmp/model")
if g_model_path.exists():
    shutil.rmtree(g_model_path)  # 既存のモデルパスがあれば削除
g_model_path.mkdir(parents=True)  # 新しいモデルパスを作成

snapshot_download(
    repo_id=repo_id,  # モデル識別子
    ignore_patterns="original*",  # 指定したパターンを無視
    local_dir=g_model_path,  # ダウンロード先のディレクトリ
    token=globals().get("HF_TOKEN", None)  # HF_TOKENを取得
)
```

</div>
</details>

In [None]:
from huggingface_hub import snapshot_download
from pathlib import Path
import shutil

g_model_path = Path("/tmp/model")
if g_model_path.exists():
    shutil.rmtree(g_model_path)  # 既存のモデルパスがあれば削除
g_model_path.mkdir(parents=True)  # 新しいモデルパスを作成

snapshot_download(
    repo_id=repo_id,  # モデル識別子
    ignore_patterns="original*",  # 指定したパターンを無視
    local_dir=g_model_path,  # ダウンロード先のディレクトリ
    token=globals().get("HF_TOKEN", None)  # HF_TOKENを取得
)

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!ls -l /tmp/model
```

</div>
<div class="column-right">

# 日本語訳

```python
!ls -l /tmp/model
```

</div>
</details>

In [None]:
!ls -l /tmp/model

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

### Save quantized model
Now, load downloaded model on memory with quantization.  
This will save storage.


Moreover, since the saved model has already been quantized, we do not need `bitsandbytes` package in `main.py`

</div>
<div class="column-right">

# 日本語訳

### 量子化されたモデルの保存
ダウンロードしたモデルをメモリに読み込み、量子化を行います。  
これにより、ストレージが節約されます。

さらに、保存されたモデルはすでに量子化されているため、`main.py`では `bitsandbytes` パッケージは必要ありません。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# load model on memory
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)
torch.backends.cuda.enable_flash_sdp(False)

downloaded_model = "/tmp/model"

bnb_config = BitsAndBytesConfig(
    load_in_4bit = True,
    bnb_4bit_compute_dtype=torch.float16,
)

model = AutoModelForCausalLM.from_pretrained(
    downloaded_model,
    quantization_config = bnb_config,
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)

tokenizer = AutoTokenizer.from_pretrained(downloaded_model)
```

</div>
<div class="column-right">

# 日本語訳

```python
# メモリにモデルを読み込む
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)  # メモリ効率の良いSDPを無効化
torch.backends.cuda.enable_flash_sdp(False)  # フラッシュSDPを無効化

downloaded_model = "/tmp/model"  # ダウンロードしたモデルのパス

# 量子化の設定
bnb_config = BitsAndBytesConfig(
    load_in_4bit = True,  # 4ビットで読み込む
    bnb_4bit_compute_dtype=torch.float16,  # 計算データ型をfloat16に指定
)

# 事前学習モデルの読み込み
model = AutoModelForCausalLM.from_pretrained(
    downloaded_model,  # 読み込むモデルのパス
    quantization_config = bnb_config,  # 量子化の設定
    torch_dtype = torch.float16,  # データ型をfloat16に設定
    device_map = "auto",  # デバイス自動設定
    trust_remote_code = True,  # リモートコードを信頼する
)

# トークナイザーの読み込み
tokenizer = AutoTokenizer.from_pretrained(downloaded_model)
```

</div>
</details>

In [None]:
# メモリにモデルを読み込む
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

torch.backends.cuda.enable_mem_efficient_sdp(False)  # メモリ効率の良いSDPを無効化
torch.backends.cuda.enable_flash_sdp(False)  # フラッシュSDPを無効化

downloaded_model = "/tmp/model"  # ダウンロードしたモデルのパス

# 量子化の設定
bnb_config = BitsAndBytesConfig(
    load_in_4bit = True,  # 4ビットで読み込む
    bnb_4bit_compute_dtype=torch.float16,  # 計算データ型をfloat16に指定
)

# 事前学習モデルの読み込み
model = AutoModelForCausalLM.from_pretrained(
    downloaded_model,  # 読み込むモデルのパス
    quantization_config = bnb_config,  # 量子化の設定
    torch_dtype = torch.float16,  # データ型をfloat16に設定
    device_map = "auto",  # デバイス自動設定
    trust_remote_code = True,  # リモートコードを信頼する
)

# トークナイザーの読み込み
tokenizer = AutoTokenizer.from_pretrained(downloaded_model)

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# save model in submission directory
model.save_pretrained("/kaggle/working/submission/model")
tokenizer.save_pretrained("/kaggle/working/submission/model")
```

</div>
<div class="column-right">

# 日本語訳

```python
# モデルを提出用ディレクトリに保存
model.save_pretrained("/kaggle/working/submission/model")  # モデル保存
tokenizer.save_pretrained("/kaggle/working/submission/model")  # トークナイザー保存
```

</div>
</details>

In [None]:
# モデルを提出用ディレクトリに保存
model.save_pretrained("/kaggle/working/submission/model")  # モデル保存
tokenizer.save_pretrained("/kaggle/working/submission/model")  # トークナイザー保存

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# unload model from memory
import gc, torch
del model, tokenizer
gc.collect()
torch.cuda.empty_cache()
```

</div>
<div class="column-right">

# 日本語訳

```python
# メモリからモデルをアンロード
import gc, torch
del model, tokenizer  # モデルとトークナイザーを削除
gc.collect()  # ガーベジコレクションを実行
torch.cuda.empty_cache()  # CUDAメモリを空にする
```

</div>
</details>

In [None]:
# メモリからモデルをアンロード
import gc, torch
del model, tokenizer  # モデルとトークナイザーを削除
gc.collect()  # ガーベジコレクションを実行
torch.cuda.empty_cache()  # CUDAメモリを空にする

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Agent

### Prompts

Prompts are reffered from the [Anthropic Prompt Library](https://docs.anthropic.com/en/prompt-library/library)

Prompts are consisted of 2 parts:
- `system_prompt`: This is the first question to determine category.
- `chat_history`: This is the chat history to provide context for the model.

</div>
<div class="column-right">

# 日本語訳

## エージェント

### プロンプト

プロンプトは[Anthropic Prompt Library](https://docs.anthropic.com/en/prompt-library/library)から参照されています。

プロンプトは2つの部分で構成されています:
- `system_prompt`: これはカテゴリを特定する最初の質問です。
- `chat_history`: これはモデルにコンテキストを提供するチャット履歴です。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile submission/prompts.py

def asker_prompt(obs):
    message = []
    
    # System prompt
    ask_prompt = f"""You are a helpful AI assistant with expertise in playing 20 questions game.
Your task is to ask questions to the user to guess the word the user is thinking of.
Narrow down the possibilities by asking yes/no questions.
Think step by step and try to ask the most informative questions.
\n"""

    message.append({"role": "system", "content": ask_prompt})

    # Chat history
    for q, a in zip(obs.questions, obs.answers):
        message.append({"role": "assistant", "content": q})
        message.append({"role": "user", "content": a})

    return message


def guesser_prompt(obs):
    message = []
    
    # System prompt
    guess_prompt = f"""You are a helpful AI assistant with expertise in playing 20 questions game.
Your task is to guess the word the user is thinking of.
Think step by step.
\n"""

    # Chat history
    chat_history = ""
    for q, a in zip(obs.questions, obs.answers):
        chat_history += f"""Question: {q}\nAnswer: {a}\n"""
    prompt = (
            guess_prompt + f"""so far, the current state of the game is as following:\n{chat_history}
        based on the conversation, can you guess the word, please give only the word, no verbosity around"""
    )
    
    
    message.append({"role": "system", "content": prompt})
    
    return message


def answerer_prompt(obs):
    message = []
    
    # System prompt
    prompt = f"""You are a helpful AI assistant with expertise in playing 20 questions game.
Your task is to answer the questions of the user to help him guess the word you're thinking of.
Your answers must be 'yes' or 'no'.
The keyword is: "{obs.keyword}", it is of category: "{obs.category}"
Provide accurate answers to help the user to guess the keyword.
"""

    message.append({"role": "system", "content": prompt})
    
    # Chat history
    message.append({"role": "user", "content": obs.questions[0]})
    
    if len(obs.answers)>=1:
        for q, a in zip(obs.questions[1:], obs.answers):
            message.append({"role": "assistant", "content": a})
            message.append({"role": "user", "content": q})
    
    return message


```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile submission/prompts.py

def asker_prompt(obs):
    message = []
    
    # システムプロンプト
    ask_prompt = f"""あなたは「20の質問」ゲームをプレイする専門知識を持ったAIアシスタントです。
あなたの役割は、ユーザーに質問をして、ユーザーが考えている単語を当てることです。
「はい」または「いいえ」で答えられる質問をして可能性を絞り込みます。
段階的に考え、最も情報量の多い質問をするようにしてください。
\n"""

    message.append({"role": "system", "content": ask_prompt})

    # チャット履歴
    for q, a in zip(obs.questions, obs.answers):
        message.append({"role": "assistant", "content": q})
        message.append({"role": "user", "content": a})

    return message


def guesser_prompt(obs):
    message = []
    
    # システムプロンプト
    guess_prompt = f"""あなたは「20の質問」ゲームをプレイする専門知識を持ったAIアシスタントです。
あなたの役割は、ユーザーが考えている単語を当てることです。
段階的に考えてください。
\n"""

    # チャット履歴
    chat_history = ""
    for q, a in zip(obs.questions, obs.answers):
        chat_history += f"""質問: {q}\n回答: {a}\n"""
    prompt = (
            guess_prompt + f"""現在のゲームの状況は以下の通りです:\n{chat_history}
        会話に基づいて、この単語を推測できますか？答えは単語のみで、詳細は不要です"""
    )
    
    
    message.append({"role": "system", "content": prompt})
    
    return message


def answerer_prompt(obs):
    message = []
    
    # システムプロンプト
    prompt = f"""あなたは「20の質問」ゲームをプレイする専門知識を持ったAIアシスタントです。
あなたの役割は、ユーザーが推測している単語を当てるのを手助けするために質問に答えることです。
あなたの回答は「はい」または「いいえ」でなければなりません。
キーワードは: "{obs.keyword}"、カテゴリは: "{obs.category}"です。
ユーザーがキーワードを推測できるように正確な回答を提供してください。
"""

    message.append({"role": "system", "content": prompt})
    
    # チャット履歴
    message.append({"role": "user", "content": obs.questions[0]})
    
    if len(obs.answers)>=1:
        for q, a in zip(obs.questions[1:], obs.answers):
            message.append({"role": "assistant", "content": a})
            message.append({"role": "user", "content": q})
    
    return message
```

</div>
</details>

In [None]:
%%writefile submission/prompts.py

def asker_prompt(obs):
    message = []
    
    # システムプロンプト
    ask_prompt = f"""あなたは「20の質問」ゲームをプレイする専門知識を持ったAIアシスタントです。
あなたの役割は、ユーザーに質問をして、ユーザーが考えている単語を当てることです。
「はい」または「いいえ」で答えられる質問をして可能性を絞り込みます。
段階的に考え、最も情報量の多い質問をするようにしてください。
\n"""

    message.append({"role": "system", "content": ask_prompt})

    # チャット履歴
    for q, a in zip(obs.questions, obs.answers):
        message.append({"role": "assistant", "content": q})
        message.append({"role": "user", "content": a})

    return message


def guesser_prompt(obs):
    message = []
    
    # システムプロンプト
    guess_prompt = f"""あなたは「20の質問」ゲームをプレイする専門知識を持ったAIアシスタントです。
あなたの役割は、ユーザーが考えている単語を当てることです。
段階的に考えてください。
\n"""

    # チャット履歴
    chat_history = ""
    for q, a in zip(obs.questions, obs.answers):
        chat_history += f"""質問: {q}\n回答: {a}\n"""
    prompt = (
            guess_prompt + f"""現在のゲームの状況は以下の通りです:\n{chat_history}
        会話に基づいて、この単語を推測できますか？答えは単語のみで、詳細は不要です"""
    )
    
    
    message.append({"role": "system", "content": prompt})
    
    return message


def answerer_prompt(obs):
    message = []
    
    # システムプロンプト
    prompt = f"""あなたは「20の質問」ゲームをプレイする専門知識を持ったAIアシスタントです。
あなたの役割は、ユーザーが推測している単語を当てるのを手助けするために質問に答えることです。
あなたの回答は「はい」または「いいえ」でなければなりません。
キーワードは: "{obs.keyword}"、カテゴリは: "{obs.category}"です。
ユーザーがキーワードを推測できるように正確な回答を提供してください。
"""

    message.append({"role": "system", "content": prompt})
    
    # チャット履歴
    message.append({"role": "user", "content": obs.questions[0]})
    
    if len(obs.answers)>=1:
        for q, a in zip(obs.questions[1:], obs.answers):
            message.append({"role": "assistant", "content": a})
            message.append({"role": "user", "content": q})
    
    return message

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

### Agent

To add more LLM models, add end-of-turn token to terminators list.

</div>
<div class="column-right">

# 日本語訳

### エージェント

複数のLLMモデルを追加するには、ターン終了トークンを終了トークンリストに追加します。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile submission/main.py

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import os

from prompts import *

torch.backends.cuda.enable_mem_efficient_sdp(False)
torch.backends.cuda.enable_flash_sdp(False)


KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    MODEL_PATH = os.path.join(KAGGLE_AGENT_PATH, "model")
else:
    MODEL_PATH = "/kaggle/working/submission/model"


model = AutoModelForCausalLM.from_pretrained(
    MODEL_PATH,
    device_map="auto",
    trust_remote_code=True,
)
tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)

# specify end-of-turn tokens for your desired model
terminators = [tokenizer.eos_token_id]

# Additional potential end-of-turn token
# llama3, phi3, gwen2 by order
potential_terminators = ["<|eot_id|>", "<|end|>", "<end_of_turn>"]

for token in potential_terminators:
    token_id = tokenizer.convert_tokens_to_ids(token)
    if token_id is not None:
        terminators.append(token_id)

def generate_response(chat):
    inputs = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_tensors="pt").to(model.device)
    outputs = model.generate(inputs, max_new_tokens=32, pad_token_id=tokenizer.eos_token_id, eos_token_id=terminators)
    response = outputs[0][inputs.shape[-1]:]
    out = tokenizer.decode(response, skip_special_tokens=True)

    return out


class Robot:
    def __init__(self):
        pass

    def on(self, mode, obs):
        assert mode in [
            "asking", "guessing", "answering",
        ], "mode can only take one of these values: asking, answering, guessing"
        if mode == "asking":
            # launch the asker role
            output = self.asker(obs)
        if mode == "answering":
            # launch the answerer role
            output = self.answerer(obs)
            if "yes" in output.lower():
                output = "yes"
            elif "no" in output.lower():
                output = "no"
            if "yes" not in output.lower() and "no" not in output.lower():
                output = "yes"
        if mode == "guessing":
            # launch the guesser role
            output = self.guesser(obs)
        return output

    def asker(self, obs):
        
        input = asker_prompt(obs)
        output = generate_response(input)
        
        return output

    def guesser(self, obs):
        input = guesser_prompt(obs)
        output = generate_response(input)
        
        return output

    def answerer(self, obs):
        input = answerer_prompt(obs)
        output = generate_response(input)

        return output


robot = Robot()


def agent(obs, cfg):

    if obs.turnType == "ask":
        response = robot.on(mode="asking", obs=obs)

    elif obs.turnType == "guess":
        response = robot.on(mode="guessing", obs=obs)

    elif obs.turnType == "answer":
        response = robot.on(mode="answering", obs=obs)

    if response == None or len(response) <= 1:
        response = "yes"

    return response

```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile submission/main.py

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import os

from prompts import *

torch.backends.cuda.enable_mem_efficient_sdp(False)  # メモリ効率の良いSDPを無効化
torch.backends.cuda.enable_flash_sdp(False)  # フラッシュSDPを無効化


KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    MODEL_PATH = os.path.join(KAGGLE_AGENT_PATH, "model")  # エージェントパスが存在する場合
else:
    MODEL_PATH = "/kaggle/working/submission/model"  # モデル保存パスを指定


# モデルの読み込み
model = AutoModelForCausalLM.from_pretrained(
    MODEL_PATH,  # モデルのパスを指定
    device_map="auto",  # デバイス自動設定
    trust_remote_code=True,  # リモートコードを信頼する
)
tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)  # トークナイザーの読み込み

# お望みのモデルに応じたターン終了トークンを指定
terminators = [tokenizer.eos_token_id]  # デフォルトの終了トークン

# 追加のターン終了トークンの候補
# llama3, phi3, gwen2順
potential_terminators = ["<|eot_id|>", "<|end|>", "<end_of_turn>"]

# 候補トークンをターン終了トークンに追加
for token in potential_terminators:
    token_id = tokenizer.convert_tokens_to_ids(token)
    if token_id is not None:
        terminators.append(token_id)

def generate_response(chat):
    # チャットをトークン化し、処理する
    inputs = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_tensors="pt").to(model.device)
    # モデルを介して新しいトークンを生成
    outputs = model.generate(inputs, max_new_tokens=32, pad_token_id=tokenizer.eos_token_id, eos_token_id=terminators)
    response = outputs[0][inputs.shape[-1]:]  # 生成されたレスポンスを取得
    out = tokenizer.decode(response, skip_special_tokens=True)  # デコードしてレスポンスを取得

    return out  # レスポンスを返す


class Robot:
    def __init__(self):
        pass

    def on(self, mode, obs):
        assert mode in [
            "asking", "guessing", "answering",
        ], "modeはこれらの値のいずれかのみ取ることができます: asking, answering, guessing"
        if mode == "asking":
            # 質問する役割を起動する
            output = self.asker(obs)
        if mode == "answering":
            # 答える役割を起動する
            output = self.answerer(obs)
            if "yes" in output.lower():  # 答えが「はい」の場合
                output = "yes"  # 「はい」と設定
            elif "no" in output.lower():  # 答えが「いいえ」の場合
                output = "no"  # 「いいえ」と設定
            if "yes" not in output.lower() and "no" not in output.lower():  # どちらでもない場合
                output = "yes"  # デフォルトで「はい」に設定
        if mode == "guessing":
            # 推測する役割を起動する
            output = self.guesser(obs)
        return output

    def asker(self, obs):
        
        input = asker_prompt(obs)  # 質問プロンプトの生成
        output = generate_response(input)  # レスポンス生成
        
        return output

    def guesser(self, obs):
        input = guesser_prompt(obs)  # 推測プロンプトの生成
        output = generate_response(input)  # レスポンス生成
        
        return output

    def answerer(self, obs):
        input = answerer_prompt(obs)  # 答えプロンプトの生成
        output = generate_response(input)  # レスポンス生成

        return output


robot = Robot()  # Robotインスタンスの生成


def agent(obs, cfg):
    # エージェントの動作を制御する関数
    if obs.turnType == "ask":
        response = robot.on(mode="asking", obs=obs)  # 質問する場合

    elif obs.turnType == "guess":
        response = robot.on(mode="guessing", obs=obs)  # 推測する場合

    elif obs.turnType == "answer":
        response = robot.on(mode="answering", obs=obs)  # 答える場合

    if response == None or len(response) <= 1:  # レスポンスがない場合
        response = "yes"  # デフォルトで「はい」を返す

    return response  # レスポンスを返す
```

</div>
</details>

In [None]:
%%writefile submission/main.py

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import os

from prompts import *

torch.backends.cuda.enable_mem_efficient_sdp(False)  # メモリ効率の良いSDPを無効化
torch.backends.cuda.enable_flash_sdp(False)  # フラッシュSDPを無効化


KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    MODEL_PATH = os.path.join(KAGGLE_AGENT_PATH, "model")  # エージェントパスが存在する場合
else:
    MODEL_PATH = "/kaggle/working/submission/model"  # モデル保存パスを指定


# モデルの読み込み
model = AutoModelForCausalLM.from_pretrained(
    MODEL_PATH,  # モデルのパスを指定
    device_map="auto",  # デバイス自動設定
    trust_remote_code=True,  # リモートコードを信頼する
)
tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)  # トークナイザーの読み込み

# お望みのモデルに応じたターン終了トークンを指定
terminators = [tokenizer.eos_token_id]  # デフォルトの終了トークン

# 追加のターン終了トークンの候補
# llama3, phi3, gwen2順
potential_terminators = ["<|eot_id|>", "<|end|>", "<end_of_turn>"]

# 候補トークンをターン終了トークンに追加
for token in potential_terminators:
    token_id = tokenizer.convert_tokens_to_ids(token)
    if token_id is not None:
        terminators.append(token_id)

def generate_response(chat):
    # チャットをトークン化し、処理する
    inputs = tokenizer.apply_chat_template(chat, add_generation_prompt=True, return_tensors="pt").to(model.device)
    # モデルを介して新しいトークンを生成
    outputs = model.generate(inputs, max_new_tokens=32, pad_token_id=tokenizer.eos_token_id, eos_token_id=terminators)
    response = outputs[0][inputs.shape[-1]:]  # 生成されたレスポンスを取得
    out = tokenizer.decode(response, skip_special_tokens=True)  # デコードしてレスポンスを取得

    return out  # レスポンスを返す


class Robot:
    def __init__(self):
        pass

    def on(self, mode, obs):
        assert mode in [
            "asking", "guessing", "answering",
        ], "modeはこれらの値のいずれかのみ取ることができます: asking, answering, guessing"
        if mode == "asking":
            # 質問する役割を起動する
            output = self.asker(obs)
        if mode == "answering":
            # 答える役割を起動する
            output = self.answerer(obs)
            if "yes" in output.lower():  # 答えが「はい」の場合
                output = "yes"  # 「はい」と設定
            elif "no" in output.lower():  # 答えが「いいえ」の場合
                output = "no"  # 「いいえ」と設定
            if "yes" not in output.lower() and "no" not in output.lower():  # どちらでもない場合
                output = "yes"  # デフォルトで「はい」に設定
        if mode == "guessing":
            # 推測する役割を起動する
            output = self.guesser(obs)
        return output

    def asker(self, obs):
        
        input = asker_prompt(obs)  # 質問プロンプトの生成
        output = generate_response(input)  # レスポンス生成
        
        return output

    def guesser(self, obs):
        input = guesser_prompt(obs)  # 推測プロンプトの生成
        output = generate_response(input)  # レスポンス生成
        
        return output

    def answerer(self, obs):
        input = answerer_prompt(obs)  # 答えプロンプトの生成
        output = generate_response(input)  # レスポンス生成

        return output


robot = Robot()  # Robotインスタンスの生成


def agent(obs, cfg):
    # エージェントの動作を制御する関数
    if obs.turnType == "ask":
        response = robot.on(mode="asking", obs=obs)  # 質問する場合

    elif obs.turnType == "guess":
        response = robot.on(mode="guessing", obs=obs)  # 推測する場合

    elif obs.turnType == "answer":
        response = robot.on(mode="answering", obs=obs)  # 答える場合

    if response == None or len(response) <= 1:  # レスポンスがない場合
        response = "yes"  # デフォルトで「はい」を返す

    return response  # レスポンスを返す

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Simulation

### Install pygame

</div>
<div class="column-right">

# 日本語訳

## シミュレーション

### pygameをインストール


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!pip install pygame
```

</div>
<div class="column-right">

# 日本語訳

```python
!pip install pygame
```

</div>
</details>

In [None]:
!pip install pygame

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile dumb.py

def dumb_agent(obs, cfg):
    
    # if agent is guesser and turnType is "ask"
    if obs.turnType == "ask":
        response = "Is it a duck?"
    # if agent is guesser and turnType is "guess"
    elif obs.turnType == "guess":
        response = "duck"
    # if agent is the answerer
    elif obs.turnType == "answer":
        response = "no"
    
    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile dumb.py

def dumb_agent(obs, cfg):
    
    # エージェントが推測者でターンタイプが「ask」の場合
    if obs.turnType == "ask":
        response = "それはアヒルですか？"  # 推測を尋ねる質問
    # エージェントが推測者でターンタイプが「guess」の場合
    elif obs.turnType == "guess":
        response = "アヒル"  # アヒルと推測
    # エージェントが回答者の場合
    elif obs.turnType == "answer":
        response = "いいえ"  # 疑問に対して「いいえ」と返答
    
    return response
```

</div>
</details>

In [None]:
%%writefile dumb.py

def dumb_agent(obs, cfg):
    
    # エージェントが推測者でターンタイプが「ask」の場合
    if obs.turnType == "ask":
        response = "それはアヒルですか？"  # 推測を尋ねる質問
    # エージェントが推測者でターンタイプが「guess」の場合
    elif obs.turnType == "guess":
        response = "アヒル"  # アヒルと推測
    # エージェントが回答者の場合
    elif obs.turnType == "answer":
        response = "いいえ"  # 疑問に対して「いいえ」と返答
    
    return response

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%time

from kaggle_environments import make
env = make("llm_20_questions", debug=True)
game_output = env.run(agents=["submission/main.py", "submission/main.py", "dumb.py", "dumb.py"])
```

</div>
<div class="column-right">

# 日本語訳

```python
%%time

from kaggle_environments import make
env = make("llm_20_questions", debug=True)  # 環境を作成
game_output = env.run(agents=["submission/main.py", "submission/main.py", "dumb.py", "dumb.py"])  # エージェントを実行
```

</div>
</details>

In [None]:
%%time

from kaggle_environments import make
env = make("llm_20_questions", debug=True)  # 環境を作成
game_output = env.run(agents=["submission/main.py", "submission/main.py", "dumb.py", "dumb.py"])  # エージェントを実行

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
env.render(mode="ipython", width=600, height=700)
```

</div>
<div class="column-right">

# 日本語訳

```python
env.render(mode="ipython", width=600, height=700)  # ゲームの出力をレンダリング
```

</div>
</details>

In [None]:
env.render(mode="ipython", width=600, height=700)  # ゲームの出力をレンダリング

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Submit Agent

</div>
<div class="column-right">

# 日本語訳

## エージェントの提出


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!apt install pigz pv > /dev/null
```

</div>
<div class="column-right">

# 日本語訳

```python
!apt install pigz pv > /dev/null  # 開いているプロセスを無視してパッケージをインストール
```

</div>
</details>

In [None]:
!apt install pigz pv > /dev/null  # 開いているプロセスを無視してパッケージをインストール

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .
```

</div>
<div class="column-right">

# 日本語訳

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .  # 提出ファイルを圧縮してtarアーカイブを作成
```

</div>
</details>

In [None]:
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .  # 提出ファイルを圧縮してtarアーカイブを作成