# 要約 
このJupyterノートブックは、Kaggleの「20 Questions」コンペティションに向けて、Hugging Faceの8Bまたはそれ以下のLLMを活用したエージェントを開発するためのスターターコードです。ノートブックは、質問者と回答者の役割を持つエージェントを設計することを目指しており、質問者は特定のキーワードを効率的に推測するためにあらかじめ設定された質問を用いることができます。一方、回答者はHugging FaceのLlama 8B LLMを使用して、未知の質問に対する「はい」または「いいえ」の回答を生成する必要があります。

主な処理として以下のステップが含まれます：

1. **ライブラリのインストール**: 必要なPythonライブラリ（`accelerate`、`bitsandbytes`など）が指定したパスにインストールされます。
   
2. **モデルのダウンロードと保存**: Llama-3-Smaug-8Bモデルが4bit形式でダウンロードされ、保存されます。このモデルは、追加データでファインチューニングされた8BのLlama3モデルです。

3. **エクスプロラトリーデータ分析（EDA）**: キーワードに対するLLMの応答を確認するためのセクションが設けられています。ここでは、回答者にカスタマイズされたプロンプトが生成されます。

4. **エージェントの作成**: メインのエージェントファイル`main.py`に、エージェントのロジックを実装します。質問や推測の処理が定義されており、各ラウンドごとに情報をもとに質問を更新します。

5. **Kaggle環境での実行**: KaggleのAPIを使用して、エージェントを実行し、シミュレーションを通じてエージェントのパフォーマンスを評価します。

このノートブックを通じて、作者は質問者と回答者の双方の役割を担うエージェントの設計と実装を進め、Kaggleの「20 Questions」ゲームにおいて効率的な推測を行う方法を探求しています。使用しているライブラリは主に`transformers`であり、これによりLLMのモデルの読み込みと生成のプロセスがスムーズに行われます。

---


# 用語概説 
以下は、Jupyter Notebook内の専門用語に対する簡単な解説です。初心者がつまずきやすいと思われるマイナーなトピックや、このノートブック特有のドメイン知識に焦点を当てています。

1. **Hugging Face**: 自然言語処理（NLP）のためのオープンソースライブラリを提供する企業。特にTransformerモデルの事前学習済みモデルの提供で知られている。

2. **LLM (Large Language Model)**: 大規模な言語モデルの略。膨大なデータでトレーニングされ、自然言語の理解と生成ができるモデル。

3. **二分探索 (Binary Search)**: ソートされたデータセットにおいて、対象の値を効果的に見つけるためのアルゴリズム。データを半分に分割していくつかのステップで最終的な検索結果に到達する。

4. **4bit量子化 (4bit Quantization)**: モデルのパラメータを4ビットの精度で表現する技術。モデルのサイズを大幅に削減し、メモリ使用量を減らす効果がある。

5. **ヒューリスティック (Heuristic)**: 問題解決のために経験則に基づいて行う手法。必ずしも最適解を提供するわけではないが、実用的で効率的な解決策を見つけられることが多い。

6. **トークナイザー (Tokenizer)**: テキストをモデルに入力するために、単語や文などの意味のある単位（トークン）に分割するツール。モデルが扱いやすいフォーマットに変換する。

7. **CUDA**: NVIDIAの並列コンピューティングアーキテクチャ。GPUを用いた計算を効率的に行うためのプログラミングモデル。

8. **pad_token_id**: モデルの入力データを揃えるために使用されるパディングトークンのID。入力シーケンスの長さを揃えるために使われる。

9. **generate**: モデルにテキストを生成させるメソッド。特定の入力に基づいて次のトークンを予測する。

10. **KaggleのAPI**: Kaggleプラットフォームでのデータの取得やノートブックの実行などをプログラムから行うためのインターフェース。

11. **エージェント (Agent)**: コンペティションのルールのもとで振る舞うプログラム。特定の環境内で自動的に行動し、相手と対戦する。

12. **obs (Observation)**: エージェントが周囲の環境から取得する情報。例えば、現在のラウンドの状態や相手の質問、過去の回答などが含まれる。

これらの用語は、初心者がノートブックの内容を理解する上で役立つでしょう。特に、モデルの設定や出力に関わる部分については、実務経験がないと理解が難しい場合があるため、詳しく説明しました。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Starter Code for Hugging Face Llama 8B LLM
This is starter code for any Hugging Face 8B or smaller LLM for Kaggle's twenty questions competition. Our agent needs to act as both a `questioner` and `answerer`. We will use binary search for the questioner based on new features we created from the list or potential keywords (before update). **This notebook was created when keywords were only places.**

Before running this notebook, we created a CSV file containing all public LB (before update) words with a few additional columns that we can use to serach for the **place** keyword. The columns we added are `continent` and `first letter`. We will use Llama 8B LLM from Hugging Face for the answerer.

Note that the questioner "ask" role **does not** need to use LLM but rather can be a predetermined set of questions that narrow down the search. Also the questioner "guess" role can also be heuristic logic and not an LLM. The answerer **does need** to be LLM because it needs to answer unknown questions from another Kaggle team.

# Pip Install Libaries
We install whatever packages we need to the path `/tmp/submission/lib` which will be tarballed into our submission file.

</div>
<div class="column-right">

# 日本語訳

# Hugging Face Llama 8B LLM のスターターコード
これは、Kaggleの「20 Questions」コンペティションに向けたHugging Faceの8Bまたはそれ以下のLLM用のスターターコードです。我々のエージェントは、`質問者`と`回答者`の両方として機能する必要があります。質問者は、作成した新機能を基にリストや潜在的なキーワードから二分探索を行います（更新前）。**このノートブックは、キーワードが場所だけだった時に作成されました。**

このノートブックを実行する前に、我々はすべての公的LB（更新前）の単語を含むCSVファイルを作成し、**場所**キーワードを検索するために使用できるいくつかの追加列を用意しました。追加した列は`大陸`と`最初の文字`です。回答者としてHugging FaceのLlama 8B LLMを使用します。

質問者の「尋ねる」役割は**LLMを使用する必要はありません**が、検索を絞り込むためのあらかじめ決められた質問のセットであれば大丈夫です。また、質問者の「推測する」役割も、ヒューリスティックな論理を使用することができ、LLMである必要はありません。回答者は**LLMである必要があります**。なぜなら、他のKaggleチームからの未知の質問に答える必要があるからです。

# 必要なライブラリのインストール
必要なパッケージを`/tmp/submission/lib`パスにインストールします。このパスは、提出ファイルにtarballとしてまとめられます。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!mkdir /tmp/submission
```

</div>
<div class="column-right">

# 日本語訳

```python
!mkdir /tmp/submission
```

</div>
</details>

In [None]:
!mkdir /tmp/submission

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%time
import os,sys
os.system("pip install -U -t /tmp/submission/lib accelerate")
os.system("pip install -i https://pypi.org/simple/ -U -t /tmp/submission/lib bitsandbytes")
os.system("pip cache purge")
sys.path.insert(0, "/tmp/submission/lib")
```

</div>
<div class="column-right">

# 日本語訳

```python
%%time
import os,sys
os.system("pip install -U -t /tmp/submission/lib accelerate")
os.system("pip install -i https://pypi.org/simple/ -U -t /tmp/submission/lib bitsandbytes")
os.system("pip cache purge")
sys.path.insert(0, "/tmp/submission/lib")
```

</div>
</details>

In [None]:
%%time
import os,sys
os.system("pip install -U -t /tmp/submission/lib accelerate")
os.system("pip install -i https://pypi.org/simple/ -U -t /tmp/submission/lib bitsandbytes")
os.system("pip cache purge")
sys.path.insert(0, "/tmp/submission/lib")

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Download and Save LLM Model
We will download and save models to `/tmp/submission/weights`. We will save the model in 4bit to minimize disk and memory usage. This will be tarballed into our submission file.

In this notebook, we use "Llama-3-Smaug-8B". This is Llama-3-8B finetuned with some more data. You can read about it on HuggingFace [here][1]

[1]: https://huggingface.co/abacusai/Llama-3-Smaug-8B

</div>
<div class="column-right">

# 日本語訳

# LLMモデルのダウンロードと保存
モデルを`/tmp/submission/weights`にダウンロードして保存します。ディスクとメモリ使用量を最小限に抑えるために、モデルを4bitで保存します。このモデルも提出ファイルにtarballとしてまとめられます。

このノートブックでは、「Llama-3-Smaug-8B」を使用します。これは、追加のデータでファインチューニングされたLlama-3-8Bです。詳細はHuggingFaceで確認できます[こちら][1]

[1]: https://huggingface.co/abacusai/Llama-3-Smaug-8B


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch
```

</div>
<div class="column-right">

# 日本語訳

```python
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch
```

</div>
</details>

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
model_name = "abacusai/Llama-3-Smaug-8B"

bnb_config = BitsAndBytesConfig(
    load_in_4bit = True,
    bnb_4bit_quanty_type = "fp4", 
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quanty = True,
)

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config = bnb_config,
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
```

</div>
<div class="column-right">

# 日本語訳

```python
model_name = "abacusai/Llama-3-Smaug-8B"

bnb_config = BitsAndBytesConfig(
    load_in_4bit = True,
    bnb_4bit_quanty_type = "fp4", 
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quanty = True,
)

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config = bnb_config,
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
```

</div>
</details>

In [None]:
model_name = "abacusai/Llama-3-Smaug-8B"

bnb_config = BitsAndBytesConfig(
    load_in_4bit = True,
    bnb_4bit_quanty_type = "fp4", 
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_use_double_quanty = True,
)

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config = bnb_config,
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
model.save_pretrained("/tmp/submission/weights")
tokenizer.save_pretrained("/tmp/submission/weights")
```

</div>
<div class="column-right">

# 日本語訳

```python
model.save_pretrained("/tmp/submission/weights")
tokenizer.save_pretrained("/tmp/submission/weights")
```

</div>
</details>

In [None]:
model.save_pretrained("/tmp/submission/weights")
tokenizer.save_pretrained("/tmp/submission/weights")

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# EDA LLM Model
Let's see how our LLM answers a question about a keyword. Use this section to determine which customized prompt to show our `answerer`. 

</div>
<div class="column-right">

# 日本語訳

# LLMモデルのEDA
キーワードに関する質問に対するLLMの回答を確認してみましょう。このセクションを使用して、`回答者`に表示するカスタマイズされたプロンプトを決定します。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
import pandas as pd
keywords = pd.read_csv("/kaggle/input/updated-kaggle-keywords/keywords_v2.csv")
keywords.head(1)
```

</div>
<div class="column-right">

# 日本語訳

```python
import pandas as pd
keywords = pd.read_csv("/kaggle/input/updated-kaggle-keywords/keywords_v2.csv")
keywords.head(1)
```

</div>
</details>

In [None]:
import pandas as pd
keywords = pd.read_csv("/kaggle/input/updated-kaggle-keywords/keywords_v2.csv")
keywords.head(1)

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
pad_token_id = tokenizer.pad_token_id
if pad_token_id is None:
    pad_token_id = tokenizer.eos_token_id
```

</div>
<div class="column-right">

# 日本語訳

```python
pad_token_id = tokenizer.pad_token_id
if pad_token_id is None:
    pad_token_id = tokenizer.eos_token_id
```

</div>
</details>

In [None]:
pad_token_id = tokenizer.pad_token_id
if pad_token_id is None:
    pad_token_id = tokenizer.eos_token_id

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
question = f"Is the secret word a country?"

keyword = "venezuela"
if keyword in keywords.keyword.values:
    row = keywords.loc[keywords.keyword==keyword].iloc[0]
    category = row.category #"landmark"
    continent = row.continent #"North America"
    negate = {
        "city":"Is is not a country. It is not a landmark.",
        "country":"Is is not a city. It is not a landmark.",
        "landmark":"Is is not a city. It is not a country.",
    }
    prompt = f"We are playing 20 questions. The keyword is {keyword}. It is a {category}. {negate[category]} This word has first letter {keyword[0]}. This {category} is located in {continent}. {question}"
else:
    prompt = f"We are playing 20 questions. The keyword is {keyword}. It is a thing. Is is not a city. It is not a country. It is not a landmark. This word has first letter {keyword[0]}. {question}"

messages = [
    {"role": "system", "content": "Answer yes or no to the following question and nothing else."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to('cuda')

generated_ids = model.generate(
    model_inputs.input_ids,
    attention_mask = model_inputs.attention_mask,
    pad_token_id=pad_token_id,
    max_new_tokens=1
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
if not "yes" in response.lower(): response = "no"
else: response = "yes"

print(f"When keyword is '{keyword}'")
print(f"and questioner asks: '{question}'")
print(f"with prompt = {prompt}")
print(f"our model answers: '{response}'")
```

</div>
<div class="column-right">

# 日本語訳

```python
question = f"秘密の単語は国ですか？"

keyword = "venezuela"
if keyword in keywords.keyword.values:
    row = keywords.loc[keywords.keyword==keyword].iloc[0]
    category = row.category #"名所"
    continent = row.continent #"北アメリカ"
    negate = {
        "city":"国ではありません。名所でもありません。",
        "country":"都市ではありません。名所でもありません。",
        "landmark":"都市ではありません。国でもありません。",
    }
    prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは{category}です。{negate[category]} この単語の最初の文字は{keyword[0]}です。この{category}は{continent}にあります。{question}"
else:
    prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは物体です。都市ではありません。国でもありません。名所でもありません。この単語の最初の文字は{keyword[0]}です。{question}"

messages = [
    {"role": "system", "content": "次の質問には「はい」または「いいえ」のみで答えてください。それ以外は答えないでください。"},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to('cuda')

generated_ids = model.generate(
    model_inputs.input_ids,
    attention_mask = model_inputs.attention_mask,
    pad_token_id=pad_token_id,
    max_new_tokens=1
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
if not "yes" in response.lower(): response = "no"
else: response = "yes"

print(f"キーワードが '{keyword}' の時")
print(f"質問者が尋ねる: '{question}'")
print(f"プロンプトは: {prompt}")
print(f"私たちのモデルの回答: '{response}'")
```

</div>
</details>

In [None]:
question = f"秘密の単語は国ですか？"

keyword = "venezuela"
if keyword in keywords.keyword.values:
    row = keywords.loc[keywords.keyword==keyword].iloc[0]
    category = row.category #"名所"
    continent = row.continent #"北アメリカ"
    negate = {
        "city":"国ではありません。名所でもありません。",
        "country":"都市ではありません。名所でもありません。",
        "landmark":"都市ではありません。国でもありません。",
    }
    prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは{category}です。{negate[category]} この単語の最初の文字は{keyword[0]}です。この{category}は{continent}にあります。{question}"
else:
    prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは物体です。都市ではありません。国でもありません。名所でもありません。この単語の最初の文字は{keyword[0]}です。{question}"

messages = [
    {"role": "system", "content": "次の質問には「はい」または「いいえ」のみで答えてください。それ以外は答えないでください。"},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to('cuda')

generated_ids = model.generate(
    model_inputs.input_ids,
    attention_mask = model_inputs.attention_mask,
    pad_token_id=pad_token_id,
    max_new_tokens=1
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
if not "yes" in response.lower(): response = "no"
else: response = "yes"

print(f"キーワードが '{keyword}' の時")
print(f"質問者が尋ねる: '{question}'")
print(f"プロンプトは: {prompt}")
print(f"私たちのモデルの回答: '{response}'")

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
import gc, torch
del model, tokenizer, model_inputs, generated_ids, response
gc.collect()
torch.cuda.empty_cache()
```

</div>
<div class="column-right">

# 日本語訳

```python
import gc, torch
del model, tokenizer, model_inputs, generated_ids, response
gc.collect()
torch.cuda.empty_cache()
```

</div>
</details>

In [None]:
import gc, torch
del model, tokenizer, model_inputs, generated_ids, response
gc.collect()
torch.cuda.empty_cache()

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Create Agent
We save our agent file as `main.py`. Our agent needs to implement a fuction called `def agent_fn(obs, cfg)`.

</div>
<div class="column-right">

# 日本語訳

# エージェントの作成
エージェントファイルを`main.py`として保存します。我々のエージェントは、`def agent_fn(obs, cfg)`という関数を実装する必要があります。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!cp /kaggle/input/updated-kaggle-keywords/keywords_v2.csv /kaggle/working
!cp /kaggle/input/updated-kaggle-keywords/keywords_v2.csv /tmp/submission
```

</div>
<div class="column-right">

# 日本語訳

```python
!cp /kaggle/input/updated-kaggle-keywords/keywords_v2.csv /kaggle/working
!cp /kaggle/input/updated-kaggle-keywords/keywords_v2.csv /tmp/submission
```

</div>
</details>

In [None]:
!cp /kaggle/input/updated-kaggle-keywords/keywords_v2.csv /kaggle/working
!cp /kaggle/input/updated-kaggle-keywords/keywords_v2.csv /tmp/submission

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile /tmp/submission/main.py

################
# DETERMINE IF SUBMIT OR COMMIT
import os
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
VERBOSE = False
if not os.path.exists(KAGGLE_AGENT_PATH + "weights"):
    KAGGLE_AGENT_PATH = "/tmp/submission/"
    VERBOSE = True

#################
# LOAD MODEL INTO MEMORY
import sys, torch
from transformers import AutoTokenizer, AutoModelForCausalLM
sys.path.insert(0, f"{KAGGLE_AGENT_PATH}lib")
model = AutoModelForCausalLM.from_pretrained(
    f"{KAGGLE_AGENT_PATH}weights/",
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)
tokenizer = AutoTokenizer.from_pretrained(f"{KAGGLE_AGENT_PATH}weights/")

##############
# BINARY SEARCH AS QUESTIONER
import pandas as pd, numpy as np
keywords = pd.read_csv(KAGGLE_AGENT_PATH + "keywords_v2.csv")
keywords['guess'] = 0

categories = ["city","country","landmark"]
#np.random.shuffle(categories)
category_yes = []
category_no = []
cat_guess = 0

continents = ["Europe","Asia","North America","Africa","South America","Australia"]
#np.random.shuffle(continents)
continent_yes = []
continent_no = []
con_guess = 0

first_letters = []
first_letter_yes = []
first_letter_no = []
let_guess = 0
extra_guess = ""

###############
# LLM MODEL AS ANSWERER
def get_yes_no(question,keyword):
    global keywords, VERBOSE
    
    if keyword in keywords.keyword.values:
        row = keywords.loc[keywords.keyword==keyword].iloc[0]
        category = row.category #"landmark"
        continent = row.continent #"North America"
        negate = {
            "city":"Is is not a country. It is not a landmark.",
            "country":"Is is not a city. It is not a landmark.",
            "landmark":"Is is not a city. It is not a country.",
        }
        prompt = f"We are playing 20 questions. The keyword is {keyword}. It is a {category}. {negate[category]} This word has first letter {keyword[0]}. This {category} is located in {continent}. {question}"
    else:
        prompt = f"We are playing 20 questions. The keyword is {keyword}. It is a thing. Is is not a city. It is not a country. It is not a landmark. This word has first letter {keyword[0]}. {question}"
    
    messages = [
        {"role": "system", "content": "Answer yes or no to the following question and nothing else."},
        {"role": "user", "content": prompt}
    ]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to('cuda')
    
    pad_token_id = tokenizer.pad_token_id
    if pad_token_id is None:
        pad_token_id = tokenizer.eos_token_id
        
    generated_ids = model.generate(
        model_inputs.input_ids,
        attention_mask = model_inputs.attention_mask,
        pad_token_id = pad_token_id,
        max_new_tokens=1
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    if not "yes" in response.lower(): response = "no"
    else: response = "yes"
        
    if VERBOSE:
        print(f"### {prompt}")
        
    return response

############
# MAIN AGENT FUNCTION
def agent_fn(obs, cfg):
    global keywords, extra_guess, VERBOSE
    global categories, category_yes, category_no, cat_guess
    global continents, continent_yes, continent_no, con_guess
    global first_letters, first_letter_yes, first_letter_no, let_guess
        
    # GENERATE RESPONSE
    if obs.turnType == "ask":
        
        if (cat_guess<3)&(len(category_yes)==0):
            response = f"Is the keyword the name of a {categories[cat_guess]}?"
            cat_guess += 1
        elif (con_guess<6)&(len(continent_yes)==0):
            category = "place"
            if len( category_yes )==1: 
                category = category_yes[0]
            response = f"Is the {category} located in {continents[con_guess]}?"
            con_guess += 1
        else:
            IDX = keywords.category.isin( category_yes )
            IDX = IDX & (keywords.continent.isin( continent_yes ))
            first_letters = list(keywords.loc[IDX,"first_letter"].value_counts().index.values)
            if let_guess < len(first_letters):
                response = f"Does the keyword begin with the letter {first_letters[let_guess]}?"
            else:
                IDX = keywords.guess == 0
                if len(category_yes)>0: IDX = IDX & (keywords.category.isin(category_yes))
                if len(category_no)>0: IDX = IDX & (~keywords.category.isin(category_no))
                if len(continent_yes)>0: IDX = IDX & (keywords.continent.isin(continent_yes))
                if len(continent_no)>0: IDX = IDX & (~keywords.continent.isin(continent_no))
                if len(first_letter_yes)>0: IDX = IDX & (keywords.first_letter.isin(first_letter_yes))
                if len(first_letter_no)>0: IDX = IDX & (~keywords.first_letter.isin(first_letter_no))
                try:
                    guess = keywords.loc[IDX].sample(1).index.values[0]
                    keywords.loc[guess,'guess'] = 1
                    response = keywords.loc[guess,"keyword"]
                except:
                    response = np.random.choice( keywords.keyword.values )
                extra_guess = response
                response = f"Is it {response}?"
            let_guess += 1
            
    elif obs.turnType == "guess":
        
        category_yes = []
        category_no = []
        for k in range(cat_guess):
            if obs.answers[k]=="yes":
                category_yes.append( categories[k] )
            else:
                category_no.append( categories[k] )
        if (cat_guess==3)&(len(category_yes)==0):
            category_yes = ["city","country","landmark"]
            category_no = []
            
        continent_yes = []
        continent_no = []
        for k in range(con_guess):
            if obs.answers[k+cat_guess]=="yes":
                continent_yes.append( continents[k] )
            else:
                continent_no.append( continents[k] )
        if (con_guess==6)&(len(continent_yes)==0):
            continent_yes = ["Europe","Asia","North America","Africa","South America","Australia"]
            continent_no = []
            
        first_letter_yes = []
        first_letter_no = []
        for k in range(let_guess):
            if k >= len(first_letters): continue
            if obs.answers[k+cat_guess+con_guess]=="yes":
                first_letter_yes.append( first_letters[k] )    
            else:
                first_letter_no.append( first_letters[k] ) 
                
        IDX = keywords.guess == 0
        if len(category_yes)>0: IDX = IDX & (keywords.category.isin(category_yes))
        if len(category_no)>0: IDX = IDX & (~keywords.category.isin(category_no))
        if len(continent_yes)>0: IDX = IDX & (keywords.continent.isin(continent_yes))
        if len(continent_no)>0: IDX = IDX & (~keywords.continent.isin(continent_no))
        if len(first_letter_yes)>0: IDX = IDX & (keywords.first_letter.isin(first_letter_yes))
        if len(first_letter_no)>0: IDX = IDX & (~keywords.first_letter.isin(first_letter_no))
            
        try:
            guess = keywords.loc[IDX].sample(1).index.values[0]
            keywords.loc[guess,'guess'] = 1
            response = keywords.loc[guess,"keyword"]
        except:
            response = np.random.choice( keywords.keyword.values )
            
        if (let_guess>0)&(let_guess>=len(first_letters))&(obs.answers[-1]=="yes"):
            response = extra_guess
        
    else: #obs.turnType == "answer"
        if obs.keyword.lower() in obs.questions[-1].lower():
            response = "yes"
        else:
            response = get_yes_no(obs.questions[-1], obs.keyword)
            
    # DISPLAY ROLE
    if VERBOSE: 
        if obs.turnType == "answer": 
            print(f"Team 2 - Answerer - ### Agent LLAMA 8B ###")
        else:
            print(f"\nTeam 2 - Questioner - ### Agent LLAMA 8B ###")
        print(f"OUTPUT = '{response}'")

    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile /tmp/submission/main.py

################
# 提出かコミットかを決定
import os
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
VERBOSE = False
if not os.path.exists(KAGGLE_AGENT_PATH + "weights"):
    KAGGLE_AGENT_PATH = "/tmp/submission/"
    VERBOSE = True

#################
# メモリにモデルをロード
import sys, torch
from transformers import AutoTokenizer, AutoModelForCausalLM
sys.path.insert(0, f"{KAGGLE_AGENT_PATH}lib")
model = AutoModelForCausalLM.from_pretrained(
    f"{KAGGLE_AGENT_PATH}weights/",
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)
tokenizer = AutoTokenizer.from_pretrained(f"{KAGGLE_AGENT_PATH}weights/")

##############
# 質問者としての二分探索
import pandas as pd, numpy as np
keywords = pd.read_csv(KAGGLE_AGENT_PATH + "keywords_v2.csv")
keywords['guess'] = 0

categories = ["city","country","landmark"]
#np.random.shuffle(categories)
category_yes = []
category_no = []
cat_guess = 0

continents = ["Europe","Asia","North America","Africa","South America","Australia"]
#np.random.shuffle(continents)
continent_yes = []
continent_no = []
con_guess = 0

first_letters = []
first_letter_yes = []
first_letter_no = []
let_guess = 0
extra_guess = ""

###############
# LLMモデルとしての回答者
def get_yes_no(question,keyword):
    global keywords, VERBOSE
    
    if keyword in keywords.keyword.values:
        row = keywords.loc[keywords.keyword==keyword].iloc[0]
        category = row.category #"名所"
        continent = row.continent #"北アメリカ"
        negate = {
            "city":"国ではありません。名所でもありません。",
            "country":"都市ではありません。名所でもありません。",
            "landmark":"都市ではありません。国でもありません。",
        }
        prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは{category}です。{negate[category]} この単語の最初の文字は{keyword[0]}です。この{category}は{continent}にあります。{question}"
    else:
        prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは物体です。都市ではありません。国でもありません。名所でもありません。この単語の最初の文字は{keyword[0]}です。{question}"
    
    messages = [
        {"role": "system", "content": "次の質問には「はい」または「いいえ」のみで答えてください。それ以外は答えないでください。"},
        {"role": "user", "content": prompt}
    ]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to('cuda')
    
    pad_token_id = tokenizer.pad_token_id
    if pad_token_id is None:
        pad_token_id = tokenizer.eos_token_id
        
    generated_ids = model.generate(
        model_inputs.input_ids,
        attention_mask = model_inputs.attention_mask,
        pad_token_id = pad_token_id,
        max_new_tokens=1
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    if not "yes" in response.lower(): response = "no"
    else: response = "yes"
        
    if VERBOSE:
        print(f"### {prompt}")
        
    return response

############
# メインエージェント関数
def agent_fn(obs, cfg):
    global keywords, extra_guess, VERBOSE
    global categories, category_yes, category_no, cat_guess
    global continents, continent_yes, continent_no, con_guess
    global first_letters, first_letter_yes, first_letter_no, let_guess
        
    # レスポンスを生成
    if obs.turnType == "ask":
        
        if (cat_guess<3)&(len(category_yes)==0):
            response = f"キーワードは{categories[cat_guess]}の名前ですか？"
            cat_guess += 1
        elif (con_guess<6)&(len(continent_yes)==0):
            category = "場所"
            if len( category_yes )==1: 
                category = category_yes[0]
            response = f"その{category}は{continents[con_guess]}にありますか？"
            con_guess += 1
        else:
            IDX = keywords.category.isin( category_yes )
            IDX = IDX & (keywords.continent.isin( continent_yes ))
            first_letters = list(keywords.loc[IDX,"first_letter"].value_counts().index.values)
            if let_guess < len(first_letters):
                response = f"キーワードの最初の文字は{first_letters[let_guess]}ですか？"
            else:
                IDX = keywords.guess == 0
                if len(category_yes)>0: IDX = IDX & (keywords.category.isin(category_yes))
                if len(category_no)>0: IDX = IDX & (~keywords.category.isin(category_no))
                if len(continent_yes)>0: IDX = IDX & (keywords.continent.isin(continent_yes))
                if len(continent_no)>0: IDX = IDX & (~keywords.continent.isin(continent_no))
                if len(first_letter_yes)>0: IDX = IDX & (keywords.first_letter.isin(first_letter_yes))
                if len(first_letter_no)>0: IDX = IDX & (~keywords.first_letter.isin(first_letter_no))
                try:
                    guess = keywords.loc[IDX].sample(1).index.values[0]
                    keywords.loc[guess,'guess'] = 1
                    response = keywords.loc[guess,"keyword"]
                except:
                    response = np.random.choice( keywords.keyword.values )
                extra_guess = response
                response = f"それは{response}ですか？"
            let_guess += 1
            
    elif obs.turnType == "guess":
        
        category_yes = []
        category_no = []
        for k in range(cat_guess):
            if obs.answers[k]=="yes":
                category_yes.append( categories[k] )
            else:
                category_no.append( categories[k] )
        if (cat_guess==3)&(len(category_yes)==0):
            category_yes = ["city","country","landmark"]
            category_no = []
            
        continent_yes = []
        continent_no = []
        for k in range(con_guess):
            if obs.answers[k+cat_guess]=="yes":
                continent_yes.append( continents[k] )
            else:
                continent_no.append( continents[k] )
        if (con_guess==6)&(len(continent_yes)==0):
            continent_yes = ["Europe","Asia","North America","Africa","South America","Australia"]
            continent_no = []
            
        first_letter_yes = []
        first_letter_no = []
        for k in range(let_guess):
            if k >= len(first_letters): continue
            if obs.answers[k+cat_guess+con_guess]=="yes":
                first_letter_yes.append( first_letters[k] )    
            else:
                first_letter_no.append( first_letters[k] ) 
                
        IDX = keywords.guess == 0
        if len(category_yes)>0: IDX = IDX & (keywords.category.isin(category_yes))
        if len(category_no)>0: IDX = IDX & (~keywords.category.isin(category_no))
        if len(continent_yes)>0: IDX = IDX & (keywords.continent.isin(continent_yes))
        if len(continent_no)>0: IDX = IDX & (~keywords.continent.isin(continent_no))
        if len(first_letter_yes)>0: IDX = IDX & (keywords.first_letter.isin(first_letter_yes))
        if len(first_letter_no)>0: IDX = IDX & (~keywords.first_letter.isin(first_letter_no))
            
        try:
            guess = keywords.loc[IDX].sample(1).index.values[0]
            keywords.loc[guess,'guess'] = 1
            response = keywords.loc[guess,"keyword"]
        except:
            response = np.random.choice( keywords.keyword.values )
            
        if (let_guess>0)&(let_guess>=len(first_letters))&(obs.answers[-1]=="yes"):
            response = extra_guess
        
    else: #obs.turnType == "answer"
        if obs.keyword.lower() in obs.questions[-1].lower():
            response = "yes"
        else:
            response = get_yes_no(obs.questions[-1], obs.keyword)
            
    # 役割を表示
    if VERBOSE: 
        if obs.turnType == "answer": 
            print(f"チーム2 - 回答者 - ### エージェント LLAMA 8B ###")
        else:
            print(f"\nチーム2 - 質問者 - ### エージェント LLAMA 8B ###")
        print(f"OUTPUT = '{response}'")

    return response
```

</div>
</details>

In [None]:
%%writefile /tmp/submission/main.py

################
# 提出かコミットかを決定
import os
KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
VERBOSE = False
if not os.path.exists(KAGGLE_AGENT_PATH + "weights"):
    KAGGLE_AGENT_PATH = "/tmp/submission/"
    VERBOSE = True

#################
# メモリにモデルをロード
import sys, torch
from transformers import AutoTokenizer, AutoModelForCausalLM
sys.path.insert(0, f"{KAGGLE_AGENT_PATH}lib")
model = AutoModelForCausalLM.from_pretrained(
    f"{KAGGLE_AGENT_PATH}weights/",
    torch_dtype = torch.float16,
    device_map = "auto",
    trust_remote_code = True,
)
tokenizer = AutoTokenizer.from_pretrained(f"{KAGGLE_AGENT_PATH}weights/")

##############
# 質問者としての二分探索
import pandas as pd, numpy as np
keywords = pd.read_csv(KAGGLE_AGENT_PATH + "keywords_v2.csv")
keywords['guess'] = 0

categories = ["city","country","landmark"]
#np.random.shuffle(categories)
category_yes = []
category_no = []
cat_guess = 0

continents = ["Europe","Asia","North America","Africa","South America","Australia"]
#np.random.shuffle(continents)
continent_yes = []
continent_no = []
con_guess = 0

first_letters = []
first_letter_yes = []
first_letter_no = []
let_guess = 0
extra_guess = ""

###############
# LLMモデルとしての回答者
def get_yes_no(question,keyword):
    global keywords, VERBOSE
    
    if keyword in keywords.keyword.values:
        row = keywords.loc[keywords.keyword==keyword].iloc[0]
        category = row.category #"名所"
        continent = row.continent #"北アメリカ"
        negate = {
            "city":"国ではありません。名所でもありません。",
            "country":"都市ではありません。名所でもありません。",
            "landmark":"都市ではありません。国でもありません。",
        }
        prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは{category}です。{negate[category]} この単語の最初の文字は{keyword[0]}です。この{category}は{continent}にあります。{question}"
    else:
        prompt = f"我々は20の質問をプレイしています。キーワードは{keyword}です。これは物体です。都市ではありません。国でもありません。名所でもありません。この単語の最初の文字は{keyword[0]}です。{question}"
    
    messages = [
        {"role": "system", "content": "次の質問には「はい」または「いいえ」のみで答えてください。それ以外は答えないでください。"},
        {"role": "user", "content": prompt}
    ]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to('cuda')
    
    pad_token_id = tokenizer.pad_token_id
    if pad_token_id is None:
        pad_token_id = tokenizer.eos_token_id
        
    generated_ids = model.generate(
        model_inputs.input_ids,
        attention_mask = model_inputs.attention_mask,
        pad_token_id = pad_token_id,
        max_new_tokens=1
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    if not "yes" in response.lower(): response = "no"
    else: response = "yes"
        
    if VERBOSE:
        print(f"### {prompt}")
        
    return response

############
# メインエージェント関数
def agent_fn(obs, cfg):
    global keywords, extra_guess, VERBOSE
    global categories, category_yes, category_no, cat_guess
    global continents, continent_yes, continent_no, con_guess
    global first_letters, first_letter_yes, first_letter_no, let_guess
        
    # レスポンスを生成
    if obs.turnType == "ask":
        
        if (cat_guess<3)&(len(category_yes)==0):
            response = f"キーワードは{categories[cat_guess]}の名前ですか？"
            cat_guess += 1
        elif (con_guess<6)&(len(continent_yes)==0):
            category = "場所"
            if len( category_yes )==1: 
                category = category_yes[0]
            response = f"その{category}は{continents[con_guess]}にありますか？"
            con_guess += 1
        else:
            IDX = keywords.category.isin( category_yes )
            IDX = IDX & (keywords.continent.isin( continent_yes ))
            first_letters = list(keywords.loc[IDX,"first_letter"].value_counts().index.values)
            if let_guess < len(first_letters):
                response = f"キーワードの最初の文字は{first_letters[let_guess]}ですか？"
            else:
                IDX = keywords.guess == 0
                if len(category_yes)>0: IDX = IDX & (keywords.category.isin(category_yes))
                if len(category_no)>0: IDX = IDX & (~keywords.category.isin(category_no))
                if len(continent_yes)>0: IDX = IDX & (keywords.continent.isin(continent_yes))
                if len(continent_no)>0: IDX = IDX & (~keywords.continent.isin(continent_no))
                if len(first_letter_yes)>0: IDX = IDX & (keywords.first_letter.isin(first_letter_yes))
                if len(first_letter_no)>0: IDX = IDX & (~keywords.first_letter.isin(first_letter_no))
                try:
                    guess = keywords.loc[IDX].sample(1).index.values[0]
                    keywords.loc[guess,'guess'] = 1
                    response = keywords.loc[guess,"keyword"]
                except:
                    response = np.random.choice( keywords.keyword.values )
                extra_guess = response
                response = f"それは{response}ですか？"
            let_guess += 1
            
    elif obs.turnType == "guess":
        
        category_yes = []
        category_no = []
        for k in range(cat_guess):
            if obs.answers[k]=="yes":
                category_yes.append( categories[k] )
            else:
                category_no.append( categories[k] )
        if (cat_guess==3)&(len(category_yes)==0):
            category_yes = ["city","country","landmark"]
            category_no = []
            
        continent_yes = []
        continent_no = []
        for k in range(con_guess):
            if obs.answers[k+cat_guess]=="yes":
                continent_yes.append( continents[k] )
            else:
                continent_no.append( continents[k] )
        if (con_guess==6)&(len(continent_yes)==0):
            continent_yes = ["Europe","Asia","North America","Africa","South America","Australia"]
            continent_no = []
            
        first_letter_yes = []
        first_letter_no = []
        for k in range(let_guess):
            if k >= len(first_letters): continue
            if obs.answers[k+cat_guess+con_guess]=="yes":
                first_letter_yes.append( first_letters[k] )    
            else:
                first_letter_no.append( first_letters[k] ) 
                
        IDX = keywords.guess == 0
        if len(category_yes)>0: IDX = IDX & (keywords.category.isin(category_yes))
        if len(category_no)>0: IDX = IDX & (~keywords.category.isin(category_no))
        if len(continent_yes)>0: IDX = IDX & (keywords.continent.isin(continent_yes))
        if len(continent_no)>0: IDX = IDX & (~keywords.continent.isin(continent_no))
        if len(first_letter_yes)>0: IDX = IDX & (keywords.first_letter.isin(first_letter_yes))
        if len(first_letter_no)>0: IDX = IDX & (~keywords.first_letter.isin(first_letter_no))
            
        try:
            guess = keywords.loc[IDX].sample(1).index.values[0]
            keywords.loc[guess,'guess'] = 1
            response = keywords.loc[guess,"keyword"]
        except:
            response = np.random.choice( keywords.keyword.values )
            
        if (let_guess>0)&(let_guess>=len(first_letters))&(obs.answers[-1]=="yes"):
            response = extra_guess
        
    else: #obs.turnType == "answer"
        if obs.keyword.lower() in obs.questions[-1].lower():
            response = "yes"
        else:
            response = get_yes_no(obs.questions[-1], obs.keyword)
            
    # 役割を表示
    if VERBOSE: 
        if obs.turnType == "answer": 
            print(f"チーム2 - 回答者 - ### エージェント LLAMA 8B ###")
        else:
            print(f"\nチーム2 - 質問者 - ### エージェント LLAMA 8B ###")
        print(f"OUTPUT = '{response}'")

    return response

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Save Submission Tarball
We now save our libraries, model, and main.py into a tarball.

</div>
<div class="column-right">

# 日本語訳

# 提出用のターボールを保存
ライブラリ、モデル、main.pyをターボールに保存します。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!apt install pigz pv > /dev/null
```

</div>
<div class="column-right">

# 日本語訳

```python
!apt install pigz pv > /dev/null
```

</div>
</details>

In [None]:
!apt install pigz pv > /dev/null

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf /kaggle/working/submission.tar.gz -C /tmp/submission .
```

</div>
<div class="column-right">

# 日本語訳

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf /kaggle/working/submission.tar.gz -C /tmp/submission .
```

</div>
</details>

In [None]:
!tar --use-compress-program='pigz --fast --recursive | pv' -cf /kaggle/working/submission.tar.gz -C /tmp/submission .

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# EDA Kaggle's API
Below we show EDA for Kaggle's API. We run 3 random agents together with our Llama 8B LLM agent.

In Kaggle's 20 Question competition, each challenge involves 4 Kaggle teams. It is two teams versus two teams. Let's call this GroupTeam A vs. GroupTeam B.

On a single GroupTeam, there is a "questioner" (1 of the 4 Kaggle teams) and "answerer" (1 of the 4 Kaggle teams). The job of "questioner" is 2 roles (i.e. ask and guess). The job of "answerer" is 1 role (i.e. answer).

Each round, the "questioner" asks a question, then the GroupTeammate "answerer" will answer "yes" or "no". Finally the "questioner" will guess a word. There are 20 rounds.

</div>
<div class="column-right">

# 日本語訳

# KaggleのAPIのEDA
以下にKaggleのAPIのEDAを示します。我々はランダムに選ばれた3つのエージェントと共にLlama 8B LLMエージェントを実行します。

Kaggleの20 Questionsコンペティションでは、各挑戦は4つのKaggleチームが参加します。2つのチームが対戦形式です。このグループチームでは、「質問者」（4チームのうち1チーム）と「回答者」（4チームのうち1チーム）がいます。質問者の役割は2つ（すなわち、尋ねると推測する）。回答者の役割は1つ（すなわち、答える）です。

各ラウンドで、質問者が質問をし、その後グループの仲間である回答者が「はい」か「いいえ」で答えます。最後に質問者が単語を推測します。合計20ラウンド行われます。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
import pandas as pd

# Display the DataFrame
df = pd.read_csv("/kaggle/input/updated-kaggle-keywords/keywords_v2.csv")
n = df.category.nunique()
print(f"\nIn old public LB (before keyword update), there are {len(df)} possible keywords and {n} categories.")
print("Below are the 20 random examples:\n")
df.sample(20, random_state=42)
```

</div>
<div class="column-right">

# 日本語訳

```python
import pandas as pd

# DataFrameの表示
df = pd.read_csv("/kaggle/input/updated-kaggle-keywords/keywords_v2.csv")
n = df.category.nunique()
print(f"\n古い公的LB（キーワード更新前）には、{len(df)}個の可能なキーワードと{n}のカテゴリがあります。")
print("以下は、ランダムに選ばれた20の例です:\n")
df.sample(20, random_state=42)
```

</div>
</details>

In [None]:
import pandas as pd

# DataFrameの表示
df = pd.read_csv("/kaggle/input/updated-kaggle-keywords/keywords_v2.csv")
n = df.category.nunique()
print(f"\n古い公的LB（キーワード更新前）には、{len(df)}個の可能なキーワードと{n}のカテゴリがあります。")
print("以下は、ランダムに選ばれた20の例です:\n")
df.sample(20, random_state=42)

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile /kaggle/working/agent1.py

import pandas as pd, numpy as np
keywords = pd.read_csv("keywords_v2.csv").keyword.values

def agent_fn(obs, cfg):
    global keywords
    
    # DISPLAY ROUND NUMBER
    k = len( obs.questions )
    if obs.turnType == "ask":
        print()
        print("#"*25)
        print(f"### Round {k+1}")
        print("#"*25)

    # DISPLAY AGENT NAME AND JSON INPUT
    name = "Team 1 - Questioner - Agent Random"
    print(f"\n{name}\nINPUT =",obs)
    
    # GENERATE RESPONSE
    keyword = np.random.choice(keywords)
    if obs.turnType == "ask":
        response = f"Is it {keyword}?"
    else: #obs.turnType == "guess"
        response = keyword
        if obs.answers[-1] == "yes":
            response = obs.questions[-1].rsplit(" ",1)[1][:-1]
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile /kaggle/working/agent1.py

import pandas as pd, numpy as np
keywords = pd.read_csv("keywords_v2.csv").keyword.values

def agent_fn(obs, cfg):
    global keywords
    
    # ラウンド番号を表示
    k = len( obs.questions )
    if obs.turnType == "ask":
        print()
        print("#"*25)
        print(f"### ラウンド {k+1}")
        print("#"*25)

    # エージェント名とJSON入力を表示
    name = "チーム1 - 質問者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    keyword = np.random.choice(keywords)
    if obs.turnType == "ask":
        response = f"それは{keyword}ですか？"
    else: #obs.turnType == "guess"
        response = keyword
        if obs.answers[-1] == "yes":
            response = obs.questions[-1].rsplit(" ",1)[1][:-1]
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
</details>

In [None]:
%%writefile /kaggle/working/agent1.py

import pandas as pd, numpy as np
keywords = pd.read_csv("keywords_v2.csv").keyword.values

def agent_fn(obs, cfg):
    global keywords
    
    # ラウンド番号を表示
    k = len( obs.questions )
    if obs.turnType == "ask":
        print()
        print("#"*25)
        print(f"### ラウンド {k+1}")
        print("#"*25)

    # エージェント名とJSON入力を表示
    name = "チーム1 - 質問者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    keyword = np.random.choice(keywords)
    if obs.turnType == "ask":
        response = f"それは{keyword}ですか？"
    else: #obs.turnType == "guess"
        response = keyword
        if obs.answers[-1] == "yes":
            response = obs.questions[-1].rsplit(" ",1)[1][:-1]
    print(f"OUTPUT = '{response}'")

    return response

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile /kaggle/working/agent2.py

import numpy as np

def agent_fn(obs, cfg):
    
    # DISPLAY AGENT NAME AND JSON INPUT
    name = "Team 1 - Answerer - Agent Random"
    print(f"\n{name}\nINPUT =",obs)
    
    # GENERATE RESPONSE
    response = "no"
    #response = np.random.choice(["yes","no"])
    if obs.keyword.lower() in obs.questions[-1].lower():
        response = "yes"
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile /kaggle/working/agent2.py

import numpy as np

def agent_fn(obs, cfg):
    
    # エージェント名とJSON入力を表示
    name = "チーム1 - 回答者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    response = "no"
    #response = np.random.choice(["yes","no"])
    if obs.keyword.lower() in obs.questions[-1].lower():
        response = "yes"
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
</details>

In [None]:
%%writefile /kaggle/working/agent2.py

import numpy as np

def agent_fn(obs, cfg):
    
    # エージェント名とJSON入力を表示
    name = "チーム1 - 回答者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    response = "no"
    #response = np.random.choice(["yes","no"])
    if obs.keyword.lower() in obs.questions[-1].lower():
        response = "yes"
    print(f"OUTPUT = '{response}'")

    return response

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile /kaggle/working/agent3.py

import pandas as pd, numpy as np
keywords = pd.read_csv("keywords_v2.csv").keyword.values

def agent_fn(obs, cfg):
    global keywords
    
    # DISPLAY AGENT NAME AND JSON INPUT
    name = "Team 2 - Questioner - Agent Random"
    print(f"\n{name}\nINPUT =",obs)
    
    # GENERATE RESPONSE
    keyword = np.random.choice(keywords)
    if obs.turnType == "ask":
        response = f"Is it {keyword}?"
    else: #obs.turnType == "guess"
        response = keyword
        if obs.answers[-1] == "yes":
            response = obs.questions[-1].rsplit(" ",1)[1][:-1]
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile /kaggle/working/agent3.py

import pandas as pd, numpy as np
keywords = pd.read_csv("keywords_v2.csv").keyword.values

def agent_fn(obs, cfg):
    global keywords
    
    # エージェント名とJSON入力を表示
    name = "チーム2 - 質問者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    keyword = np.random.choice(keywords)
    if obs.turnType == "ask":
        response = f"それは{keyword}ですか？"
    else: #obs.turnType == "guess"
        response = keyword
        if obs.answers[-1] == "yes":
            response = obs.questions[-1].rsplit(" ",1)[1][:-1]
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
</details>

In [None]:
%%writefile /kaggle/working/agent3.py

import pandas as pd, numpy as np
keywords = pd.read_csv("keywords_v2.csv").keyword.values

def agent_fn(obs, cfg):
    global keywords
    
    # エージェント名とJSON入力を表示
    name = "チーム2 - 質問者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    keyword = np.random.choice(keywords)
    if obs.turnType == "ask":
        response = f"それは{keyword}ですか？"
    else: #obs.turnType == "guess"
        response = keyword
        if obs.answers[-1] == "yes":
            response = obs.questions[-1].rsplit(" ",1)[1][:-1]
    print(f"OUTPUT = '{response}'")

    return response

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile /kaggle/working/agent4.py

import numpy as np

def agent_fn(obs, cfg):
    
    # DISPLAY AGENT NAME AND JSON INPUT
    name = "Team 2 - Answerer - Agent Random"
    print(f"\n{name}\nINPUT =",obs)
    
    # GENERATE RESPONSE
    response = "no"
    #response = np.random.choice(["yes","no"])
    if obs.keyword.lower() in obs.questions[-1].lower():
        response = "yes"
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile /kaggle/working/agent4.py

import numpy as np

def agent_fn(obs, cfg):
    
    # エージェント名とJSON入力を表示
    name = "チーム2 - 回答者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    response = "no"
    #response = np.random.choice(["yes","no"])
    if obs.keyword.lower() in obs.questions[-1].lower():
        response = "yes"
    print(f"OUTPUT = '{response}'")

    return response
```

</div>
</details>

In [None]:
%%writefile /kaggle/working/agent4.py

import numpy as np

def agent_fn(obs, cfg):
    
    # エージェント名とJSON入力を表示
    name = "チーム2 - 回答者 - エージェント ランダム"
    print(f"\n{name}\nINPUT =",obs)
    
    # レスポンスを生成
    response = "no"
    #response = np.random.choice(["yes","no"])
    if obs.keyword.lower() in obs.questions[-1].lower():
        response = "yes"
    print(f"OUTPUT = '{response}'")

    return response

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!pip install -q pygame
```

</div>
<div class="column-right">

# 日本語訳

```python
!pip install -q pygame
```

</div>
</details>

In [None]:
!pip install -q pygame

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
LLAMA_AS_QUESTIONER = True
LLAMA_AS_ANSWERER = True

from kaggle_environments import make
env = make("llm_20_questions", debug=True)

# TEAM 1
agent1 = "/kaggle/working/agent1.py"
agent2 = "/kaggle/working/agent2.py"

# TEAM 2 - QUESTIONER
agent3 = "/kaggle/working/agent3.py"
if LLAMA_AS_QUESTIONER:
    agent3 = "/tmp/submission/main.py"
    
# TEAM 2 - ANSWERER
agent4 = "/kaggle/working/agent4.py"
if LLAMA_AS_ANSWERER:
    agent4 = "/tmp/submission/main.py"
    
env.reset()
log = env.run([agent1, agent2, agent3, agent4])

import gc, torch
del make, env, log
gc.collect()
torch.cuda.empty_cache()
```

</div>
<div class="column-right">

# 日本語訳

```python
LLAMA_AS_QUESTIONER = True
LLAMA_AS_ANSWERER = True

from kaggle_environments import make
env = make("llm_20_questions", debug=True)

# チーム1
agent1 = "/kaggle/working/agent1.py"
agent2 = "/kaggle/working/agent2.py"

# チーム2 - 質問者
agent3 = "/kaggle/working/agent3.py"
if LLAMA_AS_QUESTIONER:
    agent3 = "/tmp/submission/main.py"
    
# チーム2 - 回答者
agent4 = "/kaggle/working/agent4.py"
if LLAMA_AS_ANSWERER:
    agent4 = "/tmp/submission/main.py"
    
env.reset()
log = env.run([agent1, agent2, agent3, agent4])

import gc, torch
del make, env, log
gc.collect()
torch.cuda.empty_cache()
```

</div>
</details>

In [None]:
LLAMA_AS_QUESTIONER = True
LLAMA_AS_ANSWERER = True

from kaggle_environments import make
env = make("llm_20_questions", debug=True)

# チーム1
agent1 = "/kaggle/working/agent1.py"
agent2 = "/kaggle/working/agent2.py"

# チーム2 - 質問者
agent3 = "/kaggle/working/agent3.py"
if LLAMA_AS_QUESTIONER:
    agent3 = "/tmp/submission/main.py"
    
# チーム2 - 回答者
agent4 = "/kaggle/working/agent4.py"
if LLAMA_AS_ANSWERER:
    agent4 = "/tmp/submission/main.py"
    
env.reset()
log = env.run([agent1, agent2, agent3, agent4])

import gc, torch
del make, env, log
gc.collect()
torch.cuda.empty_cache()

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# REMOVE SIMLUATION AGENTS BECAUSE WE WILL NOT SUBMIT THESE
!rm agent1.py agent2.py agent3.py agent4.py keywords_v2.csv
```

</div>
<div class="column-right">

# 日本語訳

```python
# シミュレーションエージェントを削除する。提出しないため
!rm agent1.py agent2.py agent3.py agent4.py keywords_v2.csv
```

</div>
</details>

In [None]:
# シミュレーションエージェントを削除する。提出しないため
!rm agent1.py agent2.py agent3.py agent4.py keywords_v2.csv

---

# コメント

> ## shiv_314
> 
> このノートブックは素晴らしい！8Bパラメータのモデルを上限として使用できるということをどのように思いついたのですか？推定を通じて説明してもらえますか？
> 
> 
> > ## Chris Deotteトピック作成者
> > 
> > 1xT4 GPUを使用すると、実際には17Bモデルを推論できます（なぜなら、私はここで34Bモデルを2xT4で推論する方法を示しました）。17Bモデルから始めると、4bit量子化の後、ディスク上で10GBになり、1xT4の16GB VRAMに簡単に収まります。（更新：おそらく20Bモデルを推論できるかもしれません）
> > 
> > 
> > 


---

> ## Istvan Habram
> 
> エージェントが`def agent_fn(obs, cfg)`という関数を実装する必要があることはどこに記載されていますか？
> 
> 
> > ## Chris Deotteトピック作成者
> > 
> > これはKaggle管理者のスターターノートブック[こちら](https://www.kaggle.com/code/ryanholbrook/llm-20-questions-starter-notebook)や、KaggleのGitHub[こちら](https://github.com/Kaggle/kaggle-environments/tree/master/kaggle_environments/envs/llm_20_questions)を読むことで学びます。これには、私たちのエージェントを実行するコードが示されています。
> > 
> > 
> > 
> > > ## Istvan Habram
> > > 
> > > 今はっきりしました。迅速な回答をありがとう！
> > > 
> > > 
> > > 


---

> ## Toshi
> 
> すばらしいノートブック！
> 
> これを実行したところ、上記のエラーが発生しました
> 
> ImportError: numpy>=1.17,<2.0がこのモジュールの正常な機能に必要ですが、numpy==2.0.0が見つかりました。
> 
> 試してください: pip install transformers -U または、git mainで作業している場合はpip install -e '.[dev]'を実行してください。
> 
> このエラーは見つかりましたか？
> 
> 
> > ## Chris Deotteトピック作成者
> > 
> > いいえ、そのエラーは見たことがありません。ノートブックをそのまま実行していますか？それとも何か変更していますか？ノートブックオプションの環境を「元の状態に固定」に設定していますか？それともKaggleの最新のドッカーを使用していますか？Kaggleの最新がエラーを引き起こしている場合は、「元の状態に固定」を使用する必要があります。
> > 
> > もし何か変更して、numpy==2.0.0が気に入らない原因となっている場合、古いnumpyをインストールすることができます。例: pip install numpy==1.17
> > 
> > 
> > 
> > > ## FullEmpty
> > > >[@cdeotte](https://www.kaggle.com/cdeotte)このノートブックに感謝 - あなたの投稿やコメントから多くを学んでいます。私はKaggleノートブックをマスターしていないが、このノートブックはコピーして実行しますが、ダウンロードして取り込んで実行すると上記のエラーが発生します。「元の状態に固定」でさえ。
> > > >しかし、以下のいずれかで問題を解決できます:
> > > >
> > > > !rm -rf /tmp/submission/lib/numpy-2.0.1.dist-info
> > > > または、好ましくは、
> > > > 
> > > > os.system("pip install accelerate==0.33.0 bitsandbytes==0.43.2 huggingface_hub==0.24.2 -t /tmp/submission/lib")
> > > >
> > > > 


---

> ## Kartikeya Pandey
> > 素晴らしいノートブック。私は多くを学びました。
> 
> 
> 


---

> ## El haddad Mohamed
> 
> 素晴らしいノートブック！とても整理されていて、有益です。👍
> 
> 


---

> ## ISAKA Tsuyoshi
> 
> こんにちは[@cdeotte](https://www.kaggle.com/cdeotte)。このような素晴らしいノートブックを共有してくれてありがとう！
> 
> このノートブックで使用されているモデル(Llama-3-Smaug-8B)についてもっと教えてもらえますか？これは、llama-3モデルよりも優れていますか？
> 
> > ## Chris Deotteトピック作成者
> > 
> > Llama-3-Smaug-8BはLlama-3-8B-Instructに追加のファインチューニングを施したモデルです。いくつかの点でLlama-3-8B-Instructよりも優れていますが、おそらくいくつかの点で劣っています。Smaugがどのように訓練されたかについての研究論文は[こちら](https://arxiv.org/abs/2402.13228)で説明されています。このモデルを発見したのは、ある時点でこのモデルが通常のLlamaよりも高いOpen LLM Leaderboardのスコアを持っていたからです。
> > 
> > もう一つ、Open LLM Leaderboardで良好な結果を出すモデルはjondurbin/bagel-7b-v0.5[こちら](https://huggingface.co/jondurbin/bagel-7b-v0.5)です。これはMistral-7Bに追加のファインチューニングを施したものです。Bagelがどうやって訓練されたのかは、[こちら](https://github.com/jondurbin/bagel)で説明されています。
> > 
> > さらに、Open LLM Leaderboardで良好な結果を出すモデルはQwen/Qwen2-7B-Instruct[こちら](https://huggingface.co/Qwen/Qwen2-7B-Instruct)です。私はQwen2モデルの大ファンです。このv2シリーズは先月リリースされたばかりで、すぐにトップのOpen LLM Leaderboardモデルになりました。
> > 
> > （完全を期すために古典的なモデルとしてLlama3、Mistral、Gemma2、Phi3を挙げます）
> > 
> > 
> > 
> > > ## ISAKA Tsuyoshi
> > >  > 詳細な説明をありがとうございます！たくさんのオプションがありますね。
> > > 
> > > 
