# 要約 
このJupyter Notebookは、Kaggleの「LLM 20 Questions」コンペティションにおいて、単純なボットを構築することを目的としています。ボットの設計は非常に基本的であり、主に以下のような機能を持っています：

1. **質問の一貫性**: ボットは常に「それは物か場所か？」という質問を行います。
2. **単語の推測**: `keywords.py`からランダムに選ばれた単語を推測します。
3. **回答の仕様**: ボットは常に「いいえ」と回答します。

Notebooの概要では、Gemmaモデルが一貫性に欠け、リーダーボードスコア（LB）が約635.5で推移していることが述べられています。

使用している主な手法とライブラリは以下の通りです：
- **Python**: 主なプログラミング言語。
- **JSON**: キーワードデータを扱うために使用されています。
- **os**、**sys**、**glob**、**random**: ファイル操作やランダム選択のために利用されています。

ボットは、指定したパスにあるキーワードを読み込み、その情報を基に返答を行うシンプルな形式をとっています。ボットの出力は、最終的に`/kaggle/working/submission.tar.gz`に書き込まれ、これがコンペティションへの提出物となります。また、ノートブック内には他のユーザーからのコメントも含まれており、内容が初心者に役立つものであることが強調されています。

---


# 用語概説 
以下は、Jupyter Notebookに関連する機械学習・深層学習の初心者がつまずきそうな専門用語の簡単な解説です。

1. **ボット (Bot)**:
   人間を模したプログラムで、自動的にタスクを実行します。このコンペティションでは、具体的な言語モデルを使って20の質問ゲームをプレイするエージェントを指します。

2. **キーワード (Keyword)**:
   特定の質問に対する答えや、推測対象となる単語のリストを指します。このボットでは、ランダムに選択されたキーワードを使って推測を行います。

3. **エンジン/エージェント (Agent)**:
   ボットの実行部分を指し、特定の行動を行うプログラムのことです。このノートブックでは、ボットが質問をする、推測する、答えるという行動を取ります。

4. **ターンタイプ (TurnType)**:
   ゲーム内の現在の状況を示すもので、ボットが「質問する」、「推測する」、「答える」などの行動を取る際に使われます。この情報を元にボットが次に何をするかを決定します。

5. **JSON (JavaScript Object Notation)**:
   データ交換フォーマットの一つで、軽量で可読性が高い特徴があります。このノートブックでは、キーワードのデータをJSON形式で読み込んでいます。

6. **再帰的に探索 (Recursively exploring)**:
   ディレクトリやファイルのツリー構造を深さ優先で調べることを指します。特定のフォルダ内にあるすべてのファイルパスを収集するために使用されます。

7. **tar (Tape Archive)**:
   複数のファイルを単一のアーカイブファイルにまとめて保存するためのUnix系のコマンド。ここでは、ボットの提出物を圧縮して単一のファイルとしてまとめています。

8. **圧縮 (Compiling)**:
   ファイルサイズを小さくする技術のこと。ここでは、提出物を容易に送信できるようにするために、作成したファイルを圧縮しています。

9. **ask/guess/answerの状態遷移**:
   ボットがゲーム内での行動の状態を示しており、それぞれが異なるアクション（質問の送信、単語の推測、回答の送信）を意味します。これによりボットは適切なレスポンスを生成します。

10. **LB (Leaderboard) スコア**:
    コンペティションでのパフォーマンスを示す指標。LBスコアは、ボットの質や、そのボットがどれだけ成功したかを示します。

これらの用語は、初心者がプロジェクトを理解し、進める上で重要な概念や技術です。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Simplest possible submission (LB: ~651.4)
Writes a bot to `/kaggle/working/submission.tar.gz` which will:
- Always **ask** if it a place or a thing
- **Guess** a random word from `keywords.py`
- Always **answer** no

Gemma models seem to be pretty inconsistent at the moment, which hover around LB: ~635.5.

</div>
<div class="column-right">

# 日本語訳

# 可能な限りシンプルな提出物 (LB: 約651.4)
ボットを`/kaggle/working/submission.tar.gz`に書き込みます。このボットは次のことを行います:
- 常に**場所か物品かを聞く**
- `keywords.py`からランダムな単語を**推測する**
- 常に**いいえと答える**

Gemmaモデルは現在あまり一貫性がなく、LBは約635.5で推移しています。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!cd /kaggle/working
!mkdir submission
!readlink -f *
```

</div>
<div class="column-right">

# 日本語訳

```python
!cd /kaggle/working
!mkdir submission
!readlink -f *
```

</div>
</details>

In [None]:
!cd /kaggle/working
!mkdir submission
!readlink -f *

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# add keywords
!cp /kaggle/input/llm-20-questions/llm_20_questions/keywords.py submission/keywords.py
```

</div>
<div class="column-right">

# 日本語訳

```python
# キーワードを追加
!cp /kaggle/input/llm-20-questions/llm_20_questions/keywords.py submission/keywords.py
```

</div>
</details>

In [None]:
# キーワードを追加
!cp /kaggle/input/llm-20-questions/llm_20_questions/keywords.py submission/keywords.py

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile submission/main.py

import os, sys, glob, random, json

from keywords import KEYWORDS_JSON
kws = json.loads(KEYWORDS_JSON)[0]

def agent_fn(obs, cfg):
    if obs.turnType == "ask": response = 'Is it a thing or a place?'
    elif obs.turnType == "guess": response = random.choice(kws['words'])['keyword']
    elif obs.turnType == "answer": response = 'no'
    return response
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile submission/main.py

import os, sys, glob, random, json

from keywords import KEYWORDS_JSON
kws = json.loads(KEYWORDS_JSON)[0]  # KEYWORDS_JSONをロードし、最初の項目を変数kwsに格納します。

def agent_fn(obs, cfg):
    if obs.turnType == "ask": response = 'Is it a thing or a place?'  # 質問のタイプが「聞く」の場合、質問文を設定します。
    elif obs.turnType == "guess": response = random.choice(kws['words'])['keyword']  # 質問のタイプが「推測」の場合、キーワードリストからランダムに単語を選択します。
    elif obs.turnType == "answer": response = 'no'  # 質問のタイプが「答える」の場合、常に「いいえ」と返答します。
    return response  # 返答を返します。
```

</div>
</details>

In [None]:
%%writefile submission/main.py

import os, sys, glob, random, json

from keywords import KEYWORDS_JSON
kws = json.loads(KEYWORDS_JSON)[0]  # KEYWORDS_JSONをロードし、最初の項目を変数kwsに格納します。

def agent_fn(obs, cfg):
    if obs.turnType == "ask": response = 'Is it a thing or a place?'  # 質問のタイプが「聞く」の場合、質問文を設定します。
    elif obs.turnType == "guess": response = random.choice(kws['words'])['keyword']  # 質問のタイプが「推測」の場合、キーワードリストからランダムに単語を選択します。
    elif obs.turnType == "answer": response = 'no'  # 質問のタイプが「答える」の場合、常に「いいえ」と返答します。
    return response  # 返答を返します。

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!tar czf submission.tar.gz -C /kaggle/working/submission .
```

</div>
<div class="column-right">

# 日本語訳

```python
!tar czf submission.tar.gz -C /kaggle/working/submission .
```

</div>
</details>

In [None]:
!tar czf submission.tar.gz -C /kaggle/working/submission .

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!ls
!ls submission
```

</div>
<div class="column-right">

# 日本語訳

```python
!ls
!ls submission
```

</div>
</details>

In [None]:
!ls
!ls submission

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
import numpy as np
import pandas as pd
import os
for dirname, _, filenames in os.walk('/kaggle'):
    for filename in filenames:
        print(os.path.join(dirname, filename))
```

</div>
<div class="column-right">

# 日本語訳

```python
import numpy as np
import pandas as pd
import os
for dirname, _, filenames in os.walk('/kaggle'):  # '/kaggle' ディレクトリ内を再帰的に探索します。
    for filename in filenames:
        print(os.path.join(dirname, filename))  # 各ファイルの完全なパスを表示します。
```

</div>
</details>

In [None]:
import numpy as np
import pandas as pd
import os
for dirname, _, filenames in os.walk('/kaggle'):  # '/kaggle' ディレクトリ内を再帰的に探索します。
    for filename in filenames:
        print(os.path.join(dirname, filename))  # 各ファイルの完全なパスを表示します。

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!ls
!tar -xzvf submission.tar.gz 
!cat main.py
!ls
```

</div>
<div class="column-right">

# 日本語訳

```python
!ls
!tar -xzvf submission.tar.gz 
!cat main.py  # main.pyの内容を表示します。
!ls
```

</div>
</details>

In [None]:
!ls
!tar -xzvf submission.tar.gz 
!cat main.py  # main.pyの内容を表示します。
!ls