# 要約 
このJupyter Notebookは、Kaggleの「20の質問」コンペティションにおけるAIエージェントの開発を目的としています。具体的には、言語モデルである「Phi-3」を用いて、質問者と回答者の役割を持つ2つのエージェントが協力しながら、特定の単語を推測するゲームをプレイします。

### 問題設定
このノートブックは、「20の質問」というゲームにおいて、与えられた情報に基づき効率的に推測を行うAIエージェントを構築する問題に取り組んでいます。エージェントは、質問を通じて情報を引き出し、その情報に基づいて正しい答えを導き出さなければなりません。

### 使用する手法やライブラリ
1. **パッケージのインストール**: `tqdm`, `pydantic`, `transformers`ライブラリを使用して、プログラムの作業を容易にしています。これにより、モデルの読み込みやデータの構造定義が可能になります。
   
2. **モデルの設定**: Hugging Faceの`transformers`ライブラリを通じて、「Phi-3-mini-4k-instruct」モデルを使用する準備をしています。このモデルはテキスト生成能力を持ち、質問応答コンテキストでの操作に適しています。

3. **データ管理**: `pydantic`を使ったデータクラスで、Kaggleの観察データや設定情報を管理しています。これにより、コードの可読性と保守性が向上します。

4. **LLMのインタラクション**: 質問と応答を生成する`ask`関数を定義して、言語モデルにプロンプトを送り、生成されたテキストを得るプロセスを整備しています。

5. **プレイ関数**: ゲームのロジックを処理する`play`関数では、受け取った観察データに基づいて質問者または回答者のプロンプトを生成し、適切な応答を得る仕組みが実装されています。

### まとめ
このJupyter Notebookは、「20の質問」ゲームのために「Phi-3」モデルを設定し、それを利用したAIエージェントを作成するための手順を示しています。使用される手法は、NLU (自然言語理解) および生成的AIの要素を取り入れたものであり、Kaggleコンペティションのルールを遵守しつつ、言語モデルの能力を最大限に活用しています。最終的には、提出ファイルを作成し、圧縮して送信する流れで完結します。

---


# 用語概説 
以下は、提示されたJupyterノートブックの内容から、機械学習・深層学習の初心者がつまずきそうな専門用語の解説です。

1. **tqdm**:
   - Pythonで使用されるプログレスバーライブラリ。ループの進捗状況を視覚的に表示し、長い処理の進捗を把握しやすくする。

2. **pydantic**:
   - データバリデーションや設定管理を簡素化するためのライブラリ。Pythonのデータクラスを利用して、型安全なデータ管理を提供する。

3. **transformers**:
   - Hugging Faceが提供するライブラリで、様々な自然言語処理モデル（BERT、GPT、T5など）を簡単に使用できるようにする。特に事前学習済みモデルを利用するためのシンプルなインターフェースを持つ。

4. **gguf**:
   - 特定のモデルファイル形式で、この場合はPhi-3が使用する重みや設定を持つファイル。一般的なTensorFlowやPyTorchのモデルとは異なる特定の形式。

5. **device_map**:
   - モデルをデプロイする際に、どのデバイス（CPUまたはGPU）で各部分を計算するかを指定するための設定。特に大規模モデルでは、メモリ使用量を最適化するために重要。

6. **torch_dtype**:
   - PyTorchで使用するデータ型を指定するオプション。モデルのメモリ使用量や計算精度に影響を与える。

7. **pipeline**:
   - transformersライブラリで提供される高レベルの機能で、特定の自然言語処理タスク（テキスト生成、分類など）を簡単に実行できるようにする。

8. **max_new_tokens**:
   - モデルが生成する新しいトークンの最大数を指定するパラメータ。出力の長さを制御するために重要。

9. **dataclass**:
   - Python 3.7以降で導入された構文で、クラスを簡単に作成できる機能。属性の定義と自動生成されるイニシャライザ、比較メソッドを持つ。

10. **Literal**:
    - Pythonの型ヒントで、特定のリテラル値のみを許容する型を定義するための機能。これにより、関数の引数として許可される値を制限できる。

11. **ask**:
    - 質問を行う関数で、与えられたプロンプトに基づいてモデルが生成する回答を取得する。

12. **回帰的なモデル**:
    - モデルが以前の入力と出力情報を基に次の出力を決定するプロセス。この文脈では、質問と回答のやり取りに関連している。

13. **温度 (temperature)**:
    - テキスト生成で使用されるパラメータで、出力の確率分布を調整する。高い値に設定すると多様性が増し、低い値ではより決定的な結果が得られる。

14. **オーバーヘッドタイム (remainingOverageTime)**:
    - 残りの追加時間を示す変数。特定のタスクに使用可能な残りのリソースを示す。

15. **引数 (args)**:
    - 関数に渡される入力値のこと。プログラムの動作を修正したり、異なるデータを処理したりするために使用する。

これらの用語は、ノートブックの内容を理解するために重要ですが、初学者には馴染みが薄い可能性のあるものを中心に解説しています。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Twenty Questions with Phi-3

## Install packages to the submission folder

</div>
<div class="column-right">

# 日本語訳

# Phi-3との20の質問

## 提出フォルダにパッケージをインストールする


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
pip install -U -t /kaggle/working/submission/lib tqdm pydantic transformers -qq
```

</div>
<div class="column-right">

# 日本語訳

```python
pip install -U -t /kaggle/working/submission/lib tqdm pydantic transformers -qq
```

</div>
</details>

In [None]:
pip install -U -t /kaggle/working/submission/lib tqdm pydantic transformers -qq

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Llama.cpp setup (unused as of now)

</div>
<div class="column-right">

# 日本語訳

## Llama.cppの設定（現時点では未使用）


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# !CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install -t /kaggle/working/submission/lib llama-cpp-python \
#   --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cu121
```

</div>
<div class="column-right">

# 日本語訳

```python
# !CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install -t /kaggle/working/submission/lib llama-cpp-python \
#   --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cu121
```

</div>
</details>

In [None]:
# !CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install -t /kaggle/working/submission/lib llama-cpp-python \
#   --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cu121

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# mkdir -p /kaggle/working/submission/lib/phi3/
```

</div>
<div class="column-right">

# 日本語訳

```python
# mkdir -p /kaggle/working/submission/lib/phi3/
```

</div>
</details>

In [None]:
# mkdir -p /kaggle/working/submission/lib/phi3/

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# !curl -L "https://huggingface.co/microsoft/Phi-3-mini-4k-instruct-gguf/resolve/main/Phi-3-mini-4k-instruct-fp16.gguf?download=true" > "/kaggle/working/submission/lib/phi3/model.gguf"
```

</div>
<div class="column-right">

# 日本語訳

```python
# !curl -L "https://huggingface.co/microsoft/Phi-3-mini-4k-instruct-gguf/resolve/main/Phi-3-mini-4k-instruct-fp16.gguf?download=true" > "/kaggle/working/submission/lib/phi3/model.gguf"
```

</div>
</details>

In [None]:
# !curl -L "https://huggingface.co/microsoft/Phi-3-mini-4k-instruct-gguf/resolve/main/Phi-3-mini-4k-instruct-fp16.gguf?download=true" > "/kaggle/working/submission/lib/phi3/model.gguf"

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# import os, sys
# KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
# if os.path.exists(KAGGLE_AGENT_PATH):
#     sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
#     WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "lib/phi3/model.gguf")
# else:
#     sys.path.insert(0, "/kaggle/working/submission/lib")
#     WEIGHTS_PATH = "/kaggle/working/submission/lib/phi3/model.gguf"
```

</div>
<div class="column-right">

# 日本語訳

```python
# import os, sys
# KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
# if os.path.exists(KAGGLE_AGENT_PATH):
#     sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
#     WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "lib/phi3/model.gguf")
# else:
#     sys.path.insert(0, "/kaggle/working/submission/lib")
#     WEIGHTS_PATH = "/kaggle/working/submission/lib/phi3/model.gguf"
```

</div>
</details>

In [None]:
# import os, sys
# KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
# if os.path.exists(KAGGLE_AGENT_PATH):
#     sys.path.insert(0, os.path.join(KAGGLE_AGENT_PATH, 'lib'))
#     WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "lib/phi3/model.gguf")
# else:
#     sys.path.insert(0, "/kaggle/working/submission/lib")
#     WEIGHTS_PATH = "/kaggle/working/submission/lib/phi3/model.gguf"

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%ls
```

</div>
<div class="column-right">

# 日本語訳

```python
%ls
```

</div>
</details>

In [None]:
%ls

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Write the submission file

</div>
<div class="column-right">

# 日本語訳

## 提出ファイルの作成


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%writefile submission/main.py
from pydantic.dataclasses import dataclass
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
from typing import Literal, List
import os, sys, json

KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    os.chdir(os.path.join(KAGGLE_AGENT_PATH, 'lib'))
    #WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "lib/phi3/model.gguf")
else:
    os.chdir("/kaggle/working/submission/lib")
    #WEIGHTS_PATH = "/kaggle/working/submission/lib/phi3/model.gguf"
    
print(f"Current Directory is {os.getcwd()}. \nFiles in here: {', '.join(os.listdir())}")

#Import model

model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",  
    device_map="cuda", torch_dtype="auto", trust_remote_code=True,
    cache_dir="./huggingface"
    
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct", cache_dir="./huggingface")
hf_llm = pipeline("text-generation", model=model, tokenizer=tokenizer)

def ask(prompt: str, max_new_tokens=100) -> str:
    result = hf_llm(text_inputs=prompt, return_full_text=False, temperature=0.2, do_sample=False, max_new_tokens=max_new_tokens)
    return result[0]['generated_text']

assert ask("<|user|>\nHello!<|end|>\n<|assistant|>")

@dataclass
class KaggleObservation:
  remainingOverageTime: int | float
  step: int

  questions: list[str]
  answers: list[str]
  guesses: list[str]

  role: Literal["guesser", "answerer"]
  turnType: Literal["ask", "guess", "answer"]

  keyword: str
  category: str

@dataclass
class KaggleConfig:
  episodeSteps: int
  actTimeout: int | float
  runTimeout: int | float
  agentTimeout: int | float
  __raw_path__: str

# llm = Llama(
#   model_path=WEIGHTS_PATH,  # path to GGUF file
#   n_ctx=2048,  # The max sequence length to use - note that longer sequence lengths require much more resources
#   n_threads=4, # The number of CPU threads to use, tailor to your system and the resulting performance
#   n_gpu_layers=35, # The number of layers to offload to GPU, if you have GPU acceleration available. Set to 0 if no GPU acceleration is available on your system.
#   use_mlock=True, # Whether to use mlock to lock the memory in RAM, preventing it from being swapped to disk. This is useful for large models that don't fit in RAM.
#   use_mmap=False, #
# )

def get_context_prompt(observation: KaggleObservation) -> str:
  questions = observation.questions
  answers = observation.answers

  history_prompt = ""
  for index in range(len(max(questions, answers))):
    history_prompt += f"<|user|>\n{questions[index]}<|end|>\n" if index < len(questions) else ""
    history_prompt += f"<|assistant|>\n{answers[index]}<|end|>\n" if index < len(answers) else ""
  #history_prompt += "<|assistant|>\n"
  
  return history_prompt

def get_guesser_prompt(observation: KaggleObservation) -> str:
  prompt = f"<|user|>\nLet's play 20 Questions. You are playing the role of the {observation.role.title()}.<|end|>\n"
  prompt += get_context_prompt(observation)

  if observation.turnType == "ask":
    prompt += f"<|user|>\nTake a break, and ask a short yes-or-no question that would be useful to determine what the city I'm thinking about. Previous questions have been listed above. KEEP YOUR QUESTION ONE SENTENCE ONLY! Do not add any explaination to why you chose the question.<|end|>\n"
  elif observation.turnType == "guess":
    prompt += f"<|user|>\nNow, based on the information above, guess what city I'm thinking about, " 
    prompt += f"which aren't these: {', '.join(observation.guesses)}."
    prompt += f"Now, Make an informed guess, and only provide one word!<|end|>\n"
  else:
    raise ValueError(f"Invalid turnType: {observation.turnType}\n\n{observation}")
  
  prompt += "<|assistant|>\n"

  return prompt

def get_answerer_prompt(observation: KaggleObservation) -> str:
  prompt = f"<|user|>\nYou are a highly experienced tour guide specialized in the city {', '.join(observation.keyword.split(' '))}.\n"
  prompt += "You must answer a question about this city accurately, but only using the word **yes** or **no**.<|end|>\n"

  prompt += f"<|user|>{observation.questions[-1]}<|end|>\n"
  prompt += "<|assistant|>\n"
  return prompt


def play(obs, conf):
  print("Observation: " + json.dumps(obs, indent=2, ensure_ascii=False))
  print("Confing: " + json.dumps(conf, indent=2, ensure_ascii=False))
  observation = KaggleObservation(**obs)
  config = KaggleConfig(**conf)
  if observation.role == "guesser":
    prompt = get_guesser_prompt(observation)
    result = ask(prompt, max_new_tokens=40).split("\n")[0].strip()#, stop=["<|end|>"], max_tokens=256, temperature=0.5, echo=False)
  elif observation.role == "answerer":
    prompt = get_answerer_prompt(observation)
    answer = ask(prompt, max_new_tokens=20)#, stop=["<|end|>"], max_tokens=20, temperature=0.5, echo=False)
    result = "no" if "no" in answer else "yes"
  else:
    raise ValueError(f"Invalid role: {observation.role}\n\n{observation}")
  print(f"Result: {result}")
  return result
```

</div>
<div class="column-right">

# 日本語訳

```python
%%writefile submission/main.py
from pydantic.dataclasses import dataclass
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
from typing import Literal, List
import os, sys, json

KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    os.chdir(os.path.join(KAGGLE_AGENT_PATH, 'lib'))
    #WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "lib/phi3/model.gguf")
else:
    os.chdir("/kaggle/working/submission/lib")
    #WEIGHTS_PATH = "/kaggle/working/submission/lib/phi3/model.gguf"
    
print(f"現在のディレクトリ: {os.getcwd()}. \nこのディレクトリ内のファイル: {', '.join(os.listdir())}")

# モデルのインポート

model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",  
    device_map="cuda", torch_dtype="auto", trust_remote_code=True,
    cache_dir="./huggingface"
    
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct", cache_dir="./huggingface")
hf_llm = pipeline("text-generation", model=model, tokenizer=tokenizer)

def ask(prompt: str, max_new_tokens=100) -> str:
    result = hf_llm(text_inputs=prompt, return_full_text=False, temperature=0.2, do_sample=False, max_new_tokens=max_new_tokens)
    return result[0]['generated_text']

assert ask("<|user|>\nHello!<|end|>\n<|assistant|>")

@dataclass
class KaggleObservation:
  remainingOverageTime: int | float
  step: int

  questions: list[str]
  answers: list[str]
  guesses: list[str]

  role: Literal["guesser", "answerer"]
  turnType: Literal["ask", "guess", "answer"]

  keyword: str
  category: str

@dataclass
class KaggleConfig:
  episodeSteps: int
  actTimeout: int | float
  runTimeout: int | float
  agentTimeout: int | float
  __raw_path__: str

# llm = Llama(
#   model_path=WEIGHTS_PATH,  # GGUFファイルへのパス
#   n_ctx=2048,  # 使用する最大シーケンス長 - 長いシーケンスは多くのリソースを必要とします
#   n_threads=4, # 使用するCPUスレッドの数、システムと結果のパフォーマンスに合わせて調整
#   n_gpu_layers=35, # GPUにオフロードする層の数、GPUアクセラレーションが利用可能な場合は設定。利用できない場合は0に設定。
#   use_mlock=True, # RAM内のメモリをロックし、ディスクにスワップされないようにするかどうか。 RAMに収まらない大きなモデルに有用。
#   use_mmap=False, #
# )

def get_context_prompt(observation: KaggleObservation) -> str:
  questions = observation.questions
  answers = observation.answers

  history_prompt = ""
  for index in range(len(max(questions, answers))):
    history_prompt += f"<|user|>\n{questions[index]}<|end|>\n" if index < len(questions) else ""
    history_prompt += f"<|assistant|>\n{answers[index]}<|end|>\n" if index < len(answers) else ""
  #history_prompt += "<|assistant|>\n"
  
  return history_prompt

def get_guesser_prompt(observation: KaggleObservation) -> str:
  prompt = f"<|user|>\n20の質問をしましょう。あなたは{observation.role.title()}の役割を果たしています。<|end|>\n"
  prompt += get_context_prompt(observation)

  if observation.turnType == "ask":
    prompt += f"<|user|>\n休憩して、私が考えている都市を特定するために役立つ短いはい/いいえの質問を一つ聞いてください。前の質問は上にリストされています。質問は一文だけでお願いします！ 質問の理由を追加しないでください。<|end|>\n"
  elif observation.turnType == "guess":
    prompt += f"<|user|>\n上の情報に基づいて、私が考えている都市を当ててください。" 
    prompt += f"これらの都市を除いて: {', '.join(observation.guesses)}。"
    prompt += f"十分な情報を元に、一言で答えてください！<|end|>\n"
  else:
    raise ValueError(f"無効なturnType: {observation.turnType}\n\n{observation}")
  
  prompt += "<|assistant|>\n"

  return prompt

def get_answerer_prompt(observation: KaggleObservation) -> str:
  prompt = f"<|user|>\nあなたは{', '.join(observation.keyword.split(' '))}の都市に特化した非常に経験豊富なツアーガイドです。\n"
  prompt += "この都市についての質問には、正確に答えなければなりませんが、**はい**または**いいえ**の言葉だけを使ってください。<|end|>\n"

  prompt += f"<|user|>{observation.questions[-1]}<|end|>\n"
  prompt += "<|assistant|>\n"
  return prompt


def play(obs, conf):
  print("観察: " + json.dumps(obs, indent=2, ensure_ascii=False))
  print("設定: " + json.dumps(conf, indent=2, ensure_ascii=False))
  observation = KaggleObservation(**obs)
  config = KaggleConfig(**conf)
  if observation.role == "guesser":
    prompt = get_guesser_prompt(observation)
    result = ask(prompt, max_new_tokens=40).split("\n")[0].strip()#, stop=["<|end|>"], max_tokens=256, temperature=0.5, echo=False)
  elif observation.role == "answerer":
    prompt = get_answerer_prompt(observation)
    answer = ask(prompt, max_new_tokens=20)#, stop=["<|end|>"], max_tokens=20, temperature=0.5, echo=False)
    result = "no" if "no" in answer else "yes"
  else:
    raise ValueError(f"無効な役割: {observation.role}\n\n{observation}")
  print(f"結果: {result}")
  return result
```

</div>
</details>

In [None]:
%%writefile submission/main.py
from pydantic.dataclasses import dataclass
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
from typing import Literal, List
import os, sys, json

KAGGLE_AGENT_PATH = "/kaggle_simulations/agent/"
if os.path.exists(KAGGLE_AGENT_PATH):
    os.chdir(os.path.join(KAGGLE_AGENT_PATH, 'lib'))
    #WEIGHTS_PATH = os.path.join(KAGGLE_AGENT_PATH, "lib/phi3/model.gguf")
else:
    os.chdir("/kaggle/working/submission/lib")
    #WEIGHTS_PATH = "/kaggle/working/submission/lib/phi3/model.gguf"
    
print(f"現在のディレクトリ: {os.getcwd()}. \nこのディレクトリ内のファイル: {', '.join(os.listdir())}")

# モデルのインポート

model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",  
    device_map="cuda", torch_dtype="auto", trust_remote_code=True,
    cache_dir="./huggingface"
    
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct", cache_dir="./huggingface")
hf_llm = pipeline("text-generation", model=model, tokenizer=tokenizer)

def ask(prompt: str, max_new_tokens=100) -> str:
    result = hf_llm(text_inputs=prompt, return_full_text=False, temperature=0.2, do_sample=False, max_new_tokens=max_new_tokens)
    return result[0]['generated_text']

assert ask("<|user|>\nHello!<|end|>\n<|assistant|>")

@dataclass
class KaggleObservation:
  remainingOverageTime: int | float
  step: int

  questions: list[str]
  answers: list[str]
  guesses: list[str]

  role: Literal["guesser", "answerer"]
  turnType: Literal["ask", "guess", "answer"]

  keyword: str
  category: str

@dataclass
class KaggleConfig:
  episodeSteps: int
  actTimeout: int | float
  runTimeout: int | float
  agentTimeout: int | float
  __raw_path__: str

# llm = Llama(
#   model_path=WEIGHTS_PATH,  # GGUFファイルへのパス
#   n_ctx=2048,  # 使用する最大シーケンス長 - 長いシーケンスは多くのリソースを必要とします
#   n_threads=4, # 使用するCPUスレッドの数、システムと結果のパフォーマンスに合わせて調整
#   n_gpu_layers=35, # GPUにオフロードする層の数、GPUアクセラレーションが利用可能な場合は設定。利用できない場合は0に設定。
#   use_mlock=True, # RAM内のメモリをロックし、ディスクにスワップされないようにするかどうか。 RAMに収まらない大きなモデルに有用。
#   use_mmap=False, #
# )

def get_context_prompt(observation: KaggleObservation) -> str:
  questions = observation.questions
  answers = observation.answers

  history_prompt = ""
  for index in range(len(max(questions, answers))):
    history_prompt += f"<|user|>\n{questions[index]}<|end|>\n" if index < len(questions) else ""
    history_prompt += f"<|assistant|>\n{answers[index]}<|end|>\n" if index < len(answers) else ""
  #history_prompt += "<|assistant|>\n"
  
  return history_prompt

def get_guesser_prompt(observation: KaggleObservation) -> str:
  prompt = f"<|user|>\n20の質問をしましょう。あなたは{observation.role.title()}の役割を果たしています。<|end|>\n"
  prompt += get_context_prompt(observation)

  if observation.turnType == "ask":
    prompt += f"<|user|>\n休憩して、私が考えている都市を特定するために役立つ短いはい/いいえの質問を一つ聞いてください。前の質問は上にリストされています。質問は一文だけでお願いします！ 質問の理由を追加しないでください。<|end|>\n"
  elif observation.turnType == "guess":
    prompt += f"<|user|>\n上の情報に基づいて、私が考えている都市を当ててください。" 
    prompt += f"これらの都市を除いて: {', '.join(observation.guesses)}。"
    prompt += f"十分な情報を元に、一言で答えてください！<|end|>\n"
  else:
    raise ValueError(f"無効なturnType: {observation.turnType}\n\n{observation}")
  
  prompt += "<|assistant|>\n"

  return prompt

def get_answerer_prompt(observation: KaggleObservation) -> str:
  prompt = f"<|user|>\nあなたは{', '.join(observation.keyword.split(' '))}の都市に特化した非常に経験豊富なツアーガイドです。\n"
  prompt += "この都市についての質問には、正確に答えなければなりませんが、**はい**または**いいえ**の言葉だけを使ってください。<|end|>\n"

  prompt += f"<|user|>{observation.questions[-1]}<|end|>\n"
  prompt += "<|assistant|>\n"
  return prompt


def play(obs, conf):
  print("観察: " + json.dumps(obs, indent=2, ensure_ascii=False))
  print("設定: " + json.dumps(conf, indent=2, ensure_ascii=False))
  observation = KaggleObservation(**obs)
  config = KaggleConfig(**conf)
  if observation.role == "guesser":
    prompt = get_guesser_prompt(observation)
    result = ask(prompt, max_new_tokens=40).split("\n")[0].strip()#, stop=["<|end|>"], max_tokens=256, temperature=0.5, echo=False)
  elif observation.role == "answerer":
    prompt = get_answerer_prompt(observation)
    answer = ask(prompt, max_new_tokens=20)#, stop=["<|end|>"], max_tokens=20, temperature=0.5, echo=False)
    result = "no" if "no" in answer else "yes"
  else:
    raise ValueError(f"無効な役割: {observation.role}\n\n{observation}")
  print(f"結果: {result}")
  return result

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Just checkin

</div>
<div class="column-right">

# 日本語訳

## 確認中


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from submission.main import *
```

</div>
<div class="column-right">

# 日本語訳

```python
from submission.main import *
```

</div>
</details>

In [None]:
from submission.main import *

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
assert play({
  'remainingOverageTime': 300, 
  'step': 0, 
  'questions': [], 
  'guesses': [], 
  'answers': [], 
  'role': 'guesser', 
  'turnType': 'ask', 
  'keyword': '', #eg. bangkok
  'category': '', #eg. city
}, {
  'episodeSteps': 61, 
  'actTimeout': 60, 
  'runTimeout': 9600, 
  'agentTimeout': 3600, 
  '__raw_path__': '/kaggle_simulations/agent/main.py'
})
```

</div>
<div class="column-right">

# 日本語訳

```python
assert play({
  'remainingOverageTime': 300, 
  'step': 0, 
  'questions': [], 
  'guesses': [], 
  'answers': [], 
  'role': 'guesser', 
  'turnType': 'ask', 
  'keyword': '', #例: バンコク
  'category': '', #例: 都市
}, {
  'episodeSteps': 61, 
  'actTimeout': 60, 
  'runTimeout': 9600, 
  'agentTimeout': 3600, 
  '__raw_path__': '/kaggle_simulations/agent/main.py'
})
```

</div>
</details>

In [None]:
assert play({
  'remainingOverageTime': 300, 
  'step': 0, 
  'questions': [], 
  'guesses': [], 
  'answers': [], 
  'role': 'guesser', 
  'turnType': 'ask', 
  'keyword': '', #例: バンコク
  'category': '', #例: 都市
}, {
  'episodeSteps': 61, 
  'actTimeout': 60, 
  'runTimeout': 9600, 
  'agentTimeout': 3600, 
  '__raw_path__': '/kaggle_simulations/agent/main.py'
})

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
assert play({
  'remainingOverageTime': 300, 
  'step': 0, 
  'questions': ["Is the city you're thinking of located in North America?"], 
  'guesses': [], 
  'answers': [], 
  'role': 'answerer', 
  'turnType': 'answer', 
  'keyword': '', #eg. bangkok
  'category': '', #eg. city
}, {
  'episodeSteps': 61, 
  'actTimeout': 60, 
  'runTimeout': 9600, 
  'agentTimeout': 3600, 
  '__raw_path__': '/kaggle_simulations/agent/main.py'
})
```

</div>
<div class="column-right">

# 日本語訳

```python
assert play({
  'remainingOverageTime': 300, 
  'step': 0, 
  'questions': ["あなたが考えている都市は北アメリカにありますか？"], 
  'guesses': [], 
  'answers': [], 
  'role': 'answerer', 
  'turnType': 'answer', 
  'keyword': '', #例: バンコク
  'category': '', #例: 都市
}, {
  'episodeSteps': 61, 
  'actTimeout': 60, 
  'runTimeout': 9600, 
  'agentTimeout': 3600, 
  '__raw_path__': '/kaggle_simulations/agent/main.py'
})
```

</div>
</details>

In [None]:
assert play({
  'remainingOverageTime': 300, 
  'step': 0, 
  'questions': ["あなたが考えている都市は北アメリカにありますか？"], 
  'guesses': [], 
  'answers': [], 
  'role': 'answerer', 
  'turnType': 'answer', 
  'keyword': '', #例: バンコク
  'category': '', #例: 都市
}, {
  'episodeSteps': 61, 
  'actTimeout': 60, 
  'runTimeout': 9600, 
  'agentTimeout': 3600, 
  '__raw_path__': '/kaggle_simulations/agent/main.py'
})

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Archiving the directory into a tar.gz to submit

</div>
<div class="column-right">

# 日本語訳

## tar.gz形式でディレクトリをアーカイブして提出する


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!apt install pigz pv > /dev/null
```

</div>
<div class="column-right">

# 日本語訳

```python
!apt install pigz pv > /dev/null
```

</div>
</details>

In [None]:
!apt install pigz pv > /dev/null

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%cd /kaggle/working/
```

</div>
<div class="column-right">

# 日本語訳

```python
%cd /kaggle/working/
```

</div>
</details>

In [None]:
%cd /kaggle/working/

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .
```

</div>
<div class="column-right">

# 日本語訳

```python
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .
```

</div>
</details>

In [None]:
!tar --use-compress-program='pigz --fast --recursive | pv' -cf submission.tar.gz -C /kaggle/working/submission .

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
print("Success.")
```

</div>
<div class="column-right">

# 日本語訳

```python
print("成功しました。")
```

</div>
</details>

In [None]:
print("成功しました。")