# 要約 
このJupyter Notebookは、「LMSYS - Chatbot Arena」コンペティションに関連するタスクに取り組んでいます。目的は、異なる大規模言語モデル（LLM）が生成した応答に基づいて、どちらのモデルの応答がユーザーに好まれるかを予測することです。

## 問題の取り組み
Notebookでは、ユーザーのプロンプトとそれに対する二つのモデルの応答を組み合わせたテキストデータを使用して、モデルの応答の好みを予測します。具体的には、トレーニングデータを取得し、トークン化してラベル付きデータを準備し、最終的に深層学習モデルをトレーニングしてテストデータに対する予測を行います。

## 使用された手法とライブラリ
以下の手法とライブラリが使用されています：

1. **ライブラリのインポート**:
   - 基本的なオペレーションのために`os`, `gc`, `re`, `time`, `random`などの標準ライブラリを使用。
   - 数値計算とデータ操作のために`NumPy`と`Pandas`を使用。
   - ビジュアライゼーションのために`Matplotlib`をインポート。
   - トークン化と深層学習モデルのために`PyTorch`と`Transformers`ライブラリを使用。
   - モデル評価のために`sklearn.metrics`から`accuracy_score`をインポート。

2. **データの前処理**:
   - トレーニングデータの読み込み、ユーザーのプロンプトとモデルの応答を組み合わせた新しいテキスト列を作成。
   - 入力テキストをトークン化し、入力IDとアテンションマスクを生成。

3. **モデルの構築**:
   - Kerasを用いてLSTM（長短期記憶）とCNN（畳み込みニューラルネットワーク）のアーキテクチャを組み合わせた複合モデルを定義。バッチ正規化やドロップアウトなどのテクニックを使用して、過学習を防止。
   - モデルのコンパイルとトレーニングが行われ、精度や損失といったメトリクスで評価されます。

4. **予測と提出ファイルの作成**:
   - テストデータに対してモデルを適用し、予測を行った後、結果をCSVフォーマットで保存します。

このNotebookは、深層学習を利用して人間の好みに基づく応答の予測を行うための包括的な手法を示しており、実際の機械学習パイプラインにおける重要な工程を構成しています。

---


# 用語概説 
以下は与えられたJupyter notebookの内容に基づいて、機械学習・深層学習の初心者がつまずきそうなマイナーな専門用語や特有のドメイン知識に関する解説です。

1. **トークナイザー (Tokenizer)**:
   テキストデータを処理する際に、文章を単語やサブ単語に分割するツール。自然言語処理では、モデルに入力するためにテキストを数値に変換する必要があり、そのための第一歩がトークナイザーによるトークン化である。

2. **パディング (Padding)**:
   不足する長さの情報を埋めるために適用される手法。Deep Learningでは、入力データのサイズを揃えるために、特定の長さまで無意味なデータ（例えば、0）を追加することが多い。これはLSTMやCNNなどのモデルが一定のサイズのデータを要求するために必要である。

3. **アテンションマスク (Attention Mask)**:
   Attention機構を持つモデル（特にTransformerアーキテクチャ）で、パディングされた部分をモデルが無視できるようにするためのマスク。値が0の位置は無視され、1の位置のみが計算に使われる。

4. **バッチ正規化 (Batch Normalization)**:
   ニューラルネットワークのトレーニング中に、各ミニバッチの出力を正規化する技術。これにより、学習の安定性と速度が向上し、過学習を防ぐ助けとなる。特に深いネットワークで有効。

5. **ドロップアウト (Dropout)**:
   学習中にランダムにニューロンを無効化（0にする）する手法。これにより、過学習を防ぎ、モデルの一般化能力を向上させる。特に深層学習モデルでよく使用される。

6. **グローバル最大プーリング (Global Max Pooling)**:
   畳み込みニューラルネットワークの出力を圧縮する手法で、各フィルターから最大の値を取得し、新たな特徴ベクトルを形成する。この手法は、特徴の次元削減や、異なるサイズの入力に対応するために有用。

7. **LSTM (長短期記憶) (Long Short-Term Memory)**:
   RNN（リカレントニューラルネットワーク）の一種で、長期依存関係を学習するために設計された。このモデルは、情報の保持と忘却を制御するゲート構造を持つ。

8. **アダデルタ (Adadelta)**:
   学習率を調整するオプティマイザーの一種で、過去の勾配の情報を使用して更新を行う。これにより、学習率が適応的に変化し、モデルの収束を助ける。

9. **エポック (Epoch)**:
   データセット全体がモデルを通過した回数を指し、トレーニングプロセスにおいて重要な概念。エポック数が多すぎると過学習が発生しやすくなる。

10. **カテゴリカルクロスエントロピー (Categorical Crossentropy)**:
   多クラス分類において、ターゲットと予測の間の差異を測定するために使われる損失関数。予測確率が正解ラベルに近いほど損失が低くなる。

これらの用語について理解しておくと、ノートブックのコードやその背後にある理論をより深く理解できるでしょう。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Import libraries

</div>
<div class="column-right">

# 日本語訳

## ライブラリのインポート

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
import os
import gc
import re
from time import time
import random
import warnings
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from tqdm.auto import tqdm

import torch
import transformers
from sklearn.metrics import accuracy_score
from transformers import AutoTokenizer, LlamaModel, LlamaForSequenceClassification, AutoModel
from transformers import LlamaForCausalLM, LlamaTokenizer
import torch.nn.functional as F
np.random.seed(1337)

```

</div>
<div class="column-right">

# 日本語訳

```python
import os  # オペレーティングシステムとのやり取りをするためのライブラリをインポートします
import gc  # ガーベジコレクションを扱うためのライブラリをインポートします
import re  # 正規表現を使用するためのライブラリをインポートします
from time import time  # 時間を計測するためのtime関数をインポートします
import random  # ランダムな数値を生成するためのライブラリをインポートします
import warnings  # 警告を管理するためのライブラリをインポートします
import numpy as np  # 数値計算を行うためのNumPyライブラリをインポートします
import pandas as pd  # データ操作と解析を行うためのPandasライブラリをインポートします
import matplotlib.pyplot as plt  # グラフを描画するためのMatplotlibライブラリをインポートします
from tqdm.auto import tqdm  # 進捗状況を表示するためのtqdmライブラリをインポートします

import torch  # PyTorchライブラリをインポートします
import transformers  # トランスフォーマモデルを扱うためのライブラリをインポートします
from sklearn.metrics import accuracy_score  # 精度を計算するための関数をインポートします
from transformers import AutoTokenizer, LlamaModel, LlamaForSequenceClassification, AutoModel  # 自動トークナイザーやLlamaモデルをインポートします
from transformers import LlamaForCausalLM, LlamaTokenizer  # 原因モデルとトークナイザーをインポートします
import torch.nn.functional as F  # PyTorchの関数を扱うためのモジュールをインポートします

np.random.seed(1337)  # NumPyの乱数生成のシードを設定します。これにより、結果の再現性が確保されます。
```

</div>
</details>

In [None]:
import os  # オペレーティングシステムとのやり取りをするためのライブラリをインポートします
import gc  # ガーベジコレクションを扱うためのライブラリをインポートします
import re  # 正規表現を使用するためのライブラリをインポートします
from time import time  # 時間を計測するためのtime関数をインポートします
import random  # ランダムな数値を生成するためのライブラリをインポートします
import warnings  # 警告を管理するためのライブラリをインポートします
import numpy as np  # 数値計算を行うためのNumPyライブラリをインポートします
import pandas as pd  # データ操作と解析を行うためのPandasライブラリをインポートします
import matplotlib.pyplot as plt  # グラフを描画するためのMatplotlibライブラリをインポートします
from tqdm.auto import tqdm  # 進捗状況を表示するためのtqdmライブラリをインポートします

import torch  # PyTorchライブラリをインポートします
import transformers  # トランスフォーマモデルを扱うためのライブラリをインポートします
from sklearn.metrics import accuracy_score  # 精度を計算するための関数をインポートします
from transformers import AutoTokenizer, LlamaModel, LlamaForSequenceClassification, AutoModel  # 自動トークナイザーやLlamaモデルをインポートします
from transformers import LlamaForCausalLM, LlamaTokenizer  # 原因モデルとトークナイザーをインポートします
import torch.nn.functional as F  # PyTorchの関数を扱うためのモジュールをインポートします

np.random.seed(1337)  # NumPyの乱数生成のシードを設定します。これにより、結果の再現性が確保されます。

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Tokenizer

</div>
<div class="column-right">

# 日本語訳

## トークナイザー

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
model = "/kaggle/input/llama-3/transformers/70b-chat-hf/1/llama3-70b-chat-hf"

tokenizer = AutoTokenizer.from_pretrained(model)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = 'right'
tokenizer.add_eos_token = True

# save tokenizer to load offline during inference
tokenizer.save_pretrained('tokenizer')
```

</div>
<div class="column-right">

# 日本語訳

```python
model = "/kaggle/input/llama-3/transformers/70b-chat-hf/1/llama3-70b-chat-hf"  # 使用するモデルのパスを指定します

tokenizer = AutoTokenizer.from_pretrained(model)  # モデルからトークナイザーを読み込みます
tokenizer.pad_token = tokenizer.eos_token  # パディングトークンを終了トークンと同じに設定します
tokenizer.padding_side = 'right'  # パディングを右側に適用するよう設定します
tokenizer.add_eos_token = True  # 終了トークンを追加することを許可します

# 推論中にオフラインでトークナイザーをロードするために保存します
tokenizer.save_pretrained('tokenizer')  # トークナイザーの設定を指定したフォルダに保存します
```

</div>
</details>

In [None]:
model = "/kaggle/input/llama-3/transformers/70b-chat-hf/1/llama3-70b-chat-hf"  # 使用するモデルのパスを指定します

tokenizer = AutoTokenizer.from_pretrained(model)  # モデルからトークナイザーを読み込みます
tokenizer.pad_token = tokenizer.eos_token  # パディングトークンを終了トークンと同じに設定します
tokenizer.padding_side = 'right'  # パディングを右側に適用するよう設定します
tokenizer.add_eos_token = True  # 終了トークンを追加することを許可します

# 推論中にオフラインでトークナイザーをロードするために保存します
tokenizer.save_pretrained('tokenizer')  # トークナイザーの設定を指定したフォルダに保存します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# Utility function giving token length
def get_token_lengths(texts):
    # tokenize and receive input_ids for reach text
    input_ids = tokenizer(texts.tolist(), return_tensors='np')['input_ids']
    # return length of inputs_ids for each text
    return [len(t) for t in input_ids]
```

</div>
<div class="column-right">

# 日本語訳

```python
# Utility function giving token length
# トークンの長さを返すユーティリティ関数を定義します
def get_token_lengths(texts):
    # 各テキストに対してトークン化し、input_idsを取得します
    input_ids = tokenizer(texts.tolist(), return_tensors='np')['input_ids']  # テキストをトークン化し、NumPy形式の入力IDを取得します
    # 各テキストに対するinput_idsの長さを返します
    return [len(t) for t in input_ids]  # 各トークンの長さをリストとして返します
```

</div>
</details>

In [None]:
# Utility function giving token length
# トークンの長さを返すユーティリティ関数を定義します
def get_token_lengths(texts):
    # 各テキストに対してトークン化し、input_idsを取得します
    input_ids = tokenizer(texts.tolist(), return_tensors='np')['input_ids']  # テキストをトークン化し、NumPy形式の入力IDを取得します
    # 各テキストに対するinput_idsの長さを返します
    return [len(t) for t in input_ids]  # 各トークンの長さをリストとして返します

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Prepare train set

</div>
<div class="column-right">

# 日本語訳

## トレーニングセットの準備

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
train = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/train.csv')
train.head(5)
```

</div>
<div class="column-right">

# 日本語訳

```python
train = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/train.csv')  # トレーニングデータをCSVファイルから読み込みます
train.head(5)  # トレーニングセットの最初の5行を表示します
```

</div>
</details>

In [None]:
train = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/train.csv')  # トレーニングデータをCSVファイルから読み込みます
train.head(5)  # トレーニングセットの最初の5行を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def put_text(train):
    train['text'] = 'User prompt: ' + train['prompt'] +  '\n\nModel A:\n' + train['response_a'] +'\n\n--------\n\nModel B:\n'  + train['response_b']
    return train

train = put_text(train)
print(train['text'][0])
```

</div>
<div class="column-right">

# 日本語訳

```python
def put_text(train):
    # 新しいテキスト列を作成し、ユーザーのプロンプトとモデルAおよびモデルBの応答を組み合わせます
    train['text'] = 'User prompt: ' + train['prompt'] +  '\n\nModel A:\n' + train['response_a'] +'\n\n--------\n\nModel B:\n'  + train['response_b']
    return train  # 変更を加えたトレーニングデータを返します

train = put_text(train)  # トレーニングデータに新しいテキスト列を追加します
print(train['text'][0])  # 新しく作成したテキスト列の最初の要素を表示します
```

</div>
</details>

In [None]:
def put_text(train):
    # 新しいテキスト列を作成し、ユーザーのプロンプトとモデルAおよびモデルBの応答を組み合わせます
    train['text'] = 'User prompt: ' + train['prompt'] +  '\n\nModel A:\n' + train['response_a'] +'\n\n--------\n\nModel B:\n'  + train['response_b']
    return train  # 変更を加えたトレーニングデータを返します

train = put_text(train)  # トレーニングデータに新しいテキスト列を追加します
print(train['text'][0])  # 新しく作成したテキスト列の最初の要素を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def process(input_str):
    stripped_str = input_str.strip('[]')
    sentences = [s.strip('"') for s in stripped_str.split('","')]
    return  ' '.join(sentences)

train.loc[:, 'prompt'] = train['prompt'].apply(process)
train.loc[:, 'response_a'] = train['response_a'].apply(process)
train.loc[:, 'response_b'] = train['response_b'].apply(process)


train = put_text(train)
print(train['text'][0])
```

</div>
<div class="column-right">

# 日本語訳

```python
def process(input_str):
    # 入力文字列から角括弧を取り除きます
    stripped_str = input_str.strip('[]')
    # 文字列を分割して、各文から囲いを除きます
    sentences = [s.strip('"') for s in stripped_str.split('","')]
    return ' '.join(sentences)  # 文をスペースで結合して返します

# 'prompt', 'response_a', 'response_b'列の各値にprocess関数を適用します
train.loc[:, 'prompt'] = train['prompt'].apply(process)
train.loc[:, 'response_a'] = train['response_a'].apply(process)
train.loc[:, 'response_b'] = train['response_b'].apply(process)

train = put_text(train)  # 新しいテキスト列をトレーニングデータに再度追加します
print(train['text'][0])  # 更新されたテキスト列の最初の要素を表示します
```

</div>
</details>

In [None]:
def process(input_str):
    # 入力文字列から角括弧を取り除きます
    stripped_str = input_str.strip('[]')
    # 文字列を分割して、各文から囲いを除きます
    sentences = [s.strip('"') for s in stripped_str.split('","')]
    return ' '.join(sentences)  # 文をスペースで結合して返します

# 'prompt', 'response_a', 'response_b'列の各値にprocess関数を適用します
train.loc[:, 'prompt'] = train['prompt'].apply(process)
train.loc[:, 'response_a'] = train['response_a'].apply(process)
train.loc[:, 'response_b'] = train['response_b'].apply(process)

train = put_text(train)  # 新しいテキスト列をトレーニングデータに再度追加します
print(train['text'][0])  # 更新されたテキスト列の最初の要素を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
train.loc[:, 'token_count'] = get_token_lengths(train['text'])

# prepare label for model
train.loc[:, 'label'] = np.argmax(train[['winner_model_a','winner_model_b','winner_tie']].values, axis=1)

# Display data
display(train.head())
```

</div>
<div class="column-right">

# 日本語訳

```python
train.loc[:, 'token_count'] = get_token_lengths(train['text'])  # トレーニングデータの'text'列に基づいてトークンのカウントを追加します

# モデル用のラベルを準備します
train.loc[:, 'label'] = np.argmax(train[['winner_model_a','winner_model_b','winner_tie']].values, axis=1)  # 各行の勝者モデルをラベルとして取得します

# データを表示します
display(train.head())  # 最初の数行のトレーニングデータを表示します
```

</div>
</details>

In [None]:
train.loc[:, 'token_count'] = get_token_lengths(train['text'])  # トレーニングデータの'text'列に基づいてトークンのカウントを追加します

# モデル用のラベルを準備します
train.loc[:, 'label'] = np.argmax(train[['winner_model_a','winner_model_b','winner_tie']].values, axis=1)  # 各行の勝者モデルをラベルとして取得します

# データを表示します
display(train.head())  # 最初の数行のトレーニングデータを表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
train.label.value_counts()
```

</div>
<div class="column-right">

# 日本語訳

```python
train.label.value_counts()  # 各ラベルの出現回数をカウントして表示します
```

</div>
</details>

In [None]:
train.label.value_counts()  # 各ラベルの出現回数をカウントして表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# token Count
display(train['token_count'].describe().to_frame().astype(int))

```

</div>
<div class="column-right">

# 日本語訳

```python
# トークンのカウント
display(train['token_count'].describe().to_frame().astype(int))  # トークンのカウントに関する統計情報を計算し、整数型のデータフレームとして表示します
```

</div>
</details>

In [None]:
# トークンのカウント
display(train['token_count'].describe().to_frame().astype(int))  # トークンのカウントに関する統計情報を計算し、整数型のデータフレームとして表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# get length of tokens which covers 90% of data, we'll still take 1024 length!
np.percentile(train['token_count'], 90)
```

</div>
<div class="column-right">

# 日本語訳

```python
# データの90%をカバーするトークンの長さを取得しますが、1024の長さを使用します
np.percentile(train['token_count'], 90)  # トークンのカウントの90パーセンタイルを計算します
```

</div>
</details>

In [None]:
# データの90%をカバーするトークンの長さを取得しますが、1024の長さを使用します
np.percentile(train['token_count'], 90)  # トークンのカウントの90パーセンタイルを計算します

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Tokenize

</div>
<div class="column-right">

# 日本語訳

## トークン化

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# Tokenize Data
tokens = tokenizer(
    train['text'].tolist(), 
    max_length=1024, 
    truncation=True, 
    return_tensors='np')

# Input IDs are the token IDs
INPUT_IDS = tokens['input_ids']
# Attention Masks to Ignore Padding Tokens
ATTENTION_MASKS = tokens['attention_mask']
# Label of Texts
LABELS = train[['winner_model_a','winner_model_b','winner_tie']].values

print(f'INPUT_IDS shape: {INPUT_IDS.shape}, ATTENTION_MASKS shape: {ATTENTION_MASKS.shape}')
print(f'LABELS shape: {LABELS.shape}')
```

</div>
<div class="column-right">

# 日本語訳

```python
# データをトークン化します
tokens = tokenizer(
    train['text'].tolist(),  # テキストをリストに変換してトークン化します
    max_length=1024,  # 最大長を1024に設定します
    truncation=True,  # 長すぎるトークンは切り詰めます
    return_tensors='np')  # NumPy形式のテンソルを返します

# 入力IDはトークンIDです
INPUT_IDS = tokens['input_ids']  # トークン化された入力IDを取得します
# パディングトークンを無視するためのアテンションマスク
ATTENTION_MASKS = tokens['attention_mask']  # アテンションマスクを取得します
# テキストのラベル
LABELS = train[['winner_model_a','winner_model_b','winner_tie']].values  # ラベルを取得します

print(f'INPUT_IDS shape: {INPUT_IDS.shape}, ATTENTION_MASKS shape: {ATTENTION_MASKS.shape}')  # 入力IDとアテンションマスクの形状を表示します
print(f'LABELS shape: {LABELS.shape}')  # ラベルの形状を表示します
```

</div>
</details>

In [None]:
# データをトークン化します
tokens = tokenizer(
    train['text'].tolist(),  # テキストをリストに変換してトークン化します
    max_length=1024,  # 最大長を1024に設定します
    truncation=True,  # 長すぎるトークンは切り詰めます
    return_tensors='np')  # NumPy形式のテンソルを返します

# 入力IDはトークンIDです
INPUT_IDS = tokens['input_ids']  # トークン化された入力IDを取得します
# パディングトークンを無視するためのアテンションマスク
ATTENTION_MASKS = tokens['attention_mask']  # アテンションマスクを取得します
# テキストのラベル
LABELS = train[['winner_model_a','winner_model_b','winner_tie']].values  # ラベルを取得します

print(f'INPUT_IDS shape: {INPUT_IDS.shape}, ATTENTION_MASKS shape: {ATTENTION_MASKS.shape}')  # 入力IDとアテンションマスクの形状を表示します
print(f'LABELS shape: {LABELS.shape}')  # ラベルの形状を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
max_features = 14300
max_len = 1024
maxlen = max_len
batch_size = 16
embedding_dims = 100
nb_filter = 150
filter_length = 3
hidden_dims = 100
nb_epoch = 100
```

</div>
<div class="column-right">

# 日本語訳

```python
max_features = 14300  # モデルで使用する最大特徴数を設定します
max_len = 1024  # トークンの最大長を設定します
maxlen = max_len  # max_lenをmaxlenに割り当てます
batch_size = 16  # バッチサイズを設定します
embedding_dims = 100  # 埋め込み次元の数を設定します
nb_filter = 150  # フィルタの数を設定します
filter_length = 3  # フィルタの長さを設定します
hidden_dims = 100  # 隠れ層の次元の数を設定します
nb_epoch = 100  # エポック数を設定します
```

</div>
</details>

In [None]:
max_features = 14300  # モデルで使用する最大特徴数を設定します
max_len = 1024  # トークンの最大長を設定します
maxlen = max_len  # max_lenをmaxlenに割り当てます
batch_size = 16  # バッチサイズを設定します
embedding_dims = 100  # 埋め込み次元の数を設定します
nb_filter = 150  # フィルタの数を設定します
filter_length = 3  # フィルタの長さを設定します
hidden_dims = 100  # 隠れ層の次元の数を設定します
nb_epoch = 100  # エポック数を設定します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from __future__ import print_function
import numpy as np

from keras.preprocessing import sequence
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Lambda
from keras.layers import Embedding
from keras.layers import Convolution1D, LSTM
from keras.datasets import imdb
from keras import backend as K
from keras.optimizers import Adadelta,Adamax
from keras.preprocessing import sequence as sq

from keras.layers import Dense, Dropout, Activation, Lambda,Input,TimeDistributed,Flatten
from keras.models import Model
from keras.callbacks import ModelCheckpoint

from tensorflow.python.keras.backend import set_session as K
num_samples = INPUT_IDS.shape[0]

# Số lượng mẫu cho X_valid (20% của X_train)
num_valid_samples = int(num_samples * 0.2)

# Xáo trộn các chỉ số của X_train
indices = np.random.permutation(num_samples)

# Chọn 20% chỉ số đầu tiên làm chỉ số cho X_valid
valid_indices = indices[:num_valid_samples]

# Các chỉ số còn lại làm chỉ số cho X_train
train_indices = indices[num_valid_samples:]

# Tạo X_valid và X_train mới từ các chỉ số đã chọn
X_train = sq.pad_sequences(INPUT_IDS[train_indices], maxlen=max_len)
X_train_attention = sq.pad_sequences(ATTENTION_MASKS[train_indices], maxlen=max_len)
y_train = LABELS[train_indices]

X_valid = sq.pad_sequences(INPUT_IDS[valid_indices], maxlen=max_len)
X_valid_attention = sq.pad_sequences(ATTENTION_MASKS[valid_indices], maxlen=max_len)
y_valid = LABELS[valid_indices]
```

</div>
<div class="column-right">

# 日本語訳

```python
from __future__ import print_function  # print_functionを将来のバージョンからインポートして、Python 2と3の互換性を持たせます
import numpy as np  # NumPyライブラリをインポートします

from keras.preprocessing import sequence  # シーケンスデータを処理するためのKerasモジュールをインポートします
from keras.models import Sequential  # シーケンシャルモデルをインポートします
from keras.layers import Dense, Dropout, Activation, Lambda  # 完全結合層などのレイヤーをインポートします
from keras.layers import Embedding  # 埋め込み層をインポートします
from keras.layers import Convolution1D, LSTM  # 1次元畳み込み層とLSTM層をインポートします
from keras.datasets import imdb  # IMDBデータセットをインポートします
from keras import backend as K  # Kerasのバックエンドをインポートします
from keras.optimizers import Adadelta, Adamax  # オプティマイザーをインポートします
from keras.preprocessing import sequence as sq  # シーケンス処理モジュールをインポートし、sqの別名を付けます

from keras.layers import Dense, Dropout, Activation, Lambda, Input, TimeDistributed, Flatten  # その他のレイヤーをインポートします
from keras.models import Model  # モデル推定に使用するKerasのモデルをインポートします
from keras.callbacks import ModelCheckpoint  # モデルのチェックポイントを管理するためのコールバックをインポートします

from tensorflow.python.keras.backend import set_session as K  # TensorFlowの適切なセッション管理用のKerasバックエンドをインポートします
num_samples = INPUT_IDS.shape[0]  # サンプルの総数を取得します

# X_validのサンプル数（X_trainの20%）
num_valid_samples = int(num_samples * 0.2)  # バリデーション用サンプル数を計算します

# X_trainのインデックスをシャッフルします
indices = np.random.permutation(num_samples)  # サンプルのインデックスをランダムに並べ替えます

# 最初の20%のインデックスをX_valid用として選択します
valid_indices = indices[:num_valid_samples]  # バリデーション用のインデックスを取得します

# 残りのインデックスをX_train用として選択します
train_indices = indices[num_valid_samples:]  # トレーニング用のインデックスを取得します

# 選択したインデックスから新しいX_validとX_trainを作成します
X_train = sq.pad_sequences(INPUT_IDS[train_indices], maxlen=max_len)  # トレーニングデータのパディングを行います
X_train_attention = sq.pad_sequences(ATTENTION_MASKS[train_indices], maxlen=max_len)  # アテンションマスクのパディングを行います
y_train = LABELS[train_indices]  # トレーニングラベルを設定します

X_valid = sq.pad_sequences(INPUT_IDS[valid_indices], maxlen=max_len)  # バリデーションデータのパディングを行います
X_valid_attention = sq.pad_sequences(ATTENTION_MASKS[valid_indices], maxlen=max_len)  # バリデーションのアテンションマスクのパディングを行います
y_valid = LABELS[valid_indices]  # バリデーションラベルを設定します
```

</div>
</details>

In [None]:
from __future__ import print_function  # print_functionを将来のバージョンからインポートして、Python 2と3の互換性を持たせます
import numpy as np  # NumPyライブラリをインポートします

from keras.preprocessing import sequence  # シーケンスデータを処理するためのKerasモジュールをインポートします
from keras.models import Sequential  # シーケンシャルモデルをインポートします
from keras.layers import Dense, Dropout, Activation, Lambda  # 完全結合層などのレイヤーをインポートします
from keras.layers import Embedding  # 埋め込み層をインポートします
from keras.layers import Convolution1D, LSTM  # 1次元畳み込み層とLSTM層をインポートします
from keras.datasets import imdb  # IMDBデータセットをインポートします
from keras import backend as K  # Kerasのバックエンドをインポートします
from keras.optimizers import Adadelta, Adamax  # オプティマイザーをインポートします
from keras.preprocessing import sequence as sq  # シーケンス処理モジュールをインポートし、sqの別名を付けます

from keras.layers import Dense, Dropout, Activation, Lambda, Input, TimeDistributed, Flatten  # その他のレイヤーをインポートします
from keras.models import Model  # モデル推定に使用するKerasのモデルをインポートします
from keras.callbacks import ModelCheckpoint  # モデルのチェックポイントを管理するためのコールバックをインポートします

from tensorflow.python.keras.backend import set_session as K  # TensorFlowの適切なセッション管理用のKerasバックエンドをインポートします
num_samples = INPUT_IDS.shape[0]  # サンプルの総数を取得します

# X_validのサンプル数（X_trainの20%）
num_valid_samples = int(num_samples * 0.2)  # バリデーション用サンプル数を計算します

# X_trainのインデックスをシャッフルします
indices = np.random.permutation(num_samples)  # サンプルのインデックスをランダムに並べ替えます

# 最初の20%のインデックスをX_valid用として選択します
valid_indices = indices[:num_valid_samples]  # バリデーション用のインデックスを取得します

# 残りのインデックスをX_train用として選択します
train_indices = indices[num_valid_samples:]  # トレーニング用のインデックスを取得します

# 選択したインデックスから新しいX_validとX_trainを作成します
X_train = sq.pad_sequences(INPUT_IDS[train_indices], maxlen=max_len)  # トレーニングデータのパディングを行います
X_train_attention = sq.pad_sequences(ATTENTION_MASKS[train_indices], maxlen=max_len)  # アテンションマスクのパディングを行います
y_train = LABELS[train_indices]  # トレーニングラベルを設定します

X_valid = sq.pad_sequences(INPUT_IDS[valid_indices], maxlen=max_len)  # バリデーションデータのパディングを行います
X_valid_attention = sq.pad_sequences(ATTENTION_MASKS[valid_indices], maxlen=max_len)  # バリデーションのアテンションマスクのパディングを行います
y_valid = LABELS[valid_indices]  # バリデーションラベルを設定します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
X_train = np.array(X_train)
y_train = np.array(y_train)
X_valid = np.array(X_valid)
y_valid = np.array(y_valid)
```

</div>
<div class="column-right">

# 日本語訳

```python
X_train = np.array(X_train)  # トレーニングデータをNumPy配列に変換します
y_train = np.array(y_train)  # トレーニングラベルをNumPy配列に変換します
X_valid = np.array(X_valid)  # バリデーションデータをNumPy配列に変換します
y_valid = np.array(y_valid)  # バリデーションラベルをNumPy配列に変換します
```

</div>
</details>

In [None]:
X_train = np.array(X_train)  # トレーニングデータをNumPy配列に変換します
y_train = np.array(y_train)  # トレーニングラベルをNumPy配列に変換します
X_valid = np.array(X_valid)  # バリデーションデータをNumPy配列に変換します
y_valid = np.array(y_valid)  # バリデーションラベルをNumPy配列に変換します

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Define Model

</div>
<div class="column-right">

# 日本語訳

## モデルの定義

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from tensorflow.keras.layers import Layer
from keras.layers import concatenate, Dropout, BatchNormalization, LSTM, Conv1D
from keras.layers import  GlobalMaxPooling1D
import tensorflow as tf

class ApplyAttentionMask(Layer):
    def call(self, inputs):
        embeddings, attention_mask = inputs
        return embeddings * tf.expand_dims(attention_mask, -1)

input_layer = Input(shape=(max_len,),dtype='int32', name='main_input')
attention_masks = Input(shape=(max_len,), dtype='float32', name="attention_masks")

emb_layer = Embedding(max_features,
                      embedding_dims,
                      input_length=max_len
                      )(input_layer)

masked_embeddings = ApplyAttentionMask(name='apply_attention_mask')([emb_layer, attention_masks])

# LSTM branch (with Batch Normalization and Dropout)
lstm_out = LSTM(128, return_sequences=True)(masked_embeddings)
lstm_out = BatchNormalization()(lstm_out) # Batch Normalization helps to normalize activations and speed up convergence
lstm_out = Dropout(0.5)(lstm_out) # Dropout = 0.5 helps to prevent overfitting
lstm_out = LSTM(64, return_sequences=True)(lstm_out)
lstm_out = BatchNormalization()(lstm_out)
lstm_out = Dropout(0.5)(lstm_out)
lstm_out = LSTM(32)(lstm_out)
lstm_out = BatchNormalization()(lstm_out)
lstm_out = Dropout(0.5)(lstm_out)

# CNN layer branch (with Batch Normalization and Dropout)
cnn_out = Conv1D(64, 5, activation='relu')(masked_embeddings)
cnn_out = BatchNormalization()(cnn_out)
cnn_out = Dropout(0.5)(cnn_out)
cnn_out = Conv1D(32, 5, activation='relu')(cnn_out)
cnn_out = BatchNormalization()(cnn_out)
cnn_out = Dropout(0.5)(cnn_out)
cnn_out = GlobalMaxPooling1D()(cnn_out)


# Concatenate LSTM and CNN outputs
merged = concatenate([lstm_out, cnn_out])
merged = Dense(32, activation='sigmoid')(merged)
merged = BatchNormalization()(merged)
merged = Dropout(0.5)(merged)
pred = Dense(3, activation='softmax')(merged)


# Build model
model = Model(inputs=[input_layer, attention_masks], outputs=[pred])
adadelta = Adadelta(learning_rate=1.0, rho=0.75, epsilon=1e-06)
adamax = Adamax(learning_rate=0.001)
model.compile(optimizer='adadelta', loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()
```

</div>
<div class="column-right">

# 日本語訳

```python
from tensorflow.keras.layers import Layer  # Kerasのレイヤーをインポートします
from keras.layers import concatenate, Dropout, BatchNormalization, LSTM, Conv1D  # 各種レイヤーをインポートします
from keras.layers import GlobalMaxPooling1D  # 1次元の全体最大プーリングレイヤーをインポートします
import tensorflow as tf  # TensorFlowをインポートします

class ApplyAttentionMask(Layer):
    def call(self, inputs):
        # 埋め込みとアテンションマスクを適用する関数を定義します
        embeddings, attention_mask = inputs
        return embeddings * tf.expand_dims(attention_mask, -1)  # アテンションマスクを埋め込みに適用します

input_layer = Input(shape=(max_len,), dtype='int32', name='main_input')  # メイン入力レイヤーを定義します
attention_masks = Input(shape=(max_len,), dtype='float32', name="attention_masks")  # アテンションマスクの入力レイヤーを定義します

# 埋め込み層
emb_layer = Embedding(max_features,
                      embedding_dims,
                      input_length=max_len)(input_layer)  # 埋め込み層を定義します

masked_embeddings = ApplyAttentionMask(name='apply_attention_mask')([emb_layer, attention_masks])  # アテンションマスクを適用します

# LSTMブランチ（バッチ正規化とドロップアウトを含む）
lstm_out = LSTM(128, return_sequences=True)(masked_embeddings)  # LSTM層を追加します
lstm_out = BatchNormalization()(lstm_out)  # バッチ正規化を適用します
lstm_out = Dropout(0.5)(lstm_out)  # ドロップアウトを適用して過学習を防ぎます
lstm_out = LSTM(64, return_sequences=True)(lstm_out)  # さらにLSTM層を追加
lstm_out = BatchNormalization()(lstm_out)
lstm_out = Dropout(0.5)(lstm_out)
lstm_out = LSTM(32)(lstm_out)  # 最後のLSTM層を追加
lstm_out = BatchNormalization()(lstm_out)
lstm_out = Dropout(0.5)(lstm_out)

# CNNレイヤーブランチ（バッチ正規化とドロップアウトを含む）
cnn_out = Conv1D(64, 5, activation='relu')(masked_embeddings)  # 1次元畳み込み層を追加
cnn_out = BatchNormalization()(cnn_out)  # バッチ正規化を適用します
cnn_out = Dropout(0.5)(cnn_out)  # ドロップアウトを適用します
cnn_out = Conv1D(32, 5, activation='relu')(cnn_out)  # さらに1次元畳み込み層を追加
cnn_out = BatchNormalization()(cnn_out)
cnn_out = Dropout(0.5)(cnn_out)
cnn_out = GlobalMaxPooling1D()(cnn_out)  # グローバル最大プーリングを適用します

# LSTMとCNNの出力を連結します
merged = concatenate([lstm_out, cnn_out])  # 両者の出力を結合します
merged = Dense(32, activation='sigmoid')(merged)  # 隠れ層を追加します
merged = BatchNormalization()(merged)  # バッチ正規化を適用します
merged = Dropout(0.5)(merged)  # ドロップアウトを適用します
pred = Dense(3, activation='softmax')(merged)  # 出力層を追加します

# モデルを構築します
model = Model(inputs=[input_layer, attention_masks], outputs=[pred])  # モデルとして入力と出力を指定します
adadelta = Adadelta(learning_rate=1.0, rho=0.75, epsilon=1e-06)  # Adadeltaオプティマイザーを設定します
adamax = Adamax(learning_rate=0.001)  # Adamaxオプティマイザーを設定します
model.compile(optimizer='adadelta', loss='categorical_crossentropy', metrics=['accuracy'])  # モデルをコンパイルします
model.summary()  # モデルの概要を表示します
```

</div>
</details>

In [None]:
from tensorflow.keras.layers import Layer  # Kerasのレイヤーをインポートします
from keras.layers import concatenate, Dropout, BatchNormalization, LSTM, Conv1D  # 各種レイヤーをインポートします
from keras.layers import GlobalMaxPooling1D  # 1次元の全体最大プーリングレイヤーをインポートします
import tensorflow as tf  # TensorFlowをインポートします

class ApplyAttentionMask(Layer):
    def call(self, inputs):
        # 埋め込みとアテンションマスクを適用する関数を定義します
        embeddings, attention_mask = inputs
        return embeddings * tf.expand_dims(attention_mask, -1)  # アテンションマスクを埋め込みに適用します

input_layer = Input(shape=(max_len,), dtype='int32', name='main_input')  # メイン入力レイヤーを定義します
attention_masks = Input(shape=(max_len,), dtype='float32', name="attention_masks")  # アテンションマスクの入力レイヤーを定義します

# 埋め込み層
emb_layer = Embedding(max_features,
                      embedding_dims,
                      input_length=max_len)(input_layer)  # 埋め込み層を定義します

masked_embeddings = ApplyAttentionMask(name='apply_attention_mask')([emb_layer, attention_masks])  # アテンションマスクを適用します

# LSTMブランチ（バッチ正規化とドロップアウトを含む）
lstm_out = LSTM(128, return_sequences=True)(masked_embeddings)  # LSTM層を追加します
lstm_out = BatchNormalization()(lstm_out)  # バッチ正規化を適用します
lstm_out = Dropout(0.5)(lstm_out)  # ドロップアウトを適用して過学習を防ぎます
lstm_out = LSTM(64, return_sequences=True)(lstm_out)  # さらにLSTM層を追加
lstm_out = BatchNormalization()(lstm_out)
lstm_out = Dropout(0.5)(lstm_out)
lstm_out = LSTM(32)(lstm_out)  # 最後のLSTM層を追加
lstm_out = BatchNormalization()(lstm_out)
lstm_out = Dropout(0.5)(lstm_out)

# CNNレイヤーブランチ（バッチ正規化とドロップアウトを含む）
cnn_out = Conv1D(64, 5, activation='relu')(masked_embeddings)  # 1次元畳み込み層を追加
cnn_out = BatchNormalization()(cnn_out)  # バッチ正規化を適用します
cnn_out = Dropout(0.5)(cnn_out)  # ドロップアウトを適用します
cnn_out = Conv1D(32, 5, activation='relu')(cnn_out)  # さらに1次元畳み込み層を追加
cnn_out = BatchNormalization()(cnn_out)
cnn_out = Dropout(0.5)(cnn_out)
cnn_out = GlobalMaxPooling1D()(cnn_out)  # グローバル最大プーリングを適用します

# LSTMとCNNの出力を連結します
merged = concatenate([lstm_out, cnn_out])  # 両者の出力を結合します
merged = Dense(32, activation='sigmoid')(merged)  # 隠れ層を追加します
merged = BatchNormalization()(merged)  # バッチ正規化を適用します
merged = Dropout(0.5)(merged)  # ドロップアウトを適用します
pred = Dense(3, activation='softmax')(merged)  # 出力層を追加します

# モデルを構築します
model = Model(inputs=[input_layer, attention_masks], outputs=[pred])  # モデルとして入力と出力を指定します
adadelta = Adadelta(learning_rate=1.0, rho=0.75, epsilon=1e-06)  # Adadeltaオプティマイザーを設定します
adamax = Adamax(learning_rate=0.001)  # Adamaxオプティマイザーを設定します
model.compile(optimizer='adadelta', loss='categorical_crossentropy', metrics=['accuracy'])  # モデルをコンパイルします
model.summary()  # モデルの概要を表示します

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Training

</div>
<div class="column-right">

# 日本語訳

## トレーニング

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def clip_indices(data, max_index):
    return np.where(data >= max_index, max_index - 1, data)
X_train = clip_indices(X_train, 14300)
X_train_attention = clip_indices(X_train_attention, 14300)
X_valid = clip_indices(X_valid, 14300)
X_valid_attention = clip_indices(X_valid_attention, 14300)
```

</div>
<div class="column-right">

# 日本語訳

```python
def clip_indices(data, max_index):
    # インデックスが最大のインデックスを超えた場合、最大インデックス-1にクリップします
    return np.where(data >= max_index, max_index - 1, data)

X_train = clip_indices(X_train, 14300)  # トレーニングデータのインデックスをクリップします
X_train_attention = clip_indices(X_train_attention, 14300)  # トレーニングアテンションマスクのインデックスをクリップします
X_valid = clip_indices(X_valid, 14300)  # バリデーションデータのインデックスをクリップします
X_valid_attention = clip_indices(X_valid_attention, 14300)  # バリデーションアテンションマスクのインデックスをクリップします
```

</div>
</details>

In [None]:
def clip_indices(data, max_index):
    # インデックスが最大のインデックスを超えた場合、最大インデックス-1にクリップします
    return np.where(data >= max_index, max_index - 1, data)

X_train = clip_indices(X_train, 14300)  # トレーニングデータのインデックスをクリップします
X_train_attention = clip_indices(X_train_attention, 14300)  # トレーニングアテンションマスクのインデックスをクリップします
X_valid = clip_indices(X_valid, 14300)  # バリデーションデータのインデックスをクリップします
X_valid_attention = clip_indices(X_valid_attention, 14300)  # バリデーションアテンションマスクのインデックスをクリップします

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
from keras.callbacks import EarlyStopping
checkpoint = ModelCheckpoint('/kaggle/working/model.keras',
                                 monitor='val_acc', verbose=0, save_best_only=True,
                                 mode='max')
early_stopping = EarlyStopping(monitor='val_loss', patience=5, verbose=1, restore_best_weights=True)

model.fit([X_train,X_train_attention], y_train,
          batch_size=16,
          epochs=nb_epoch,
#           callbacks=[checkpoint, early_stopping],
          callbacks=[early_stopping],
          validation_data=([X_valid,X_valid_attention], y_valid))
```

</div>
<div class="column-right">

# 日本語訳

```python
from keras.callbacks import EarlyStopping  # 早期停止のためのコールバックをインポートします
checkpoint = ModelCheckpoint('/kaggle/working/model.keras',
                                 monitor='val_acc', verbose=0, save_best_only=True,
                                 mode='max')  # モデルのチェックポイントを設定します
early_stopping = EarlyStopping(monitor='val_loss', patience=5, verbose=1, restore_best_weights=True)  # 早期停止を設定します

# モデルをトレーニングします
model.fit([X_train, X_train_attention], y_train,
          batch_size=16,  # バッチサイズを設定します
          epochs=nb_epoch,  # エポック数を設定します
#           callbacks=[checkpoint, early_stopping],  # チェックポイントと早期停止のコールバック（コメントアウト）
          callbacks=[early_stopping],  # 早期停止のコールバックのみ使用します
          validation_data=([X_valid, X_valid_attention], y_valid))  # バリデーションデータを指定します
```

</div>
</details>

In [None]:
from keras.callbacks import EarlyStopping  # 早期停止のためのコールバックをインポートします
checkpoint = ModelCheckpoint('/kaggle/working/model.keras',
                                 monitor='val_acc', verbose=0, save_best_only=True,
                                 mode='max')  # モデルのチェックポイントを設定します
early_stopping = EarlyStopping(monitor='val_loss', patience=5, verbose=1, restore_best_weights=True)  # 早期停止を設定します

# モデルをトレーニングします
model.fit([X_train, X_train_attention], y_train,
          batch_size=16,  # バッチサイズを設定します
          epochs=nb_epoch,  # エポック数を設定します
#           callbacks=[checkpoint, early_stopping],  # チェックポイントと早期停止のコールバック（コメントアウト）
          callbacks=[early_stopping],  # 早期停止のコールバックのみ使用します
          validation_data=([X_valid, X_valid_attention], y_valid))  # バリデーションデータを指定します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
model.compile(loss='categorical_crossentropy',
              optimizer='adadelta',
              metrics=['accuracy'])

model.save('model.keras', overwrite=True)
model.save_weights("model.weights.h5", overwrite=True)
```

</div>
<div class="column-right">

# 日本語訳

```python
model.compile(loss='categorical_crossentropy',  # 損失関数をカテゴリカルクロスエントロピーとして設定します
              optimizer='adadelta',  # オプティマイザーをAdadeltaとして設定します
              metrics=['accuracy'])  # 評価指標として精度を設定します

model.save('model.keras', overwrite=True)  # モデル全体を指定したファイル名で保存します
model.save_weights("model.weights.h5", overwrite=True)  # モデルの重みのみを保存します
```

</div>
</details>

In [None]:
model.compile(loss='categorical_crossentropy',  # 損失関数をカテゴリカルクロスエントロピーとして設定します
              optimizer='adadelta',  # オプティマイザーをAdadeltaとして設定します
              metrics=['accuracy'])  # 評価指標として精度を設定します

model.save('model.keras', overwrite=True)  # モデル全体を指定したファイル名で保存します
model.save_weights("model.weights.h5", overwrite=True)  # モデルの重みのみを保存します

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Test Model

</div>
<div class="column-right">

# 日本語訳

## モデルのテスト

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
test = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/test.csv')


test.loc[:, 'prompt'] = test['prompt'].apply(process)
test.loc[:, 'response_a'] = test['response_a'].apply(process)
test.loc[:, 'response_b'] = test['response_b'].apply(process)

# Drop 'Null' for training
indexes = test[(test.response_a == 'null') & (test.response_b == 'null')].index
test.drop(indexes, inplace=True)
test.reset_index(inplace=True, drop=True)

print(f"Total {len(indexes)} Null response rows dropped")
print('Total train samples: ', len(test))
```

</div>
<div class="column-right">

# 日本語訳

```python
test = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/test.csv')  # テストデータをCSVファイルから読み込みます

# プロンプトと応答を処理します
test.loc[:, 'prompt'] = test['prompt'].apply(process)  # プロンプト列にprocess関数を適用します
test.loc[:, 'response_a'] = test['response_a'].apply(process)  # モデルAの応答列にprocess関数を適用します
test.loc[:, 'response_b'] = test['response_b'].apply(process)  # モデルBの応答列にprocess関数を適用します

# トレーニングにおいて'null'を含む行を削除します
indexes = test[(test.response_a == 'null') & (test.response_b == 'null')].index  # 'null'応答を持つインデックスを取得します
test.drop(indexes, inplace=True)  # 該当行をデータフレームから削除します
test.reset_index(inplace=True, drop=True)  # インデックスをリセットします

print(f"Total {len(indexes)} Null response rows dropped")  # 削除された'null'応答の行数を表示します
print('Total train samples: ', len(test))  # 残ったトレーニングサンプルの総数を表示します
```

</div>
</details>

In [None]:
test = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/test.csv')  # テストデータをCSVファイルから読み込みます

# プロンプトと応答を処理します
test.loc[:, 'prompt'] = test['prompt'].apply(process)  # プロンプト列にprocess関数を適用します
test.loc[:, 'response_a'] = test['response_a'].apply(process)  # モデルAの応答列にprocess関数を適用します
test.loc[:, 'response_b'] = test['response_b'].apply(process)  # モデルBの応答列にprocess関数を適用します

# トレーニングにおいて'null'を含む行を削除します
indexes = test[(test.response_a == 'null') & (test.response_b == 'null')].index  # 'null'応答を持つインデックスを取得します
test.drop(indexes, inplace=True)  # 該当行をデータフレームから削除します
test.reset_index(inplace=True, drop=True)  # インデックスをリセットします

print(f"Total {len(indexes)} Null response rows dropped")  # 削除された'null'応答の行数を表示します
print('Total train samples: ', len(test))  # 残ったトレーニングサンプルの総数を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
test.head()
```

</div>
<div class="column-right">

# 日本語訳

```python
test.head()  # テストデータの最初の5行を表示します
```

</div>
</details>

In [None]:
test.head()  # テストデータの最初の5行を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
test['text'] = 'User prompt: ' + test['prompt'] +  '\n\nModel A:\n' + test['response_a'] +'\n\n--------\n\nModel B:\n'  + train['response_b']
print(test['text'])
```

</div>
<div class="column-right">

# 日本語訳

```python
test['text'] = 'User prompt: ' + test['prompt'] +  '\n\nModel A:\n' + test['response_a'] +'\n\n--------\n\nModel B:\n'  + test['response_b']  # テストデータに新しいテキスト列を追加します
print(test['text'])  # 新しく作成したテキスト列の内容を表示します
```

</div>
</details>

In [None]:
test['text'] = 'User prompt: ' + test['prompt'] +  '\n\nModel A:\n' + test['response_a'] +'\n\n--------\n\nModel B:\n'  + test['response_b']  # テストデータに新しいテキスト列を追加します
print(test['text'])  # 新しく作成したテキスト列の内容を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# Tokenize Data
tokens_test = tokenizer(
    test['text'].tolist(), 
    max_length=1024, 
    truncation=True, 
    return_tensors='np')

# Input IDs are the token IDs
INPUT_test = tokens_test['input_ids']
# Attention Masks to Ignore Padding Tokens
ATTENTION_MASKS2 = tokens_test['attention_mask']


print(f'INPUT_IDS shape: {INPUT_test.shape}, ATTENTION_MASKS shape: {ATTENTION_MASKS2.shape}')
```

</div>
<div class="column-right">

# 日本語訳

```python
# テストデータをトークン化します
tokens_test = tokenizer(
    test['text'].tolist(),  # テキストをリストに変換してトークン化します
    max_length=1024,  # 最大長を1024に設定します
    truncation=True,  # 長すぎるトークンは切り詰めます
    return_tensors='np')  # NumPy形式のテンソルを返します

# 入力IDはトークンIDです
INPUT_test = tokens_test['input_ids']  # トークン化された入力IDを取得します
# パディングトークンを無視するためのアテンションマスク
ATTENTION_MASKS2 = tokens_test['attention_mask']  # アテンションマスクを取得します

print(f'INPUT_IDS shape: {INPUT_test.shape}, ATTENTION_MASKS shape: {ATTENTION_MASKS2.shape}')  # 入力IDとアテンションマスクの形状を表示します
```

</div>
</details>

In [None]:
# テストデータをトークン化します
tokens_test = tokenizer(
    test['text'].tolist(),  # テキストをリストに変換してトークン化します
    max_length=1024,  # 最大長を1024に設定します
    truncation=True,  # 長すぎるトークンは切り詰めます
    return_tensors='np')  # NumPy形式のテンソルを返します

# 入力IDはトークンIDです
INPUT_test = tokens_test['input_ids']  # トークン化された入力IDを取得します
# パディングトークンを無視するためのアテンションマスク
ATTENTION_MASKS2 = tokens_test['attention_mask']  # アテンションマスクを取得します

print(f'INPUT_IDS shape: {INPUT_test.shape}, ATTENTION_MASKS shape: {ATTENTION_MASKS2.shape}')  # 入力IDとアテンションマスクの形状を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
X_test = sq.pad_sequences(INPUT_test, maxlen=max_len)
X_test_attention = sq.pad_sequences(ATTENTION_MASKS2, maxlen=max_len)

```

</div>
<div class="column-right">

# 日本語訳

```python
X_test = sq.pad_sequences(INPUT_test, maxlen=max_len)  # テストデータの入力IDをパディングして最大長に揃えます
X_test_attention = sq.pad_sequences(ATTENTION_MASKS2, maxlen=max_len)  # テストデータのアテンションマスクをパディングして最大長に揃えます
```

</div>
</details>

In [None]:
X_test = sq.pad_sequences(INPUT_test, maxlen=max_len)  # テストデータの入力IDをパディングして最大長に揃えます
X_test_attention = sq.pad_sequences(ATTENTION_MASKS2, maxlen=max_len)  # テストデータのアテンションマスクをパディングして最大長に揃えます

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
test
```

</div>
<div class="column-right">

# 日本語訳

```python
test  # テストデータフレームの内容を表示します
```

</div>
</details>

In [None]:
test  # テストデータフレームの内容を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
y_predict = model.predict([X_test,X_test_attention])
y_predict
```

</div>
<div class="column-right">

# 日本語訳

```python
y_predict = model.predict([X_test, X_test_attention])  # テストデータに対する予測を行います
y_predict  # 予測結果を表示します
```

</div>
</details>

In [None]:
y_predict = model.predict([X_test, X_test_attention])  # テストデータに対する予測を行います
y_predict  # 予測結果を表示します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
winner_df = pd.DataFrame(y_predict, columns=['winner_model_a', 'winner_model_b', 'winner_tie'])
result_df = pd.concat([test['id'], winner_df], axis=1)

```

</div>
<div class="column-right">

# 日本語訳

```python
winner_df = pd.DataFrame(y_predict, columns=['winner_model_a', 'winner_model_b', 'winner_tie'])  # 予測結果をデータフレームに変換します
result_df = pd.concat([test['id'], winner_df], axis=1)  # テストデータのIDと予測結果を結合して新しいデータフレームを作成します
```

</div>
</details>

In [None]:
winner_df = pd.DataFrame(y_predict, columns=['winner_model_a', 'winner_model_b', 'winner_tie'])  # 予測結果をデータフレームに変換します
result_df = pd.concat([test['id'], winner_df], axis=1)  # テストデータのIDと予測結果を結合して新しいデータフレームを作成します

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
result_df.to_csv('submission.csv', index=False)
result_df
```

</div>
<div class="column-right">

# 日本語訳

```python
result_df.to_csv('submission.csv', index=False)  # 予測結果をCSVファイルとして保存します
result_df  # 最終的な結果データフレームを表示します
```

</div>
</details>

In [None]:
result_df.to_csv('submission.csv', index=False)  # 予測結果をCSVファイルとして保存します
result_df  # 最終的な結果データフレームを表示します

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

____________________

</div>
<div class="column-right">

# 日本語訳

____________________

</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# # Import necessary libraries
# import pandas as pd
# import numpy as np
# from sklearn.model_selection import train_test_split
# from sklearn.feature_extraction.text import TfidfVectorizer
# from sklearn.ensemble import RandomForestClassifier
# from sklearn.metrics import log_loss
# from sklearn.preprocessing import LabelEncoder

# # Load the data
# train = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/train.csv')
# test = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/test.csv')

# # Inspect the data
# print(train.head())
# print(test.head())

# # Data Preprocessing
# # Combine responses into one text feature
# train['response_combined'] = train['response_a'] + ' ' + train['response_b']
# test['response_combined'] = test['response_a'] + ' ' + test['response_b']

# # Encode the target labels
# label_encoder = LabelEncoder()
# train['winner'] = label_encoder.fit_transform(train[['winner_model_a', 'winner_model_b', 'winner_tie']].idxmax(axis=1))

# # Feature Engineering
# # Vectorize the combined responses using TF-IDF
# tfidf = TfidfVectorizer(max_features=1000)
# X_train_tfidf = tfidf.fit_transform(train['response_combined'])
# X_test_tfidf = tfidf.transform(test['response_combined'])

# # Prepare the data for model training
# X_train, X_val, y_train, y_val = train_test_split(X_train_tfidf, train['winner'], test_size=0.2, random_state=42)

# # Train the model
# model = RandomForestClassifier(n_estimators=100, random_state=42)
# model.fit(X_train, y_train)

# # Validate the model
# y_val_pred_proba = model.predict_proba(X_val)
# val_log_loss = log_loss(y_val, y_val_pred_proba)
# print(f'Validation Log Loss: {val_log_loss}')

# # Predict on the test set
# test_pred_proba = model.predict_proba(X_test_tfidf)

# # Prepare the submission file
# submission = pd.DataFrame(test['id'], columns=['id'])
# submission['winner_model_a'] = test_pred_proba[:, label_encoder.transform(['winner_model_a'])]
# submission['winner_model_b'] = test_pred_proba[:, label_encoder.transform(['winner_model_b'])]
# submission['winner_tie'] = test_pred_proba[:, label_encoder.transform(['winner_tie'])]
# submission.to_csv('submission.csv', index=False)

# # Inspect the submission file
# print(submission.head())
```

</div>
<div class="column-right">

# 日本語訳

```python
# # 必要なライブラリをインポートします
# import pandas as pd  # データ操作用ライブラリのインポート
# import numpy as np  # 数値計算用ライブラリのインポート
# from sklearn.model_selection import train_test_split  # データ分割用モジュールのインポート
# from sklearn.feature_extraction.text import TfidfVectorizer  # TF-IDFベクトライザーをインポート
# from sklearn.ensemble import RandomForestClassifier  # ランダムフォレスト分類器をインポート
# from sklearn.metrics import log_loss  # ログロスを計算する関数をインポート
# from sklearn.preprocessing import LabelEncoder  # ラベルエンコーダをインポート

# # データをロードします
# train = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/train.csv')  # トレーニングデータの読み込み
# test = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/test.csv')  # テストデータの読み込み

# # データを検査します
# print(train.head())  # トレーニングデータの最初の5行を表示
# print(test.head())  # テストデータの最初の5行を表示

# # データの前処理
# # 応答を1つのテキスト特徴として結合します
# train['response_combined'] = train['response_a'] + ' ' + train['response_b']  # 応答の結合
# test['response_combined'] = test['response_a'] + ' ' + test['response_b']  # テストデータの応答も結合

# # ターゲットラベルをエンコードします
# label_encoder = LabelEncoder()  # ラベルエンコーダのインスタンスを作成
# train['winner'] = label_encoder.fit_transform(train[['winner_model_a', 'winner_model_b', 'winner_tie']].idxmax(axis=1))  # 勝者のラベルをエンコード

# # 特徴量エンジニアリング
# # 結合された応答をTF-IDFを使用してベクトル化します
# tfidf = TfidfVectorizer(max_features=1000)  # TF-IDFベクトライザーを作成
# X_train_tfidf = tfidf.fit_transform(train['response_combined'])  # トレーニングデータをベクトル化
# X_test_tfidf = tfidf.transform(test['response_combined'])  # テストデータをベクトル化

# # モデル学習のためのデータを準備します
# X_train, X_val, y_train, y_val = train_test_split(X_train_tfidf, train['winner'], test_size=0.2, random_state=42)  # データをトレーニングとバリデーションに分割

# # モデルをトレーニングします
# model = RandomForestClassifier(n_estimators=100, random_state=42)  # ランダムフォレストモデルを作成
# model.fit(X_train, y_train)  # モデルのトレーニング

# # モデルをバリデーションします
# y_val_pred_proba = model.predict_proba(X_val)  # バリデーションデータに対する予測確率を計算
# val_log_loss = log_loss(y_val, y_val_pred_proba)  # バリデーションロスを計算
# print(f'Validation Log Loss: {val_log_loss}')  # バリデーションロスを表示

# # テストセットに対して予測します
# test_pred_proba = model.predict_proba(X_test_tfidf)  # テストデータに対する予測確率を計算

# # 提出ファイルを準備します
# submission = pd.DataFrame(test['id'], columns=['id'])  # 提出用データフレームを作成
# submission['winner_model_a'] = test_pred_proba[:, label_encoder.transform(['winner_model_a'])]  # モデルAの勝者確率を加える
# submission['winner_model_b'] = test_pred_proba[:, label_encoder.transform(['winner_model_b'])]  # モデルBの勝者確率を加える
# submission['winner_tie'] = test_pred_proba[:, label_encoder.transform(['winner_tie'])]  # 引き分けの勝者確率を加える
# submission.to_csv('submission.csv', index=False)  # 提出ファイルをCSV形式で保存

# # 提出ファイルを検査します
# print(submission.head())  # 提出ファイルの最初の5行を表示
```

</div>
</details>

In [None]:
# # 必要なライブラリをインポートします
# import pandas as pd  # データ操作用ライブラリのインポート
# import numpy as np  # 数値計算用ライブラリのインポート
# from sklearn.model_selection import train_test_split  # データ分割用モジュールのインポート
# from sklearn.feature_extraction.text import TfidfVectorizer  # TF-IDFベクトライザーをインポート
# from sklearn.ensemble import RandomForestClassifier  # ランダムフォレスト分類器をインポート
# from sklearn.metrics import log_loss  # ログロスを計算する関数をインポート
# from sklearn.preprocessing import LabelEncoder  # ラベルエンコーダをインポート

# # データをロードします
# train = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/train.csv')  # トレーニングデータの読み込み
# test = pd.read_csv('/kaggle/input/lmsys-chatbot-arena/test.csv')  # テストデータの読み込み

# # データを検査します
# print(train.head())  # トレーニングデータの最初の5行を表示
# print(test.head())  # テストデータの最初の5行を表示

# # データの前処理
# # 応答を1つのテキスト特徴として結合します
# train['response_combined'] = train['response_a'] + ' ' + train['response_b']  # 応答の結合
# test['response_combined'] = test['response_a'] + ' ' + test['response_b']  # テストデータの応答も結合

# # ターゲットラベルをエンコードします
# label_encoder = LabelEncoder()  # ラベルエンコーダのインスタンスを作成
# train['winner'] = label_encoder.fit_transform(train[['winner_model_a', 'winner_model_b', 'winner_tie']].idxmax(axis=1))  # 勝者のラベルをエンコード

# # 特徴量エンジニアリング
# # 結合された応答をTF-IDFを使用してベクトル化します
# tfidf = TfidfVectorizer(max_features=1000)  # TF-IDFベクトライザーを作成
# X_train_tfidf = tfidf.fit_transform(train['response_combined'])  # トレーニングデータをベクトル化
# X_test_tfidf = tfidf.transform(test['response_combined'])  # テストデータをベクトル化

# # モデル学習のためのデータを準備します
# X_train, X_val, y_train, y_val = train_test_split(X_train_tfidf, train['winner'], test_size=0.2, random_state=42)  # データをトレーニングとバリデーションに分割

# # モデルをトレーニングします
# model = RandomForestClassifier(n_estimators=100, random_state=42)  # ランダムフォレストモデルを作成
# model.fit(X_train, y_train)  # モデルのトレーニング

# # モデルをバリデーションします
# y_val_pred_proba = model.predict_proba(X_val)  # バリデーションデータに対する予測確率を計算
# val_log_loss = log_loss(y_val, y_val_pred_proba)  # バリデーションロスを計算
# print(f'Validation Log Loss: {val_log_loss}')  # バリデーションロスを表示

# # テストセットに対して予測します
# test_pred_proba = model.predict_proba(X_test_tfidf)  # テストデータに対する予測確率を計算

# # 提出ファイルを準備します
# submission = pd.DataFrame(test['id'], columns=['id'])  # 提出用データフレームを作成
# submission['winner_model_a'] = test_pred_proba[:, label_encoder.transform(['winner_model_a'])]  # モデルAの勝者確率を加える
# submission['winner_model_b'] = test_pred_proba[:, label_encoder.transform(['winner_model_b'])]  # モデルBの勝者確率を加える
# submission['winner_tie'] = test_pred_proba[:, label_encoder.transform(['winner_tie'])]  # 引き分けの勝者確率を加える
# submission.to_csv('submission.csv', index=False)  # 提出ファイルをCSV形式で保存

# # 提出ファイルを検査します
# print(submission.head())  # 提出ファイルの最初の5行を表示