# 要約 
このJupyter Notebookは、「LLM 20 Questions」コンペティションにおけるゲームデータの分析を行っています。ノートブックは、推測者と回答者の勝率を計算し、推測者のリーダーボードや特徴的なワードクラウドを生成することを目的としています。以下に、主要な手法や使用されているライブラリ、解決している問題について要約します。

### 問題の概要
- データ分析を通じて、推測者と回答者の勝率を評価し、どのチームが成功したのかを明らかにすること。
- ゲームにおける質問の傾向を視覚化し、よく使われる質問や特定のカテゴリーに対する成功率を分析すること。

### 使用されている手法
1. **データの前処理**: 
   - Pandasを使ってゲームのデータセットを読み込み、特定の列（質問、回答、推測）をリスト型に変換。
   - `keyword_guessed`関数を使って、推測が正しいかどうかを判断。

2. **勝率の計算**:
   - チームごとのゲーム数を集計し、推測者と回答者の勝率を計算する。
   - 効率的なデータ処理のために、NumPyとPandasの関数を利用。

3. **データの視覚化**:
   - MatplotlibやWordCloudライブラリを用いて、質問のワードクラウドを生成し、最も多く使われる質問を視覚的に表示。
   - 効率的な情報提供のため、Markdownセルを使って結果を整理して表示。

4. **TF-IDF**:
   - `TfidfVectorizer`を使って質問データをベクトル化し、重要な質問を特定。

### 使用されているライブラリ
- **Pandas**: データフレーム操作やCSVファイルの読み込み。
- **Matplotlib**: データの可視化。
- **WordCloud**: 質問のワードクラウドの生成。
- **Scikit-learn**: テキストデータの特徴量抽出に使用されるTF-IDFベクトル化。

ノートブックの中では、さまざまな分析結果が提供されており、特にカテゴリーごとの成功したエピソードや質問の一般的な傾向が掘り下げられています。また、他の参加者からのフィードバックもあり、コミュニティでの評価を反映した内容となっています。

---


# 用語概説 
以下は、提供されたJupyter Notebookに関連する機械学習・深層学習分野の専門用語の解説です。特に初心者がつまずきやすいマイナーな用語や、実務経験がないと馴染みにくいものに焦点を当てています。

1. **TfidfVectorizer**: 文書内の単語の重要度を計算するための手法で、単語の出現頻度と逆文書頻度（IDF）を組み合わせて、各単語に数値的な重みを与える。これにより、特に情報を持つ単語を強調することができる。

2. **ワードクラウド**: テキストデータ内で出現する単語の重要度に応じて視覚的に表示したもの。頻出単語ほど大きな字体で表示されるため、テキストの内容を直感的に理解しやすくするツール。

3. **ストップワード**: 自然言語処理において、分析においてあまり重要でないとみなされる単語のリスト（例: "the", "is", "in" など）。これらを除外することで、分析対象の文書の意味をより明確にする。

4. **正規化 (Normalization)**: データを一定の基準に合わせる処理。文字列の場合、小文字化や空白の削除、特殊文字の除去などが含まれる。これにより、データの一貫性を保ち、比較や検索を容易にする。

5. **エピソード (Episode)**: 一連のゲームプレイやトランザクションのことを指す。コンペティションにおいて、特定の条件やルールに基づいて行われる一回のゲームを示すことが多い。

6. **カテゴリー (Category)**: データセット内の項目を分類するためのラベル。例えば「動物」「植物」「場所」など、特定のトピックやテーマに基づいてグループ分けを行う。

7. **Confidence (信頼度)**: モデルやエージェントが出した結果や予測に対する自信のレベル。通常、数値で表現され、信頼度が高いほど予測が正確であることが期待される。

8. **ゲーム数 (Number of games)**: 提出物が参加した数を表す。今回のコンペティションの文脈では、各チームやエージェントが参加したゲームの合計数を指す。

9. **代替キーワード (Alternative Keywords)**: 正解のキーワードの他に、同じ意味合いを持つ、または類似のコンセプトを表す単語のリスト。推測時に候補として考慮されることがある。

10. **提案数 (Submissions)**: コンペティションや作品の評価に対して行われた提出の回数。異なるアルゴリズムや戦略を試すために、参加者は複数のエージェントを提出することができる。

これらの用語はNotebook内で使用されている用語や機能に関連し、初心者が理解を深めるために役立つ情報を提供します。

---


<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Table_of_Contents
Show games from the best in each category:
* [Guesser leaderbord](#Guesser_leaderbord)
* [Answerer leaderbord](#Answerer_leaderbord)
* [Guesser submission_leaderbord](#Guesser_submission_leaderbord)
* [Answerer submission leaderbord](#Answerer_submission_leaderbord)
* [Questions Wordcould](#Questions_wordcould)

</div>
<div class="column-right">

# 日本語訳

# 目次
カテゴリーごとのトップゲームを表示します:
* [推測者リーダーボード](#Guesser_leaderbord)
* [回答者リーダーボード](#Answerer_leaderbord)
* [推測者提出リーダーボード](#Guesser_submission_leaderbord)
* [回答者提出リーダーボード](#Answerer_submission_leaderbord)
* [質問のワードクラウド](#Questions_wordcould)


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
import pandas as pd
from ast import literal_eval
from IPython.display import display, Markdown
import string
import json

import nltk
from nltk.corpus import stopwords
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
from sklearn.feature_extraction.text import TfidfVectorizer
from collections import Counter
```

</div>
<div class="column-right">

# 日本語訳

```python
import pandas as pd
from ast import literal_eval
from IPython.display import display, Markdown
import string
import json

import nltk
from nltk.corpus import stopwords
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
from sklearn.feature_extraction.text import TfidfVectorizer
from collections import Counter
```

</div>
</details>

In [None]:
import pandas as pd
from ast import literal_eval
from IPython.display import display, Markdown
import string
import json

import nltk
from nltk.corpus import stopwords
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
from sklearn.feature_extraction.text import TfidfVectorizer
from collections import Counter

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
df = pd.read_csv("/kaggle/input/llm-20-questions-games-dataset/LLM-20Questions-games.csv", converters={col_list:literal_eval for col_list in ["answers", "questions", "guesses"]})
df
```

</div>
<div class="column-right">

# 日本語訳

```python
df = pd.read_csv("/kaggle/input/llm-20-questions-games-dataset/LLM-20Questions-games.csv", converters={col_list:literal_eval for col_list in ["answers", "questions", "guesses"]})
df
```

</div>
</details>

In [None]:
df = pd.read_csv("/kaggle/input/llm-20-questions-games-dataset/LLM-20Questions-games.csv", converters={col_list:literal_eval for col_list in ["answers", "questions", "guesses"]})
df

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def keyword_guessed(guess: str, keyword:str, alts:list[str]) -> bool:
    # From competition source llm_20_questions.py
    def normalize(s: str) -> str:
        t = str.maketrans("", "", string.punctuation)
        return s.lower().replace("the", "").replace(" ", "").translate(t)

    if normalize(guess) == normalize(keyword):
        return True
    for s in alts:
        if normalize(guess) == normalize(s):
            return True

    return False
```

</div>
<div class="column-right">

# 日本語訳

```python
def keyword_guessed(guess: str, keyword:str, alts:list[str]) -> bool:
    # コンペティションのソース llm_20_questions.py からの関数
    def normalize(s: str) -> str:
        # 文字列の正規化を行う関数
        t = str.maketrans("", "", string.punctuation)
        return s.lower().replace("the", "").replace(" ", "").translate(t)

    if normalize(guess) == normalize(keyword):
        return True  # 推測がキーワードと一致する場合
    for s in alts:
        if normalize(guess) == normalize(s):
            return True  # 推測が代替キーワードのいずれかと一致する場合

    return False  # 一致しない場合
```

</div>
</details>

In [None]:
def keyword_guessed(guess: str, keyword:str, alts:list[str]) -> bool:
    # コンペティションのソース llm_20_questions.py からの関数
    def normalize(s: str) -> str:
        # 文字列の正規化を行う関数
        t = str.maketrans("", "", string.punctuation)
        return s.lower().replace("the", "").replace(" ", "").translate(t)

    if normalize(guess) == normalize(keyword):
        return True  # 推測がキーワードと一致する場合
    for s in alts:
        if normalize(guess) == normalize(s):
            return True  # 推測が代替キーワードのいずれかと一致する場合

    return False  # 一致しない場合

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
exec(open("/kaggle/input/llm-20-questions/llm_20_questions/keywords.py").read()) # create KEYWORDS_JSON
KEYWORDS_JSON = json.loads(KEYWORDS_JSON)
# needed to apply keyword_guessed 
KEYWORD_TO_ALTS = {words["keyword"]:words["alts"] for category in KEYWORDS_JSON for words in category["words"]}
# KEYWORD_TO_ALTS
```

</div>
<div class="column-right">

# 日本語訳

```python
exec(open("/kaggle/input/llm-20-questions/llm_20_questions/keywords.py").read()) # KEYWORDS_JSON を作成
KEYWORDS_JSON = json.loads(KEYWORDS_JSON)
# keyword_guessed を適用するために必要
KEYWORD_TO_ALTS = {words["keyword"]:words["alts"] for category in KEYWORDS_JSON for words in category["words"]}
# KEYWORD_TO_ALTS
```

</div>
</details>

In [None]:
exec(open("/kaggle/input/llm-20-questions/llm_20_questions/keywords.py").read()) # KEYWORDS_JSON を作成
KEYWORDS_JSON = json.loads(KEYWORDS_JSON)
# keyword_guessed を適用するために必要
KEYWORD_TO_ALTS = {words["keyword"]:words["alts"] for category in KEYWORDS_JSON for words in category["words"]}
# KEYWORD_TO_ALTS

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# fix `guessed`. Use competition function instead of isin 
df["guessed"]=df.apply(lambda row: keyword_guessed(row.guesses[-1] if len(row.guesses)>0 else "", row.keyword, KEYWORD_TO_ALTS.get(row.keyword,[])), axis=1)

# games count by team, to normalize
guesser_counts = {k:v for k,v in df.guesser.value_counts().items()}
answerer_counts = {k:v for k,v in df.answerer.value_counts().items()}

winner_df = df.loc[df.guessed]
winner_df
```

</div>
<div class="column-right">

# 日本語訳

```python
# `guessed`の修正。isinの代わりにコンペティションの関数を使用
df["guessed"]=df.apply(lambda row: keyword_guessed(row.guesses[-1] if len(row.guesses)>0 else "", row.keyword, KEYWORD_TO_ALTS.get(row.keyword,[])), axis=1)

# チームごとのゲーム数をカウントして正規化する
guesser_counts = {k:v for k,v in df.guesser.value_counts().items()}
answerer_counts = {k:v for k,v in df.answerer.value_counts().items()}

winner_df = df.loc[df.guessed]  # 推測に成功したゲームのデータフレーム
winner_df
```

</div>
</details>

In [None]:
# `guessed`の修正。isinの代わりにコンペティションの関数を使用
df["guessed"]=df.apply(lambda row: keyword_guessed(row.guesses[-1] if len(row.guesses)>0 else "", row.keyword, KEYWORD_TO_ALTS.get(row.keyword,[])), axis=1)

# チームごとのゲーム数をカウントして正規化する
guesser_counts = {k:v for k,v in df.guesser.value_counts().items()}
answerer_counts = {k:v for k,v in df.answerer.value_counts().items()}

winner_df = df.loc[df.guessed]  # 推測に成功したゲームのデータフレーム
winner_df

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
winner_df.guesser.value_counts().head(10)
```

</div>
<div class="column-right">

# 日本語訳

```python
winner_df.guesser.value_counts().head(10)  # 最も成功した推測者のカウントを表示
```

</div>
</details>

In [None]:
winner_df.guesser.value_counts().head(10)  # 最も成功した推測者のカウントを表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def fmt_team_winrate(team, team_fmt = "{:30} winrate: {:.3%} ({}/{})")->str:
    return team_fmt.format(team[0], team[1][0], team[1][1], team[1][2])

def winrate(win_counts:dict, total_counts:dict)->list:
    ratio_win = {k:(v/total_counts.get(k,1), v, total_counts.get(k)) for k,v in win_counts}
    return sorted(ratio_win.items(), key=lambda item: item[1][0], reverse = True)
```

</div>
<div class="column-right">

# 日本語訳

```python
def fmt_team_winrate(team, team_fmt = "{:30} winrate: {:.3%} ({}/{})")->str:
    # チームの勝率をフォーマットする関数
    return team_fmt.format(team[0], team[1][0], team[1][1], team[1][2])

def winrate(win_counts:dict, total_counts:dict)->list:
    # 勝率を計算する関数
    ratio_win = {k:(v/total_counts.get(k,1), v, total_counts.get(k)) for k,v in win_counts}
    return sorted(ratio_win.items(), key=lambda item: item[1][0], reverse = True)  # 勝率でソート
```

</div>
</details>

In [None]:
def fmt_team_winrate(team, team_fmt = "{:30} winrate: {:.3%} ({}/{})")->str:
    # チームの勝率をフォーマットする関数
    return team_fmt.format(team[0], team[1][0], team[1][1], team[1][2])

def winrate(win_counts:dict, total_counts:dict)->list:
    # 勝率を計算する関数
    ratio_win = {k:(v/total_counts.get(k,1), v, total_counts.get(k)) for k,v in win_counts}
    return sorted(ratio_win.items(), key=lambda item: item[1][0], reverse = True)  # 勝率でソート

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def print_winrate(winner_df=winner_df, df=df):
    nb_total_games = len(df)
    nb_wins = len(winner_df)
    print(fmt_team_winrate(("Winrate total",(nb_wins/nb_total_games,nb_wins,nb_total_games))))

print_winrate()
```

</div>
<div class="column-right">

# 日本語訳

```python
def print_winrate(winner_df=winner_df, df=df):
    # 勝率を表示する関数
    nb_total_games = len(df)  # 総ゲーム数
    nb_wins = len(winner_df)  # 勝利数
    print(fmt_team_winrate(("Winrate total",(nb_wins/nb_total_games,nb_wins,nb_total_games))))  # 総勝率を表示

print_winrate()  # 勝率を出力
```

</div>
</details>

In [None]:
def print_winrate(winner_df=winner_df, df=df):
    # 勝率を表示する関数
    nb_total_games = len(df)  # 総ゲーム数
    nb_wins = len(winner_df)  # 勝利数
    print(fmt_team_winrate(("Winrate total",(nb_wins/nb_total_games,nb_wins,nb_total_games))))  # 総勝率を表示

print_winrate()  # 勝率を出力

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Guesser_leaderbord

</div>
<div class="column-right">

# 日本語訳

# 推測者リーダーボード


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
guesser_win = winrate(winner_df.guesser.value_counts().items(), guesser_counts)
for team in guesser_win[:10]:
    print(fmt_team_winrate(team))
```

</div>
<div class="column-right">

# 日本語訳

```python
guesser_win = winrate(winner_df.guesser.value_counts().items(), guesser_counts)  # 推測者の勝率を計算
for team in guesser_win[:10]:  # 上位10チームの勝率を表示
    print(fmt_team_winrate(team))
```

</div>
</details>

In [None]:
guesser_win = winrate(winner_df.guesser.value_counts().items(), guesser_counts)  # 推測者の勝率を計算
for team in guesser_win[:10]:  # 上位10チームの勝率を表示
    print(fmt_team_winrate(team))

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Answerer_leaderbord
[Table of Contents](#Table_of_Contents)

</div>
<div class="column-right">

# 日本語訳

# 回答者リーダーボード
[目次](#目次)


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
answerer_win = winrate(winner_df.answerer.value_counts().items(), answerer_counts)
for team in answerer_win[:10]:
    print(fmt_team_winrate(team))
```

</div>
<div class="column-right">

# 日本語訳

```python
answerer_win = winrate(winner_df.answerer.value_counts().items(), answerer_counts)  # 回答者の勝率を計算
for team in answerer_win[:10]:  # 上位10チームの勝率を表示
    print(fmt_team_winrate(team))
```

</div>
</details>

In [None]:
answerer_win = winrate(winner_df.answerer.value_counts().items(), answerer_counts)  # 回答者の勝率を計算
for team in answerer_win[:10]:  # 上位10チームの勝率を表示
    print(fmt_team_winrate(team))

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

## Top guessed keywords:

</div>
<div class="column-right">

# 日本語訳

## 最も推測されたキーワード:


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
winner_df.keyword.value_counts() # france in top, probably because of the baseline example
```

</div>
<div class="column-right">

# 日本語訳

```python
winner_df.keyword.value_counts()  # フランスがトップ、基準の例によるものと思われる
```

</div>
</details>

In [None]:
winner_df.keyword.value_counts()  # フランスがトップ、基準の例によるものと思われる

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
episode_agents = pd.read_csv("/kaggle/input/llm-20-questions-games-dataset/EpisodeAgents.csv")
episode_agents=episode_agents.groupby(["EpisodeId","SubmissionId"]).first()
episode_agents
```

</div>
<div class="column-right">

# 日本語訳

```python
episode_agents = pd.read_csv("/kaggle/input/llm-20-questions-games-dataset/EpisodeAgents.csv")  # エピソードエージェントデータを読み込む
episode_agents=episode_agents.groupby(["EpisodeId","SubmissionId"]).first()  # エピソードIDと提出IDでグループ化
episode_agents
```

</div>
</details>

In [None]:
episode_agents = pd.read_csv("/kaggle/input/llm-20-questions-games-dataset/EpisodeAgents.csv")  # エピソードエージェントデータを読み込む
episode_agents=episode_agents.groupby(["EpisodeId","SubmissionId"]).first()  # エピソードIDと提出IDでグループ化
episode_agents

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
def show_game(row:pd.Series):
    if row.empty:
        return 
    table_format = "| {question} | {answer} | {guess} |"
    history = "\n".join([table_format.format(question="question",answer="answer", guess="guess"), table_format.format(question="---",answer="---", guess="---") ] + [table_format.format(question=question,answer=answer, guess=guess) for answer, question, guess in zip(row.answers, row.questions, row.guesses)])
    guesser_score = episode_agents.loc[(row.game_num, row.guesser_SubmissionId)]
    guesser_score = f"{guesser_score.InitialScore:.2f}->{guesser_score.UpdatedScore:.2f} Confidence={guesser_score.UpdatedConfidence:.2f}" if not guesser_score.empty else ""
    
    answerer_score = episode_agents.loc[(row.game_num, row.answerer_SubmissionId)]
    answerer_score = f"{answerer_score.InitialScore:.2f}->{answerer_score.UpdatedScore:.2f} Confidence={answerer_score.UpdatedConfidence:.2f}" if not answerer_score.empty else ""
    
    return display(Markdown(f"""\
* {row.game_num=}
* Guesser:  **{row.guesser}** score: {guesser_score}
* Answerer: **{row.answerer}** score: {answerer_score}
* Keyword: **{row.keyword}** Category: {row.category} 
* Nb round: {row.nb_round} {row.CreateTime}

{history}
"""))
    
show_game(winner_df.iloc[0]) # this example show that `the answer is: france` did not won the game, need exact keyword or one of alts
```

</div>
<div class="column-right">

# 日本語訳

```python
def show_game(row:pd.Series):
    # ゲームの情報を表示する関数
    if row.empty:
        return 
    table_format = "| {question} | {answer} | {guess} |"  # 表形式のフォーマット
    history = "\n".join([table_format.format(question="question",answer="answer", guess="guess"), table_format.format(question="---",answer="---", guess="---") ] + [table_format.format(question=question,answer=answer, guess=guess) for answer, question, guess in zip(row.answers, row.questions, row.guesses)])
    guesser_score = episode_agents.loc[(row.game_num, row.guesser_SubmissionId)]  # 推測者のスコア
    guesser_score = f"{guesser_score.InitialScore:.2f}->{guesser_score.UpdatedScore:.2f} Confidence={guesser_score.UpdatedConfidence:.2f}" if not guesser_score.empty else ""
    
    answerer_score = episode_agents.loc[(row.game_num, row.answerer_SubmissionId)]  # 回答者のスコア
    answerer_score = f"{answerer_score.InitialScore:.2f}->{answerer_score.UpdatedScore:.2f} Confidence={answerer_score.UpdatedConfidence:.2f}" if not answerer_score.empty else ""
    
    return display(Markdown(f"""\
* {row.game_num=}
* 推測者:  **{row.guesser}** スコア: {guesser_score}
* 回答者: **{row.answerer}** スコア: {answerer_score}
* キーワード: **{row.keyword}** カテゴリー: {row.category} 
* ラウンド数: {row.nb_round} {row.CreateTime}

{history}
"""))
    
show_game(winner_df.iloc[0])  # この例は、`the answer is: france`がゲームに勝てなかったことを示す。正確なキーワードまたは代替キーワードが必要。
```

</div>
</details>

In [None]:
def show_game(row:pd.Series):
    # ゲームの情報を表示する関数
    if row.empty:
        return 
    table_format = "| {question} | {answer} | {guess} |"  # 表形式のフォーマット
    history = "\n".join([table_format.format(question="question",answer="answer", guess="guess"), table_format.format(question="---",answer="---", guess="---") ] + [table_format.format(question=question,answer=answer, guess=guess) for answer, question, guess in zip(row.answers, row.questions, row.guesses)])
    guesser_score = episode_agents.loc[(row.game_num, row.guesser_SubmissionId)]  # 推測者のスコア
    guesser_score = f"{guesser_score.InitialScore:.2f}->{guesser_score.UpdatedScore:.2f} Confidence={guesser_score.UpdatedConfidence:.2f}" if not guesser_score.empty else ""
    
    answerer_score = episode_agents.loc[(row.game_num, row.answerer_SubmissionId)]  # 回答者のスコア
    answerer_score = f"{answerer_score.InitialScore:.2f}->{answerer_score.UpdatedScore:.2f} Confidence={answerer_score.UpdatedConfidence:.2f}" if not answerer_score.empty else ""
    
    return display(Markdown(f"""\
* {row.game_num=}
* 推測者:  **{row.guesser}** スコア: {guesser_score}
* 回答者: **{row.answerer}** スコア: {answerer_score}
* キーワード: **{row.keyword}** カテゴリー: {row.category} 
* ラウンド数: {row.nb_round} {row.CreateTime}

{history}
"""))
    
show_game(winner_df.iloc[0])  # この例は、`the answer is: france`がゲームに勝てなかったことを示す。正確なキーワードまたは代替キーワードが必要。

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
display(Markdown(f"## Best answerer **{fmt_team_winrate(answerer_win[0])}**"))
for i, row in winner_df[winner_df.answerer==answerer_win[0][0]].iterrows():
    show_game(row)
```

</div>
<div class="column-right">

# 日本語訳

```python
display(Markdown(f"## 最優秀回答者 **{fmt_team_winrate(answerer_win[0])}**"))
for i, row in winner_df[winner_df.answerer==answerer_win[0][0]].iterrows():
    show_game(row)  # 最優秀回答者のゲームを表示
```

</div>
</details>

In [None]:
display(Markdown(f"## 最優秀回答者 **{fmt_team_winrate(answerer_win[0])}**"))
for i, row in winner_df[winner_df.answerer==answerer_win[0][0]].iterrows():
    show_game(row)  # 最優秀回答者のゲームを表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
display(Markdown(f"## Best guesser **{fmt_team_winrate(guesser_win[0])}**"))
for i, row in winner_df[winner_df.guesser==guesser_win[0][0]].iterrows():
    show_game(row)
```

</div>
<div class="column-right">

# 日本語訳

```python
display(Markdown(f"## 最優秀推測者 **{fmt_team_winrate(guesser_win[0])}**"))
for i, row in winner_df[winner_df.guesser==guesser_win[0][0]].iterrows():
    show_game(row)  # 最優秀推測者のゲームを表示
```

</div>
</details>

In [None]:
display(Markdown(f"## 最優秀推測者 **{fmt_team_winrate(guesser_win[0])}**"))
for i, row in winner_df[winner_df.guesser==guesser_win[0][0]].iterrows():
    show_game(row)  # 最優秀推測者のゲームを表示

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Best submissions
Same, per SubmissionId instead of just guesser/answerer.  
The goal is to have a more precise leaderbord, a team could submit multiple agents with different strategies and results.    
With the submissionId we can see if a new submission perform well (no matter how many submissions the team made and how many games they played)


</div>
<div class="column-right">

# 日本語訳

# 最優秀提出物
提出物IDごとの順位を示します。チームは異なる戦略や結果を持つ複数のエージェントを提出できます。  
提出IDとともに新しい提出が良好に実行されているかを確認できます（チームが何回提出しても、どれだけゲームをプレイしても関係ありません）。


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
guesser_sub_counts = {k:v for k,v in df.guesser_SubmissionId.value_counts().items()}
answerer_sub_counts = {k:v for k,v in df.answerer_SubmissionId.value_counts().items()}

guesser_sub_win = winrate(winner_df.guesser_SubmissionId.value_counts().items(), guesser_sub_counts)
answerer_sub_win = winrate(winner_df.answerer_SubmissionId.value_counts().items(), answerer_sub_counts)

subId_to_team = {**winner_df.groupby("answerer_SubmissionId").answerer.first(), **winner_df.groupby("guesser_SubmissionId").guesser.first()}
```

</div>
<div class="column-right">

# 日本語訳

```python
guesser_sub_counts = {k:v for k,v in df.guesser_SubmissionId.value_counts().items()}  # 推測者の提出数をカウント
answerer_sub_counts = {k:v for k,v in df.answerer_SubmissionId.value_counts().items()}  # 回答者の提出数をカウント

guesser_sub_win = winrate(winner_df.guesser_SubmissionId.value_counts().items(), guesser_sub_counts)  # 推測者の勝率を計算
answerer_sub_win = winrate(winner_df.answerer_SubmissionId.value_counts().items(), answerer_sub_counts)  # 回答者の勝率を計算

subId_to_team = {**winner_df.groupby("answerer_SubmissionId").answerer.first(), **winner_df.groupby("guesser_SubmissionId").guesser.first()}  # 提出IDをチームにマッピング
```

</div>
</details>

In [None]:
guesser_sub_counts = {k:v for k,v in df.guesser_SubmissionId.value_counts().items()}  # 推測者の提出数をカウント
answerer_sub_counts = {k:v for k,v in df.answerer_SubmissionId.value_counts().items()}  # 回答者の提出数をカウント

guesser_sub_win = winrate(winner_df.guesser_SubmissionId.value_counts().items(), guesser_sub_counts)  # 推測者の勝率を計算
answerer_sub_win = winrate(winner_df.answerer_SubmissionId.value_counts().items(), answerer_sub_counts)  # 回答者の勝率を計算

subId_to_team = {**winner_df.groupby("answerer_SubmissionId").answerer.first(), **winner_df.groupby("guesser_SubmissionId").guesser.first()}  # 提出IDをチームにマッピング

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Guesser_submission_leaderbord
[Table of Contents](#Table_of_Contents)

</div>
<div class="column-right">

# 日本語訳

# 推測者提出リーダーボード
[目次](#目次)


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
for team in guesser_sub_win[:10]:
    team = (f"{subId_to_team[team[0]]} {team[0]}",(team[1]))
    print(fmt_team_winrate(team))
```

</div>
<div class="column-right">

# 日本語訳

```python
for team in guesser_sub_win[:10]:  # 上位10チームの推測者提出を表示
    team = (f"{subId_to_team[team[0]]} {team[0]}",(team[1]))
    print(fmt_team_winrate(team))
```

</div>
</details>

In [None]:
for team in guesser_sub_win[:10]:  # 上位10チームの推測者提出を表示
    team = (f"{subId_to_team[team[0]]} {team[0]}",(team[1]))
    print(fmt_team_winrate(team))

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
display(Markdown(f"## Games from the best guesser agents: SubmissionId={fmt_team_winrate(guesser_sub_win[0])}"))
for i, row in winner_df[winner_df.guesser_SubmissionId==guesser_sub_win[0][0]].iterrows():
    show_game(row)
```

</div>
<div class="column-right">

# 日本語訳

```python
display(Markdown(f"## 最優秀推測者エージェントのゲーム: 提出ID={fmt_team_winrate(guesser_sub_win[0])}"))
for i, row in winner_df[winner_df.guesser_SubmissionId==guesser_sub_win[0][0]].iterrows():
    show_game(row)  # 最優秀推測者エージェントのゲームを表示
```

</div>
</details>

In [None]:
display(Markdown(f"## 最優秀推測者エージェントのゲーム: 提出ID={fmt_team_winrate(guesser_sub_win[0])}"))
for i, row in winner_df[winner_df.guesser_SubmissionId==guesser_sub_win[0][0]].iterrows():
    show_game(row)  # 最優秀推測者エージェントのゲームを表示

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Answerer_submission_leaderbord
[Table of Contents](#Table_of_Contents)

</div>
<div class="column-right">

# 日本語訳

# 回答者提出リーダーボード
[目次](#目次)


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
for team in answerer_sub_win[:10]:
    team = (f"{subId_to_team[team[0]]} {team[0]}",(team[1]))
    print(fmt_team_winrate(team))
```

</div>
<div class="column-right">

# 日本語訳

```python
for team in answerer_sub_win[:10]:  # 上位10チームの回答者提出を表示
    team = (f"{subId_to_team[team[0]]} {team[0]}",(team[1]))
    print(fmt_team_winrate(team))
```

</div>
</details>

In [None]:
for team in answerer_sub_win[:10]:  # 上位10チームの回答者提出を表示
    team = (f"{subId_to_team[team[0]]} {team[0]}",(team[1]))
    print(fmt_team_winrate(team))

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
display(Markdown(f"## Games from the best answerer agents: {subId_to_team[answerer_sub_win[0][0]]} SubmissionId={fmt_team_winrate(answerer_sub_win[0])}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==answerer_sub_win[0][0]].iterrows():
    show_game(row)
```

</div>
<div class="column-right">

# 日本語訳

```python
display(Markdown(f"## 最優秀回答者エージェントのゲーム: {subId_to_team[answerer_sub_win[0][0]]} 提出ID={fmt_team_winrate(answerer_sub_win[0])}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==answerer_sub_win[0][0]].iterrows():
    show_game(row)  # 最優秀回答者エージェントのゲームを表示
```

</div>
</details>

In [None]:
display(Markdown(f"## 最優秀回答者エージェントのゲーム: {subId_to_team[answerer_sub_win[0][0]]} 提出ID={fmt_team_winrate(answerer_sub_win[0])}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==answerer_sub_win[0][0]].iterrows():
    show_game(row)  # 最優秀回答者エージェントのゲームを表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
display(Markdown(f"## Games from the 2nd best answerer agents: {subId_to_team[answerer_sub_win[1][0]]} SubmissionId={fmt_team_winrate(answerer_sub_win[1])}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==answerer_sub_win[1][0]].iterrows():
    show_game(row)
```

</div>
<div class="column-right">

# 日本語訳

```python
display(Markdown(f"## 2番目に優秀な回答者エージェントのゲーム: {subId_to_team[answerer_sub_win[1][0]]} 提出ID={fmt_team_winrate(answerer_sub_win[1])}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==answerer_sub_win[1][0]].iterrows():
    show_game(row)  # 2番目に優秀な回答者エージェントのゲームを表示
```

</div>
</details>

In [None]:
display(Markdown(f"## 2番目に優秀な回答者エージェントのゲーム: {subId_to_team[answerer_sub_win[1][0]]} 提出ID={fmt_team_winrate(answerer_sub_win[1])}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==answerer_sub_win[1][0]].iterrows():
    show_game(row)  # 2番目に優秀な回答者エージェントのゲームを表示

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Games from submissions with the best score
Also count previous submissions, not very useful for now

</div>
<div class="column-right">

# 日本語訳

# 最優秀スコアの提出物からのゲーム
過去の提出物もカウントしますが、今のところあまり役に立ちません


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
_, best_subId = episode_agents.iloc[episode_agents.UpdatedScore.argmax()].name
display(Markdown(f"## Submission with best score: {subId_to_team[best_subId]} SubmissionId={best_subId}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==best_subId].iterrows():
    show_game(row)
    
for i, row in winner_df[winner_df.guesser_SubmissionId==best_subId].iterrows():
    show_game(row)
```

</div>
<div class="column-right">

# 日本語訳

```python
_, best_subId = episode_agents.iloc[episode_agents.UpdatedScore.argmax()].name
display(Markdown(f"## 最優秀スコアの提出物: {subId_to_team[best_subId]} 提出ID={best_subId}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==best_subId].iterrows():
    show_game(row)  # 最優秀スコアの回答者のゲームを表示

for i, row in winner_df[winner_df.guesser_SubmissionId==best_subId].iterrows():
    show_game(row)  # 最優秀スコアの推測者のゲームを表示
```

</div>
</details>

In [None]:
_, best_subId = episode_agents.iloc[episode_agents.UpdatedScore.argmax()].name
display(Markdown(f"## 最優秀スコアの提出物: {subId_to_team[best_subId]} 提出ID={best_subId}"))
for i, row in winner_df[winner_df.answerer_SubmissionId==best_subId].iterrows():
    show_game(row)  # 最優秀スコアの回答者のゲームを表示

for i, row in winner_df[winner_df.guesser_SubmissionId==best_subId].iterrows():
    show_game(row)  # 最優秀スコアの推測者のゲームを表示

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Questions_wordcould

</div>
<div class="column-right">

# 日本語訳

# 質問のワードクラウド


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
t = str.maketrans("", "", string.punctuation)
questions_flat = [question.lower() for questions in df.questions.values for question in questions]
print("nb unique questions:",len(set(questions_flat)))
```

</div>
<div class="column-right">

# 日本語訳

```python
t = str.maketrans("", "", string.punctuation)  # 句読点を除去するための翻訳マッピング
questions_flat = [question.lower() for questions in df.questions.values for question in questions]  # 質問を小文字で平坦化
print("ユニークな質問数:",len(set(questions_flat)))  # ユニークな質問の数を表示
```

</div>
</details>

In [None]:
t = str.maketrans("", "", string.punctuation)  # 句読点を除去するための翻訳マッピング
questions_flat = [question.lower() for questions in df.questions.values for question in questions]  # 質問を小文字で平坦化
print("ユニークな質問数:",len(set(questions_flat)))  # ユニークな質問の数を表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
Counter(questions_flat).most_common(50)
```

</div>
<div class="column-right">

# 日本語訳

```python
Counter(questions_flat).most_common(50)  # 最も一般的な50の質問を表示
```

</div>
</details>

In [None]:
Counter(questions_flat).most_common(50)  # 最も一般的な50の質問を表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
nltk.download('stopwords')
stop_words = list(stopwords.words('english'))
stop_words
```

</div>
<div class="column-right">

# 日本語訳

```python
nltk.download('stopwords')  # ストップワードのダウンロード
stop_words = list(stopwords.words('english'))  # ストップワードのリストを作成
stop_words
```

</div>
</details>

In [None]:
nltk.download('stopwords')  # ストップワードのダウンロード
stop_words = list(stopwords.words('english'))  # ストップワードのリストを作成
stop_words

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%time
top_q_str = " ".join(question for question, count in Counter(questions_flat).most_common(200))
wordcloud = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(top_q_str)

# Display the generated image:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
```

</div>
<div class="column-right">

# 日本語訳

```python
%%time
top_q_str = " ".join(question for question, count in Counter(questions_flat).most_common(200))  # 上位200の質問を結合
wordcloud = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(top_q_str)  # ワードクラウドを生成

# 生成した画像を表示:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud, interpolation='bilinear')  # 画像をビリニア補間で表示
plt.axis("off")  # 軸をオフにする
plt.show()  # 画像を表示
```

</div>
</details>

In [None]:
%%time
top_q_str = " ".join(question for question, count in Counter(questions_flat).most_common(200))  # 上位200の質問を結合
wordcloud = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(top_q_str)  # ワードクラウドを生成

# 生成した画像を表示:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud, interpolation='bilinear')  # 画像をビリニア補間で表示
plt.axis("off")  # 軸をオフにする
plt.show()  # 画像を表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%time
stop_words+=["keyword","question","questions","sure","please","answer","answerer","answers","yes"]
wordcloud_words = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(top_q_str)

# Display the generated image:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud_words, interpolation='bilinear')
plt.axis("off")
plt.show()
```

</div>
<div class="column-right">

# 日本語訳

```python
%%time
stop_words+=["keyword","question","questions","sure","please","answer","answerer","answers","yes"]  # 追加のストップワード
wordcloud_words = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(top_q_str)  # ワードクラウドを生成

# 生成した画像を表示:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud_words, interpolation='bilinear')  # 画像をビリニア補間で表示
plt.axis("off")  # 軸をオフにする
plt.show()  # 画像を表示
```

</div>
</details>

In [None]:
%%time
stop_words+=["keyword","question","questions","sure","please","answer","answerer","answers","yes"]  # 追加のストップワード
wordcloud_words = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(top_q_str)  # ワードクラウドを生成

# 生成した画像を表示:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud_words, interpolation='bilinear')  # 画像をビリニア補間で表示
plt.axis("off")  # 軸をオフにする
plt.show()  # 画像を表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# tfidf = TfidfVectorizer(max_df=.98, min_df=.01, stop_words=stop_words, use_idf=True, norm=None)
# questions_tfidf = tfidf.fit_transform(questions_flat)
# questions_tfidf
```

</div>
<div class="column-right">

# 日本語訳

```python
# tfidf = TfidfVectorizer(max_df=.98, min_df=.01, stop_words=stop_words, use_idf=True, norm=None)
# questions_tfidf = tfidf.fit_transform(questions_flat)  # TF-IDFベクトルを生成
# questions_tfidf
```

</div>
</details>

In [None]:
# tfidf = TfidfVectorizer(max_df=.98, min_df=.01, stop_words=stop_words, use_idf=True, norm=None)
# questions_tfidf = tfidf.fit_transform(questions_flat)  # TF-IDFベクトルを生成
# questions_tfidf

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# tfidf.get_feature_names_out()
```

</div>
<div class="column-right">

# 日本語訳

```python
# tfidf.get_feature_names_out()  # 特徴名を取得
```

</div>
</details>

In [None]:
# tfidf.get_feature_names_out()  # 特徴名を取得

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# questions_tfidf = pd.DataFrame(questions_tfidf.todense(),columns=tfidf.get_feature_names_out())
# questions_tfidf
```

</div>
<div class="column-right">

# 日本語訳

```python
# questions_tfidf = pd.DataFrame(questions_tfidf.todense(),columns=tfidf.get_feature_names_out())  # データフレームに変換
# questions_tfidf
```

</div>
</details>

In [None]:
# questions_tfidf = pd.DataFrame(questions_tfidf.todense(),columns=tfidf.get_feature_names_out())  # データフレームに変換
# questions_tfidf

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Most asked questions from winning games

</div>
<div class="column-right">

# 日本語訳

# 勝利したゲームからの最も頻繁に尋ねられる質問


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
# questions_win = {question for questions in winner_df.questions.values for question in questions}
# print(len(questions_win))
# questions_win
```

</div>
<div class="column-right">

# 日本語訳

```python
# questions_win = {question for questions in winner_df.questions.values for question in questions}  # 勝利したゲームの質問を集合に格納
# print(len(questions_win))  # ユニークな質問の数を表示
# questions_win
```

</div>
</details>

In [None]:
# questions_win = {question for questions in winner_df.questions.values for question in questions}  # 勝利したゲームの質問を集合に格納
# print(len(questions_win))  # ユニークな質問の数を表示
# questions_win

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
all_questions_win = [question.lower() for questions in winner_df.questions.values for question in questions]
len(all_questions_win)
```

</div>
<div class="column-right">

# 日本語訳

```python
all_questions_win = [question.lower() for questions in winner_df.questions.values for question in questions]  # 勝利したゲームからのすべての質問
len(all_questions_win)  # 勝利したゲームからの質問数を表示
```

</div>
</details>

In [None]:
all_questions_win = [question.lower() for questions in winner_df.questions.values for question in questions]  # 勝利したゲームからのすべての質問
len(all_questions_win)  # 勝利したゲームからの質問数を表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
Counter(all_questions_win).most_common(50)
```

</div>
<div class="column-right">

# 日本語訳

```python
Counter(all_questions_win).most_common(50)  # 勝利したゲームで最も一般的な50の質問を表示
```

</div>
</details>

In [None]:
Counter(all_questions_win).most_common(50)  # 勝利したゲームで最も一般的な50の質問を表示

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
%%time
stop_words+=["keyword","question","questions","sure","please","answer","answerer","answers","yes"]
wordcloud_words = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(" ".join(question for question, count in Counter(all_questions_win).most_common(50)))

# Display the generated image:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud_words, interpolation='bilinear')
plt.axis("off")
plt.show()
```

</div>
<div class="column-right">

# 日本語訳

```python
%%time
stop_words+=["keyword","question","questions","sure","please","answer","answerer","answers","yes"]  # 追加のストップワード
wordcloud_words = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(" ".join(question for question, count in Counter(all_questions_win).most_common(50)))  # ワードクラウドを生成

# 生成した画像を表示:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud_words, interpolation='bilinear')  # 画像をビリニア補間で表示
plt.axis("off")  # 軸をオフにする
plt.show()  # 画像を表示
```

</div>
</details>

In [None]:
%%time
stop_words+=["keyword","question","questions","sure","please","answer","answerer","answers","yes"]  # 追加のストップワード
wordcloud_words = WordCloud(stopwords=stop_words, background_color="white", width=800, height=400).generate(" ".join(question for question, count in Counter(all_questions_win).most_common(50)))  # ワードクラウドを生成

# 生成した画像を表示:
plt.figure(figsize=(30,20))
plt.imshow(wordcloud_words, interpolation='bilinear')  # 画像をビリニア補間で表示
plt.axis("off")  # 軸をオフにする
plt.show()  # 画像を表示

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

# Episodes succesful since the keywords maj

</div>
<div class="column-right">

# 日本語訳

# キーワードが主要な成功を収めたエピソード


</div>

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
winner_df_maj = winner_df.loc[winner_df.category.isin(["place","things"])]
winner_df_maj
```

</div>
<div class="column-right">

# 日本語訳

```python
winner_df_maj = winner_df.loc[winner_df.category.isin(["place","things"])]  # 特定のカテゴリーに基づく勝者のデータフレーム
winner_df_maj
```

</div>
</details>

In [None]:
winner_df_maj = winner_df.loc[winner_df.category.isin(["place","things"])]  # 特定のカテゴリーに基づく勝者のデータフレーム
winner_df_maj

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
winner_df_maj.answerer.value_counts()
```

</div>
<div class="column-right">

# 日本語訳

```python
winner_df_maj.answerer.value_counts()  # 特定のカテゴリーにおける回答者のカウント
```

</div>
</details>

In [None]:
winner_df_maj.answerer.value_counts()  # 特定のカテゴリーにおける回答者のカウント

<details>
  <summary>pythonコードの比較（クリックすると展開されます）</summary>

<style>
.column-left{
  float: left;
  width: 47.5%;
  text-align: left;
}
.column-right{
  float: right;
  width: 47.5%;
  text-align: left;
}
.column-one{
  float: left;
  width: 100%;
  text-align: left;
}
</style>


<div class="column-left">

# original

```python
winner_df_maj.guesser.value_counts()
```

</div>
<div class="column-right">

# 日本語訳

```python
winner_df_maj.guesser.value_counts()  # 特定のカテゴリーにおける推測者のカウント
```

</div>
</details>

In [None]:
winner_df_maj.guesser.value_counts()  # 特定のカテゴリーにおける推測者のカウント