## AIによるトランプの分類

### 0. Python プログラミングの基礎

#### 0.1. 情報の表示

次のコードを以下のコードセルに書き込み、実行してみましょう。  
「`Hello World!`」と表示されます。

```python
print("Hello World!")
```

> `"` のマークの打ち方は？  
> → `Shift` キーを押しながら、数字の `2` を打ちましょう。

In [None]:
# ↓にコードを書いて実行しよう


#### 0.2. 電卓としての使用

次の計算結果を、Pythonで求めてみましょう。

$$
2 \times 3 + 1
$$

次のコードを以下のコードセルに書き込み、実行してみましょう。  
表示される計算結果は正しいでしょうか？  

```python
print(2 * 3 + 1)
```

> `+` や `*` マークの打ち方は？  
> → `Shift` キーを押しながら、`L` の右隣のキー、そのまた右隣のキーを打ちましょう。  
> ちなみに、 `*` は掛け算記号 $\times$ の代わりに使われています。

In [1]:
# ↓にコードを書いて実行しよう


#### 0.3. 変数への代入

時給1,200円で6時間働いた時の給料をPythonで求めてみましょう。  
次のコードを以下のコードセルに書き込み、実行してみましょう。  
表示される計算結果は正しいでしょうか？  

```python
jikyu = 1200
roudou = 6
kyuryo = jikyu * roudou
print(kyuryo)
```

In [None]:
# ↓にコードを書いて実行しよう


#### 0.4. ノートブックでの表示方法

コードセルの最後の行に書かれた変数や値は、コードを実行するとその中身が表示されます。  
ただし、変数への代入をする時などは何も表示されません。  

次のコードを、1行書く→実行する→また1行書き足す→実行する、を繰り返して、表示が変わることを確認しましょう。

```python
1 + 1
a = 3
a
a + 4
```

In [None]:
# ↓にコードを1行ずつ書いて実行しよう


### AI開発の前の下準備

In [None]:
# AI開発に使うライブラリのインストール
!pip install pandas matplotlib scikit-learn

In [None]:
# 今回使うライブラリの読み込み
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import ConfusionMatrixDisplay
from sklearn.metrics import accuracy_score, precision_score, recall_score

### トランプデッキの読み込み

In [None]:
# 同じフォルダに入っている `TrumpDeck.csv` というファイルを読み込んで、 
# `deck` という名前を付ける
deck = pd.read_csv("./TrumpDeck.csv")

# 読み込んだデータからランダムに5件の情報を表示する
deck.sample(5)

### 教師データの設定

In [None]:
# 法則を推測するための根拠として `マーク` と `数` 列の情報を使う
features = ["マーク","数"]
# データから根拠として使う情報だけを抜き出す
X = deck[features]
# 文字のデータを分解して数字にする
X = pd.get_dummies(X, drop_first=True)
# 根拠のデータからランダムに5件の情報を表示する
X.sample(5)

In [None]:
# 法則の正解判定は `非対称` 列の情報を使う
target = "非対称"
# データから正解判定に使う情報だけを抜き出す
y = deck[target]
# 正解判定のデータからランダムに5件の情報を表示する
y.sample(5)

### 学習データと評価データへの分割

In [None]:
# 根拠のデータと正解判定のデータをペアにして、
# 学習用と答え合わせ用の半々に分ける
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.5, random_state=0
)

In [None]:
# 学習用の根拠データの一部を表示する
X_train.head()

In [None]:
# 学習用の世界判定データの一部を表示する
y_train.head()

### 法則の推測

In [None]:
# AIを呼び出す
clf = RandomForestClassifier()
# AIにデータを与えて法則を学習させる
clf = clf.fit(X_train, y_train)

In [None]:
# 与えられたデータでの答え合わせの結果を表示する
ConfusionMatrixDisplay.from_estimator(clf, X_train, y_train, labels=[True, False])
plt.show()

### 回答

In [None]:
# 答え合わせ用のデータでの予測を行う
y_test_pred = clf.predict(X_test)
# 予測結果のデータを整形
y_test_pred = pd.Series(y_test_pred, index=y_test.index)
y_test_pred.name = "予測"
# 予測結果のデータを根拠のデータと合わせて表示
pd.concat([X_test, y_test_pred, y_test], axis="columns")

### 答え合わせ

In [None]:
# 答え合わせ用データでの答え合わせの結果を表示する
ConfusionMatrixDisplay.from_estimator(clf, X_test, y_test, labels=[True, False])
plt.show()

### 点数計算

In [None]:
# 正解率の計算
acc_test = accuracy_score(y_test, y_test_pred)
# 適合率の計算
pre_test = precision_score(y_test, y_test_pred)
# 検出率の計算
rec_test = recall_score(y_test, y_test_pred)

# 計算した点数の表示
print(f"正解率 : {acc_test*100:.2f}%")
print(f"適合率 : {pre_test*100:.2f}%")
print(f"検出率 : {rec_test*100:.2f}%")