Pythonで機械学習による分類の簡単な例を実践しましょう。


1.   データの２分類（KNN法）
2.   手書き数字認識（SVMモデル）
3.   カラー画像の認識（にゅうらー）



# KNNによる分類

まず、2種類のクラスに分類する簡単な例を見てみましょう。この例では、`np.random.rand`を使用してランダムに生成した2次元のデータを[K最近傍法（KNN）](https://zero2one.jp/learningblog/k-nearest-neighbor-python/)で分類し、結果を可視化します。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification
from sklearn.neighbors import KNeighborsClassifier

# データの生成
X, y = make_classification(n_samples=200, n_features=2, n_classes=2, n_clusters_per_class=1, n_redundant=0, random_state=42)


下にコードセルを追加し、生成したデータポイントを散布図で可視化しましょう。

データは、x座標とy座標の2つの特徴（例：「滞在時間」「消費金額」）から構成されています。また、各データには、0か1のクラスラベルが付けられています。

K近傍法は、与えられたデータに最も近い*K*個のデータ（`n_neighbors`）のクラスラベルを参考にして、新しいデータのクラスを予測するアルゴリズムです。まずは*K=3*の設定で学習モデルを作ります。

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# データをトレーニングセットとテストセットに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# K最近傍法モデルの作成（n_neighborsの数値は分類結果にどう影響するか？）
knn_model = KNeighborsClassifier(n_neighbors=3)

# （モデルで学習し、予測を行い、予測精度を計算してみましょう）


訓練したモデル内部では実際どのように分類したのでしょうか？

In [None]:
# 決定境界を可視化
plt.figure(figsize=(8, 6))
plt.scatter(X_test[y_test == 0, 0], X_test[y_test == 0, 1], label='Class 0 (True)', marker='o')
plt.scatter(X_test[y_test == 1, 0], X_test[y_test == 1, 1], label='Class 1 (True)', marker='x')

h = .02
x_min, x_max = X[:, 0].min() - 0.1, X[:, 0].max() + 0.1
y_min, y_max = X[:, 1].min() - 0.1, X[:, 1].max() + 0.1
xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
Z = knn_model.predict(np.c_[xx.ravel(), yy.ravel()])
Z = Z.reshape(xx.shape)
plt.contour(xx, yy, Z, colors='k', levels=[0.5], linewidths=3)

plt.title('Simple Classification with KNN')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()



# SVMによる手書き数字の認識

次に、[MNISTデータセット](https://atmarkit.itmedia.co.jp/ait/articles/2001/22/news012.html)を使用しています。MNISTデータセットは、手書き数字の画像データセットで、0から9までの10種類の数字があります。

まずはこのデータセットのテストデータの最初のいくつかの画像を可視化します。

In [None]:
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# MNISTデータセットを読み込みます
digits = datasets.load_digits()
data = digits.data
target = digits.target

# データをトレーニングセットとテストセットに分割します
X_train, X_test, y_train, y_test = train_test_split(data, target, test_size=0.2, random_state=42)

# テストデータの最初のいくつかの画像を示す
plt.figure(figsize=(12, 4))
for i in range(10):
    plt.subplot(2, 5, i + 1)
    plt.imshow(X_test[i].reshape(8, 8), cmap='gray')
    plt.title(f'{y_test[i]}')
    plt.axis('off')


MNISTデータセットは手書き数字のデータセットであり、通常は画像認識のタスクに使用されます。この例では、各手書き数字が8x8の行列としてフラット化されている特徴を使用しています。

以下では、[Support Vector Machine (SVM)](https://avinton.com/academy/svm/)を使って画像を分類します。線形カーネルを使用しますが、他のカーネルも試すことができます。

また、ハイパーパラメータの調整も重要です。`C`パラメータ（採用する決定境界にどれぐらいの誤分類を許すか；大きいほど厳しい）が結果に影響します。

In [None]:
# SVMモデルを定義します
svm_model = SVC(kernel='linear', C=10, gamma='auto')

# （モデルで学習し、予測を行い、予測精度を計算してみましょう）


実際の予測結果を見ていきましょう。

In [None]:
# テストデータの最初のいくつかの画像を表示し、SVMの予測結果を示す
plt.figure(figsize=(12, 8))
for i in range(20):
    plt.subplot(4, 5, i + 1)
    plt.imshow(X_test[i].reshape(8, 8), cmap='gray')
    plt.title(f'{y_test[i]} (Predicted: {y_pred[i]})')
    plt.axis('off')


# 画像認識（ニューラルネットワーク）

より一般的な画像分類タスクでは、畳み込みニューラルネットワーク(CNN)などの深層学習モデルがSVMよりも良い性能を発揮することがあります。

以下はニューラルネットワークを使用してCIFAR-10データセットを分類する例です。

[CIFAR-10（Canadian Institute for Advanced Research - 10）データセット](https://atmarkit.itmedia.co.jp/ait/articles/2006/10/news021.html)は、Alex Krizhevsky氏／Vinod Nair氏／Geoffrey Hinton氏によって収集された、10の異なるクラスに属する32x32ピクセルのカラー画像で構成される公開データセットです。各画像はRGB形式で、10のクラスそれぞれに約6,000枚ずつの画像が含まれています。

CIFAR-10データセットのクラスは以下の通りです：

0. Airplane（飛行機）
1. Automobile（自動車）
1. Bird（鳥）
1. Cat（猫）
1. Deer（鹿）
1. Dog（犬）
1. Frog（カエル）
1. Horse（馬）
1. Ship（船）
1. Truck（トラック）

各クラスは、異なる視点や背景で撮影された画像で構成され、一般的な物体認識タスクのベンチマークとして使用されています。CIFAR-10データセットは、機械学習やディープラーニングアルゴリズムの評価やモデルの訓練に広く利用されています。


In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.utils import to_categorical
import matplotlib.pyplot as plt
import numpy as np

# CIFAR-10データセットの読み込み
(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()

# データの前処理
train_images, test_images = train_images / 255.0, test_images / 255.0  # ピクセル値を0から1の範囲に正規化
train_labels = to_categorical(train_labels, 10)  # ラベルをone-hotエンコード
test_labels = to_categorical(test_labels, 10)
# ラベルネームを設定
label_names = {}


In [None]:
# テストデータの最初のいくつかの画像を表示する
plt.figure(figsize=(12, 4))
for i in range(10):
    plt.subplot(2, 5, i + 1)
    # 画像を表示
    plt.imshow(test_images[i])
    # 実際のラベルを表示
    true_label = np.argmax(test_labels[i])
    plt.title(f'Category: {true_label}')
    plt.axis('off')


以下のセルで、[3層ニューラルネットワーク](https://hogetech.info/ml/dl/neural-network)を構築しましょう。

In [None]:
# ニューラルネットワークのモデルの構築

# モデルのコンパイル
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# モデルの概要を表示
model.summary()


作ったモデルでトレーニングし、トレーニングプロセス中におけるモデルの性能の進化を**学習曲線**で可視化しましょう。

典型的な学習曲線には、トレーニングセットと検証セット（またはテストセット）に対する損失（エラー）と性能指標（例えば、精度）の推移が含まれます。

In [None]:
# モデルのトレーニング

# テストデータで評価
test_loss, test_acc = model.evaluate(test_images, test_labels)
print(f'Test accuracy: {test_acc * 100:.2f}%')

# 学習曲線の表示
plt.plot(history.history['accuracy'], label='accuracy')
plt.plot(history.history['val_accuracy'], label='val_accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend(loc='lower right')



次に、モデルで予測しましょう。テストデータの最初の10枚の画像を表示し、各画像に対するモデルの予測（分類結果）と実際のラベルを表示しています。結果が正しかった場合は青で、誤っていた場合は赤で表示されます。

In [None]:
# モデルの予測

# テストデータの最初のいくつかの画像を表示し、予測と実際のラベルを表示する
plt.figure(figsize=(12, 10))
for i in range(20):
    plt.subplot(4, 5, i + 1)
    # 画像を表示
    plt.imshow(test_images[i])
    # 予測と実際のラベルを表示
    predicted_label = np.argmax(predictions[i])
    true_label = np.argmax(test_labels[i])
    # 予測が正しかったら青く、間違っていたら赤く表示
    color = 'blue' if predicted_label == true_label else 'red'
    plt.title(f'Predicted: {label_names[predicted_label]}\nTrue: {label_names[true_label]}', color=color)
    plt.axis('off')


この例は、シンプルな全結合層のニューラルネットワークを構築し、CIFAR-10データセットでトレーニングしています。モデルの構造は簡潔で、実行スピードを優先しています。より高度な性能が必要な場合は、畳み込みニューラルネットワーク（CNN）などのより複雑なモデルを検討することができます。

（ChatGPTおよびGoogle Bardの生成結果をもとに作成。「CNNでCIFAR-10を高い精度で分類するには？」とGeminiなどに問いかけてみてください。）

---

# その他応用例：

[「機械学習（進化的ニューラルネットワーク）を利用してスーパーマーリオをプレイしてみた」（Youtube）](https://youtu.be/qv6UVOQ0F44?si=YRKS6VrnDgXJAdzt)
