# **TensorFlowとニューラルネットワーク入門**

## **はじめに**

この資料は、TensorFlowとニューラルネットワークの基本的な概念と使用法を紹介します。

TensorFlowは、Googleによって開発されたオープンソースの機械学習ライブラリで、深層学習モデルの開発に広く利用されています。

このライブラリを使用して、画像認識、自然言語処理、強化学習など、多くの機械学習タスクを実行することができます。

## **セクション 1: TensorFlowのインストールとセットアップ**

### **インストール**

TensorFlowを使用する前に、Pythonのライブラリとしてインストールする必要があります。以下のコマンドを使用して簡単にインストールできます。

In [1]:
# pip install tensorflow

### **TensorFlowのバージョンの確認**

TensorFlowが正常にインストールされたことを確認するために、以下のPythonコードを使用してバージョンを表示します。

In [None]:
import tensorflow as tf
print(tf.__version__)

## **セクション 2: テンソルの作成**

### **テンソルとは？**

TensorFlowの基本的な構成要素はテンソルです。テンソルは、スカラー、ベクトル、行列などの多次元配列です。

### **テンソルの作成**

以下のPythonコードは、TensorFlowを使用してさまざまな形状のテンソルを作成する方法を示しています。

In [1]:
import tensorflow as tf

# スカラーの作成
scalar = tf.constant(7)
print(f"scalar={scalar}")

# ベクトルの作成
vector = tf.constant([1, 2, 3])
print(f"vector={vector}")

# 行列の作成
matrix = tf.constant([[1, 2, 3], [4, 5, 6]])
print(f"matrix={matrix}")

# 3次元テンソルの作成
tensor_3d = tf.constant([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
print(f"tensor_3d={tensor_3d}")

### **課題**

- 独自のテンソルを作成し、それらの形状と値を確認してください。

## **セクション 3: テンソルの基本的な演算**

### **足し算と引き算**

TensorFlowのテンソルでは、通常の数学的演算を簡単に行うことができます。以下は、2つのテンソルの足し算と引き算の例です。

In [1]:
import tensorflow as tf

# テンソルの作成
tensor_a = tf.constant([1, 2, 3])
tensor_b = tf.constant([4, 5, 6])

# 足し算
sum_tensors = tf.add(tensor_a, tensor_b)
print(f"sum_tensors = {sum_tensors}")

# 引き算
subtract_tensors = tf.subtract(tensor_a, tensor_b)
print(f"subtract_tensors = {subtract_tensors}")

### **課題**

- 独自のテンソルを作成し、異なる演算を試してください。

## **セクション 4: ニューラルネットワークの構築と訓練**
## **4.1 MNISTデータセットの読み込み**
MNISTデータセットは手書き数字の画像データセットであり、機械学習のベンチマークとして広く使用されています。まず、MNISTデータセットを読み込みます。

In [1]:
# tensorflowという名前のツールセットからkerasという部分の中のデータセットを使います
from tensorflow.keras.datasets import mnist

# 描画のためのツールを使う準備をします
import matplotlib.pyplot as plt

# MNISTという手書き数字の画像セットを読み込みます。訓練用の画像と答え、テスト用の画像と答えに分かれています。
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# 訓練用の画像を見やすく表示するための領域を作ります。上下2行、左右5列の計10枠作ります。
fig, axes = plt.subplots(nrows=2, ncols=5, figsize=(10, 4))

# 10枠それぞれに訓練用の画像を入れていきます。iは0から9まで、axはそれぞれの枠です。
for i, ax in enumerate(axes.flatten()):
    # i番目の画像をグレースケール（白黒）で表示します。
    ax.imshow(train_images[i], cmap='gray')
    
    # 画像の上に、それが何の数字であるかを表示します（これが答えです）。
    ax.set_title(f"Label: {train_labels[i]}")
    
    # 枠の周りの軸（数字や目盛り）は要らないので消します。
    ax.axis('off')

# 配置をきれいに整えます。
plt.tight_layout()

# 実際に画像を表示します。
plt.show()

## **4.2 データの前処理**
読み込んだデータをニューラルネットワークに適した形式に前処理します。

In [1]:
# tensorflowのkerasツールセットから、カテゴリカルデータを使いやすくするためのユーティリティを読み込みます
from tensorflow.keras.utils import to_categorical

# データの前処理
# 訓練用の画像データを整形して、色の範囲を0から1に変換します（通常、色は0から255の範囲です）。
# 60000枚の画像をそれぞれ28x28ピクセルの1チャンネル（グレースケール）の形に変えて、色を0から1に変換します。
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255.0

# テスト用の画像データも同様に整形して色の範囲を0から1に変換します。
# 10000枚の画像をそれぞれ28x28ピクセルの1チャンネル（グレースケール）の形に変えて、色を0から1に変換します。
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255.0

# 訓練用のラベル（答え）を「カテゴリカル」形式に変換します。
# これは、例えば、ラベル '5' を [0, 0, 0, 0, 0, 1, 0, 0, 0, 0] のような形に変換することです。
train_labels = to_categorical(train_labels)

# テスト用のラベル（答え）も同様にカテゴリカル形式に変換します。
test_labels = to_categorical(test_labels)

上記のコードでは、画像データを浮動小数点数に変換し、0から1の範囲に正規化しています。また、ラベルデータはone-hotエンコーディングされています。
これにより、画像データとラベルデータがニューラルネットワークモデルに適した形式に変換されます。

## **4.3 モデルの定義**
ニューラルネットワークモデルを構築します。以下の例では、畳み込み層と全結合層からなるシンプルなモデルを定義します。

In [1]:
# tensorflowという名前のツールセットを使う準備をします
import tensorflow as tf

# tensorflowの中のkerasツールセットから、モデルの構造や層を作る部分を使う準備をします
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Conv2D, MaxPooling2D

# モデルの定義
# Sequentialは、層を順番に積み重ねたモデルを作るためのものです。これがロボットの頭脳になります。
model = Sequential([
    # Conv2Dは畳み込み層で、画像の特徴を捉えます。32はフィルタの数、(3, 3)はフィルタのサイズです。
    # activation='relu'は活性化関数で、どの程度の情報を次の層に伝えるかを決める役割があります。
    # input_shape=(28, 28, 1)は入力画像の形状を指定します。28x28ピクセルで1チャンネル（グレースケール）です。
    Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    
    # MaxPooling2Dはプーリング層で、画像を縮小しながら重要な特徴だけを残します。(2, 2)は縮小する範囲です。
    MaxPooling2D((2, 2)),
    
    # Flatten層は、画像を一列の数値のリストに変換します。これで通常の全結合層に入力できる形になります。
    Flatten(),
    
    # Denseは全結合層で、前の層の情報を使って学習します。64はこの層のノード（ニューロン）の数です。
    Dense(64, activation='relu'),
    
    # もう一つのDense層ですが、ここでは10個のノードがあります。10個の数字（0〜9）それぞれに対応します。
    # activation='softmax'は、出力の合計が1になるようにして、確率として解釈できるようにします。
    Dense(10, activation='softmax')
])

この例では、以下のようなモデルが定義されています。

畳み込み層（Conv2D）: 32個の3x3のフィルタを使用し、ReLU活性化関数を適用します。  
プーリング層（MaxPooling2D）: 2x2の領域で最大値を取るプーリングを適用します。  
平滑化層（Flatten）: 3次元の特徴マップを1次元のベクトルに変換します。  
全結合層（Dense）: 64個のニューロンを持つ層を追加し、ReLU活性化関数を適用します。  
出力層（Dense）: 10個のニューロンを持つ層を追加し、softmax活性化関数を適用します。  

### **4.4 モデルのコンパイル**
モデルをコンパイルする際には、最適化手法、損失関数、評価指標を指定します。

In [1]:
# モデルのコンパイル
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

### **4.4 モデルの訓練**


# モデルの訓練
model.fit(train_images, train_labels, epochs=5, batch_size=64, validation_split=0.1)

### **課題**

- 異なるモデルアーキテクチャを試し、それぞれのモデルのパフォーマンスを比較してください。例えば、畳み込み層の数やユニット数を変更したモデルを作成し、訓練結果の損失と精度を観察してください。

## **セクション 5: モデルの評価とテスト**
### **5.1 モデルの評価**
訓練したモデルの性能を評価するために、テストデータを使用してモデルを評価します。


In [1]:
# モデルの評価
# テスト用の画像と答え（ラベル）を使って、モデルの性能を評価します。
# model.evaluateは損失（誤差）と正確さを返します。
# test_lossはモデルの誤差（低い方が良い）、test_accuracyは正確さ（高い方が良い）を表します。
test_loss, test_accuracy = model.evaluate(test_images, test_labels)

# テストデータでの損失（誤差）を表示します。これが小さいほどモデルの性能は良いと言えます。
print(f"Test loss: {test_loss}")

# テストデータでの正確さを表示します。これが100%に近いほど、モデルが正確に予測できていると言えます。
print(f"Test accuracy: {test_accuracy}")

このコードでは、損失関数として「sparse_categorical_crossentropy」を、最適化アルゴリズムとして「Adam」を使用しています。また、モデルの評価指標として「accuracy」（正解率）を指定しています。

### **5.2 モデルの予測とテスト**

訓練済みモデルを使用して、新しいデータに対する予測を行います。

In [1]:
# numpyは数値計算をするためのライブラリです。これを読み込みます。
import numpy as np

# matplotlibの中からpyplotを使ってグラフや画像を表示するための準備をします。
from matplotlib import pyplot

# テストデータからランダムに1つ選ぶ
# np.random.choiceを使って、テスト画像の中からランダムに1枚選びます。
index = np.random.choice(test_images.shape[0])

# 選んだ画像（x_test）とその答え（y_test）を取得します。
x_test = test_images[index]
y_test = test_labels[index]

# モデルの予測
# 選んだ画像をモデルに入力して、何の数字であるかを予測します。
prediction = model.predict(x_test.reshape(1, 28, 28))

# 選んだ画像を表示します。
pyplot.imshow(x_test, cmap='gray')
pyplot.show()

# 予測結果を表示します。np.argmaxは一番高い確率のものを選びます。これがモデルが予測した数字です。
print(f"Model prediction: {np.argmax(prediction)}")

# 実際の答えを表示します。これと予測が一致していれば、モデルが正しく予測したと言えます。
print(f"True label: {y_test}")

### **5.3 カスタム画像データのテスト**

自分で作成した手書きの数字の画像データを使用して、モデルの予測を試してみましょう。

In [1]:
# OpenCVという画像処理ライブラリを読み込みます。これを使って画像の前処理を行います。
import cv2

# matplotlibのpyplotを使って、画像を表示するための準備をします。
from matplotlib import pyplot as plt

# 前処理
# まず、予測したい画像を読み込みます。
target_image = cv2.imread("______.png")

# 読み込んだ画像をグレースケール（白黒）に変換します。色は必要ないため、計算を簡単にするために変換します。
target_image = cv2.cvtColor(target_image, cv2.COLOR_BGR2GRAY)

# 画像を28x28ピクセルにリサイズします。これはモデルが28x28ピクセルの画像を想定しているからです。
target_image = cv2.resize(target_image, (28, 28))

# 色の範囲を0から1に変換します（通常、色は0から255の範囲です）。
target_image = target_image / 255.0

# モデルの予測
# 前処理した画像をモデルに入力して、何の数字であるかを予測します。
prediction = model.predict(target_image.reshape(1, 28, 28, 1))

# 前処理した画像を表示します。
plt.imshow(target_image, cmap='gray')
plt.show()

# 予測結果を表示します。np.argmaxは一番高い確率のものを選びます。これがモデルが予測した数字です。
print(f"Model prediction: {np.argmax(prediction[0])}")

### **課題**

- 自作の手書き数字の画像データを用意し、モデルの予測結果と実際のラベルとを比較してください。
例えば、実際の手書き数字の画像を作成し、それをモデルに入力して予測結果を取得し、予測結果が正しいかどうかを確認してください。

## **ディスカッション:グループワーク(調べて試す力、コミュニケーション能力)**

どうすれば更に精度が上がるのかチームで協力してやってみましょう！

# 課題

最初の25枚を表示するサンプル

In [1]:
# TensorFlowという名前の機械学習ライブラリを使う準備をします。
# さらに、その中のKerasという部分と、fashion_mnistデータセットを使う準備もします。
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist

# matplotlibというグラフを描画するライブラリを使う準備をします。
import matplotlib.pyplot as plt

# Fashion MNISTという、衣料品の画像データセットを読み込みます。
# このデータセットは、学習用の画像（train_images）とそれに対応するラベル（train_labels）から成ります。
# テスト用のデータはこの例では使わないので、_（アンダースコア）を使って無視します。
(train_images, train_labels), (_, _) = fashion_mnist.load_data()

# 各ラベルに対応する衣料品の名前をリストで準備します。
# 例えば、ラベルが0なら'T-shirt/top'、1なら'Trouser'という具体的な名前に対応します。
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

# 画像データは0から255の整数で色を表していますが、これを0から1の範囲に正規化（変換）します。
# これは、ニューラルネットワークのモデルが小さい数値を扱う方が効率的であるためです。
train_images = train_images / 255.0

# 最初の25枚の画像を表示するコードです。
# まず10x10の大きさの領域を作り（plt.figure）、その中に5x5のグリッドを作ります。
plt.figure(figsize=(10,10))
for i in range(25):  # 25回ループを回す。つまり、25枚の画像について次の処理を行います。
    plt.subplot(5,5,i+1)  # 5x5のグリッドのうち、左上から数えて(i+1)番目の位置に次のグラフ（または画像）を描きます。
    plt.xticks([])  # x軸の目盛りは表示しない。
    plt.yticks([])  # y軸の目盛りも表示しない。
    plt.grid(False)  # グリッド線も表示しない。
    plt.imshow(train_images[i], cmap=plt.cm.binary)  # i番目の画像を表示します。表示にはimshow関数を使います。
    plt.xlabel(class_names[train_labels[i]])  # 画像の下に、その衣料品の名前を表示します。これはclass_namesリストから対応する名前を取得しています。
plt.show()  # ここまでの設定で作られた図を表示します。これを実行すると、画面に図が表示されます。

**データセットのロード**：まず、Fashion MNISTデータセットをロードします。TensorFlowのKeras APIを使ってロードすることが可能です。

In [1]:
from tensorflow.keras.datasets import fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

データの前処理：MNISTと同様に、画像は28x28ピクセルのグレースケール画像で、ピクセルの値は0から255までの整数です。これらの値を0から1までの浮動小数点数にスケーリングすることが一般的です。

In [1]:
train_images = train_images / 255.0
test_images = test_images / 255.0

モデルの設定：Fashion MNISTもMNISTと同じように、多クラス分類問題として扱うことができます。したがって、モデルのアーキテクチャ（ニューラルネットワークの層の配置や活性化関数の選択など）はMNISTのモデルと同じくらい複雑であれば十分です。

In [1]:
# 訓練用のラベル（答え）を「カテゴリカル」形式に変換します。
train_labels = to_categorical(train_labels)
# テスト用のラベル（答え）も同様にカテゴリカル形式に変換します。
test_labels = to_categorical(test_labels)

モデルのコンパイル


モデルの訓練

モデルの評価

カスタム画像データのテスト

In [1]:
# 画像の前処理
# "予測させたい画像"を読み込みます。
target_image = cv2.imread("________", cv2.IMREAD_GRAYSCALE)

# 画像を28x28ピクセルにリサイズします。
target_image = cv2.resize(target_image, (28, 28))

# 色の範囲を0から1に変換します。
target_image = target_image / 255.0

# 予測
# 前処理した画像をモデルに入力して、何のファッションアイテムであるかを予測します。
prediction = model.predict(np.expand_dims(target_image, axis=[0, -1]))

# 前処理した画像を表示します。
plt.imshow(target_image, cmap='gray')
plt.show()

# 予測結果を表示します。np.argmaxは一番高い確率のものを選びます。これがモデルが予測したファッションアイテムです。
print(f"Model prediction: {class_names[np.argmax(prediction[0])]}")