## 2.1 tensorflowを使うためのモジュールをインストール

# **ステップ:5 npzファイルを元に学習**

## 5.1 学習用データの準備
ローカルで作成したnpzファイルをクラウド上にアップロードした上で実行しましょう  
【※注意】移動させて直後だとエラーが出る場合があるので、少しだけ間を置いてから再度実行してみてください

## 5.2 データ前処理

## 5.3 学習用とテスト用に分ける

## **ステップ6: モデルの作成**

## 6.1 CNNのモデル作成

## 6.2 モデルのコンパイル

## 6.3 モデルの訓練

# **【課題1】：正解率がまだ少し低いですが、何が原因だと考えられますか？**

## 回答：

# **ステップ:7 データの水増し**

## 7.1 データの水増し　やり方の確認

## 7.2 水増しを踏まえた上で学習を行う

In [None]:
import numpy as np                   # 数学的な操作や配列を扱うためのモジュール
from sklearn.model_selection import train_test_split  # データを分割するためのモジュール
import tensorflow
from tensorflow.keras import datasets, layers, models  # TensorFlowのライブラリをインポート
import cv2

# npzファイルから画像データを読み込む
photos = np.load('photos.npz')
# 画像データをxに代入
x = photos['x']
# ラベルデータをyに代入
y = photos['y']


# 画像の形状に関する情報
im_rows = 128       # 画像の行数
im_cols = 128       # 画像の列数
im_color = 3       # 画像の色の数(RGBなので3)
in_shape = (im_rows, im_cols, im_color)  # 画像の形状

# 画像データを適切な形状に変換
x = x.reshape(-1, im_rows, im_cols, im_color)
# 画像の各ピクセルの値を0から1の範囲にするために255で割る
x = x.astype('float32') / 255


# データセットを訓練データとテストデータに分割
# test_size=0.2は、全データのうち20%をテストデータとして使うことを意味する
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)


######### 水増し処理 ##########


######### 水増し処理 ##########


# CNN（畳み込みニューラルネットワーク）モデルを作成します。これは、画像を理解するための強力なツールです。
model = models.Sequential()

# 最初の層：128個のフィルターを持つ畳み込み層を追加します。これは、画像の特徴（例：エッジ、テクスチャ）を検出します。
# 3x3のサイズのフィルターを使用し、活性化関数としてReLU（ランプ関数）を使用します。
# input_shape=(128, 128, 3)は、入力画像が128x128ピクセルで3つのカラーチャンネル（RGB）を持っていることを意味します。
model.add(layers.Conv2D(128, (3, 3), activation='relu', input_shape=(128, 128, 3)))

# 次の層：2x2のサイズで最大プーリング層を追加します。これは、画像のサイズを半分にし、重要な特徴だけを残します。
model.add(layers.MaxPooling2D((2, 2)))

# 畳み込み層をもう一度追加しますが、今回は64個のフィルターを使用します。
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

# もう一度、最大プーリング層を追加します。
model.add(layers.MaxPooling2D((2, 2)))

# 64個のフィルターを持つもう一つの畳み込み層を追加します。
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

# ここで、画像を1Dのリストに変換します。これは、全結合層（デンスレイヤー）に入力するための前処理です。
model.add(layers.Flatten())

# 64個のノードを持つ全結合層（デンスレイヤー）を追加し、ReLU活性化関数を使用します。
model.add(layers.Dense(64, activation='relu'))

# 最終層：2個のノードを持つ全結合層を追加します。これは現時点で２種類の分類を行っているからです
model.add(layers.Dense(2, activation='softmax'))

# モデルを訓練する前の準備
model.compile(
    optimizer='adam',  # 最適化手法はAdam（これはパラメータの調整方法）
    loss=tensorflow.keras.losses.SparseCategoricalCrossentropy(from_logits=True),  # 損失関数（予測と正解との差を計算）
    metrics=['accuracy']  # 正解率を計算する（どれだけ予測が当たっているか）
)


# モデルを訓練する（学習させる）
history = model.fit(
    x_train, y_train,  # 訓練データ（画像）と正解ラベル

    epochs=5,  # 全データを10回繰り返して学習する

    # 検証データ（こちらは学習には使わない。学習の進行状況を確認するためだけに使用）
    validation_data=(x_test, y_test)
)

## 7.3 学習済みのモデルを保存

生成されたモデルのファイルをローカルにダウンロードしておきましょう。