In [34]:
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras import layers, models
from sklearn.model_selection import train_test_split
from PIL import Image
import os

# データセットのパス
dataset_path = 'DB/panWB.csv'  # あなたのCSVファイルのパスに置き換えてください

# CSVファイルの読み込み
df = pd.read_csv(dataset_path)

# ターゲット変数の定義
y = df[['総個数 (WB)','男性個数 (WB)','女性個数 (WB)','男性回数 (WB)']]
y = y.values

# 画像データの読み込みと前処理
X = []
folder_path = 'DB/resized_picture/panWB/'  # 画像フォルダのパス

for id in df["No"]:
    img_path = os.path.join(folder_path, f"{id}.jpg")
    img = Image.open(img_path)
    img = img.convert('RGB')
    img = img.resize((96, 96))
    img = np.array(img, dtype=np.float32)
    img = img / 255.0  # 正規化
    X.append(img)

X = np.array(X)

# 訓練データとテストデータの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# モデルの定義
def create_model(input_shape, output_units):
    model = models.Sequential()
    model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=input_shape, name='conv1'))
    model.add(layers.MaxPooling2D((2, 2)))
    model.add(layers.Conv2D(64, (3, 3), activation='relu', name='conv2'))
    model.add(layers.MaxPooling2D((2, 2)))
    model.add(layers.Conv2D(128, (3, 3), activation='relu', name='conv3'))
    model.add(layers.Flatten())
    model.add(layers.Dense(128, activation='relu'))
    model.add(layers.Dense(output_units))
    return model

# 入力形状と出力ユニット数
input_shape = (96, 96, 3)
output_units = 4  # 予測するステータスの数

# モデルの作成
model = create_model(input_shape, output_units)

# モデルのコンパイル
model.compile(optimizer='adam', loss='mse')

# モデルの概要を表示
model.summary()

# モデルのトレーニング
history = model.fit(X_train, y_train, epochs=40, batch_size=16, validation_data=(X_test, y_test))


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 15ms/step - loss: 36793352.0000 - val_loss: 15322234.0000
Epoch 2/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - loss: 43121936.0000 - val_loss: 14803469.0000
Epoch 3/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - loss: 30666142.0000 - val_loss: 14748648.0000
Epoch 4/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - loss: 16462589.0000 - val_loss: 14053954.0000
Epoch 5/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - loss: 25429254.0000 - val_loss: 14357309.0000
Epoch 6/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - loss: 24451522.0000 - val_loss: 14419030.0000
Epoch 7/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - loss: 21495766.0000 - val_loss: 14551429.0000
Epoch 8/40
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 

In [19]:
import japanize_matplotlib
# 予測したい画像のパス
img_path = 'DB/カニパン.jpg'  # あなたの画像のパスに置き換えてください

# 画像の前処理
image = Image.open(img_path)
image = image.convert('RGB')
image = image.resize((96, 96))
image = np.array(image, dtype=np.float32)
image = image / 255.0
img_array = np.expand_dims(image, axis=0)

# モデルの最後の畳み込み層の名前を設定
last_conv_layer_name = 'conv3'  # モデル定義時に設定した名前

# 各ステータスに対してヒートマップを作成
for i, stat_name in enumerate(['総個数 (WB)','男性個数 (WB)','女性個数 (WB)','男性回数 (WB)']):
    print(f"ステータス: {stat_name}")
    heatmap = make_gradcam_heatmap(img_array, model, last_conv_layer_name, pred_index=i)
    superimposed_img = overlay_heatmap(img_path, heatmap)

    # 画像の表示
    plt.figure(figsize=(8, 8))
    plt.imshow(superimposed_img)
    plt.axis('off')
    plt.title(f"Grad-CAM for {stat_name}")
    plt.show()


ステータス: 総個数 (WB)


ValueError: The layer sequential_2 has never been called and thus has no defined output.

In [37]:
import tensorflow.keras.backend as K
import matplotlib.cm as cm
import matplotlib.pyplot as plt
import cv2

def make_gradcam_heatmap(img_array, model, last_conv_layer_name, pred_index):
    # 予測クラスのインデックスを設定
    pred_index = tf.convert_to_tensor([pred_index])

    # 勾配モデルの作成
    grad_model = tf.keras.models.Model(
        [model.inputs], [model.get_layer(last_conv_layer_name).output, model.output]
    )

    # 勾配を計算
    with tf.GradientTape() as tape:
        conv_outputs, predictions = grad_model(img_array)
        loss = predictions[:, pred_index[0]]

    grads = tape.gradient(loss, conv_outputs)

    # 勾配を平均化
    pooled_grads = tf.reduce_mean(grads, axis=(0, 1, 2))

    # ヒートマップを作成
    conv_outputs = conv_outputs[0]
    heatmap = conv_outputs @ pooled_grads[..., tf.newaxis]
    heatmap = tf.squeeze(heatmap)

    # ヒートマップを正規化
    heatmap = tf.maximum(heatmap, 0) / tf.math.reduce_max(heatmap)
    return heatmap.numpy()


In [43]:
def overlay_heatmap(img_path, heatmap, alpha=0.4, colormap='viridis'):
    # 元の画像を読み込み
    img = cv2.imread(img_path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

    # ヒートマップを画像サイズにリサイズ
    heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0]))

    # ヒートマップをカラーに変換
    heatmap = np.uint8(255 * heatmap)
    colormap = cm.get_cmap(colormap)
    heatmap_colored = colormap(heatmap)
    heatmap_colored = np.uint8(255 * heatmap_colored[:, :, :3])

    # ヒートマップを元の画像に重ね合わせ
    superimposed_img = cv2.addWeighted(img, 1 - alpha, heatmap_colored, alpha, 0)
    return superimposed_img


In [45]:
def emphasize_top_percent(heatmap, percentile=90):
    # ヒートマップの上位パーセンタイルの閾値を計算
    threshold = np.percentile(heatmap, percentile)

    # 上位の値を持つ部分を1に、それ以外を0にする
    heatmap_emphasized = np.where(heatmap >= threshold, heatmap, 0)

    # 再度正規化
    heatmap_emphasized /= heatmap_emphasized.max() if heatmap_emphasized.max() != 0 else 1
    return heatmap_emphasized


In [46]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import cv2
from PIL import Image
import matplotlib.font_manager as fm
import tensorflow as tf
import japanize_matplotlib

def make_gradcam_heatmap(img_array, model, last_conv_layer_name, pred_index):
    # 予測クラスのインデックスを設定
    pred_index = tf.convert_to_tensor([pred_index])

    # 勾配モデルの作成
    grad_model = tf.keras.models.Model(
        [model.inputs], [model.get_layer(last_conv_layer_name).output, model.output]
    )

    # 勾配を計算
    with tf.GradientTape() as tape:
        conv_outputs, predictions = grad_model(img_array)
        loss = predictions[:, pred_index[0]]

    grads = tape.gradient(loss, conv_outputs)

    # 勾配を平均化
    pooled_grads = tf.reduce_mean(grads, axis=(0, 1, 2))

    # ヒートマップを作成
    conv_outputs = conv_outputs[0]
    heatmap = conv_outputs @ pooled_grads[..., tf.newaxis]
    heatmap = tf.squeeze(heatmap)

    # ヒートマップを正規化
    heatmap = tf.maximum(heatmap, 0) / tf.math.reduce_max(heatmap)
    return heatmap.numpy()

def emphasize_top_percent(heatmap, percentile=90):
    # ヒートマップの上位パーセンタイルの閾値を計算
    threshold = np.percentile(heatmap, percentile)

    # 上位の値を持つ部分をそのまま、他を0に
    heatmap_emphasized = np.where(heatmap >= threshold, heatmap, 0)

    # 再度正規化
    if heatmap_emphasized.max() != 0:
        heatmap_emphasized /= heatmap_emphasized.max()
    return heatmap_emphasized

def overlay_heatmap(img_path, heatmap, alpha=0.6, colormap='jet'):
    # 元の画像を読み込み
    img = cv2.imread(img_path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

    # ヒートマップを画像サイズにリサイズ
    heatmap_resized = cv2.resize(heatmap, (img.shape[1], img.shape[0]))

    # ヒートマップをカラーに変換
    heatmap_colored = cm.get_cmap(colormap)(heatmap_resized)
    heatmap_colored = np.uint8(255 * heatmap_colored[:, :, :3])

    # ヒートマップの透明度を調整
    mask = heatmap_resized > 0  # ヒートマップが0より大きい部分をマスク
    superimposed_img = img.copy()
    superimposed_img[mask] = cv2.addWeighted(img[mask], 1 - alpha, heatmap_colored[mask], alpha, 0)

    return superimposed_img

# 予測したい画像のパス
img_path = 'DB/カニパン.jpg'  # あなたの画像のパスに置き換えてください

# 画像の前処理
image = Image.open(img_path)
image = image.convert('RGB')
image = image.resize((96, 96))
image = np.array(image, dtype=np.float32)
image = image / 255.0
img_array = np.expand_dims(image, axis=0)

# モデルの最後の畳み込み層の名前を設定
last_conv_layer_name = 'conv3'  # モデル定義時に設定した名前

# **予測値の取得**
# モデルに画像を入力して予測値を取得
predictions = model.predict(img_array)
predicted_stats = predictions[0]  # バッチサイズが1の場合

# ステータスの名前のリスト
stat_names = ['総個数 (WB)','男性個数 (WB)','女性個数 (WB)','男性回数 (WB)']

# 各ステータスに対してヒートマップを作成
for i, stat_name in enumerate(stat_names):
    print(f"ステータス: {stat_name}")
    heatmap = make_gradcam_heatmap(img_array, model, last_conv_layer_name, pred_index=i)

    # ヒートマップを上位10％に限定して強調
    heatmap_emphasized = emphasize_top_percent(heatmap, percentile=90)

    # 強調したヒートマップを使用して画像に重ね合わせ
    superimposed_img = overlay_heatmap(img_path, heatmap_emphasized, alpha=0.6, colormap='jet')

    # 予測値を取得
    predicted_value = predicted_stats[i]

    # 画像の表示
    plt.figure(figsize=(8, 8))
    plt.imshow(superimposed_img)
    plt.axis('off')
    # タイトルに予測値を表示（日本語フォントを指定）
    plt.title(f"{stat_name} の Grad-CAM\n予測値: {predicted_value:.2f}")

    # **画像上にテキストを表示**
    # テキストの位置を調整（例として左上に表示）
    plt.text(10, 30, f"{stat_name} 予測値: {predicted_value:.2f}", color='white', fontsize=16, bbox=dict(facecolor='black', alpha=0.5))

    plt.show()


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 199ms/step
ステータス: 総個数 (WB)


ValueError: The layer sequential_5 has never been called and thus has no defined output.

In [None]:
# モデルの保存
model.save('pokemon_model.h5')
