In [2]:
#下準備
# advanced task A - 1 color picture
import numpy as np
import pickle
import mnist
import matplotlib.pyplot as plt
from pylab import cm

X = mnist.download_and_parse_mnist_file("train-images-idx3-ubyte.gz")
Y = mnist.download_and_parse_mnist_file("train-labels-idx1-ubyte.gz") 

def unpickle(file):
    with open(file, 'rb') as fo:
        dict = pickle.load(fo,encoding='bytes')
    X = np.array(dict[b'data'])
    X = X.reshape((X.shape[0],3,32,32))
    Y = np.array(dict[b'labels'])
    return X,Y

x_1,y_1 = unpickle("./cifar-10-batches-py/data_batch_1")
x_2, y_2 = unpickle("./cifar-10-batches-py/data_batch_2")
x_3, y_3 = unpickle("./cifar-10-batches-py/data_batch_3")
x_4, y_4 = unpickle("./cifar-10-batches-py/data_batch_4")
x_5, y_5 = unpickle("./cifar-10-batches-py/data_batch_5")
x_test, y_test = unpickle("./cifar-10-batches-py/test_batch")

X_color = np.concatenate((x_1, x_2, x_3, x_4, x_5, x_test))
Y_color = np.concatenate((y_1, y_2, y_3, y_4, y_5, y_test))

In [24]:
#全てのクラス

#畳み込み層
class Convolution:
    # インスタンス変数の定義
    def __init__(self, W, b, stride, pad):
        self.W = W # フィルター(重み)
        self.b = b # バイアス
        self.stride = stride # ストライド
        self.pad = pad # パディング
        
        # (逆伝播時に使用する)中間データを初期化
        self.x = None # 入力データ
        self.col = None # 2次元配列に展開した入力データ
        self.col_W = None # 2次元配列に展開したフィルター(重み)
        
        # 勾配に関する変数を初期化
        self.dW = None # フィルター(重み)に関する勾配
        self.db = None # バイアスに関する勾配
    
    # 順伝播メソッドの定義
    def forward(self, x):
        # 各データに関するサイズを取得
        FN, C, FH, FW = self.W.shape # フィルター
        N, C, H, W = x.shape # 入力データ
        out_h = int(1 + (H + 2 * self.pad - FH) / self.stride) # 出力データ:式(7.1)
        out_w = int(1 + (W + 2 * self.pad - FW) / self.stride)
        
        # 各データを2次元配列に展開
        col = im2col(x, FH, FW, self.stride, self.pad) # 入力データ
        col_W = self.W.reshape(FN, -1).T # フィルター
        
        # 出力の計算:(図7-12)
        out = np.dot(col, col_W) + self.b
        out = out.reshape(N, out_h, out_w, -1).transpose(0, 3, 1, 2)

        # (逆伝播時に使用する)中間データを保存
        self.x = x
        self.col = col
        self.col_W = col_W
        
        return out
    
    # 逆伝播メソッドの定義
    def backward(self, dout):
        # フィルターに関するサイズを取得
        FN, C, FH, FW = self.W.shape
        
        # 順伝播の入力を展開
        dout = dout.transpose(0,2,3,1).reshape(-1, FN)
        
        # 各パラメータの勾配を計算:式(5.13)
        self.db = np.sum(dout, axis=0) # バイアス
        self.dW = np.dot(self.col.T, dout) # (展開した)重み
        self.dW = self.dW.transpose(1, 0).reshape(FN, C, FH, FW) # 本来の形状に変換
        dcol = np.dot(dout, self.col_W.T) # (展開した)入力データ
        dx = col2im(dcol, self.x.shape, FH, FW, self.stride, self.pad) # 本来の形状に変換

        return dx

# Poolingレイヤの実装
class Pooling:
    # インスタンス変数の定義
    def __init__(self, pool_h, pool_w, stride, pad):
        self.pool_h = pool_h # Poolingの高さ
        self.pool_w = pool_w # Poolingの横幅
        self.stride = stride # ストライド
        self.pad = pad # パディング
        
        # 逆伝播用の中間データ
        self.x = None # 入力データ
        self.arg_max = None # 最大値のインデックス
    # 順伝播メソッドの定義
    def forward(self, x):
        # 各データに関するサイズを取得
        N, C, H, W = x.shape # 入力サイズ
        out_h = int(1 + (H - self.pool_h) / self.stride) # 出力サイズ:式(7.1)
        out_w = int(1 + (W - self.pool_w) / self.stride)
        
        # 入力データを2次元配列に展開
        col = im2col(x, self.pool_h, self.pool_w, self.stride, self.pad)
        col = col.reshape(-1, self.pool_h * self.pool_w)
        
        # 逆伝播用に最大値のインデックスを保存
        arg_max = np.argmax(col, axis=1)
        
        # 出力データを作成
        out = np.max(col, axis=1)
        out = out.reshape(N, out_h, out_w, C).transpose(0, 3, 1, 2) # 4次元配列に再変換:(図7-20)
        
        # 逆伝播用に中間データを保存
        self.x = x # 入力データ
        self.arg_max = arg_max # 最大値のインデックス

        return out
    # 逆伝播メソッドの定義
    def backward(self, dout):
        # 入力データを変形:(図7-20の逆方法)
        dout = dout.transpose(0, 2, 3, 1)
        
        # 受け皿を作成
        pool_size = self.pool_h * self.pool_w # Pooling適用領域の要素数
        dmax = np.zeros((dout.size, pool_size)) # 初期化
        
        # 最大値の要素のみ伝播
        dmax[np.arange(self.arg_max.size), self.arg_max.flatten()] = dout.flatten()
        
        # 4次元配列に変換
        dmax = dmax.reshape(dout.shape + (pool_size,))
        dcol = dmax.reshape(dmax.shape[0] * dmax.shape[1] * dmax.shape[2], -1)
        dx = col2im(dcol, self.x.shape, self.pool_h, self.pool_w, self.stride, self.pad)
        
        return dx
    
#4次元対応の全結合のクラス
class Affine:
    
    # インスタンス変数の定義
    def __init__(self, W, b):
        self.W = W # 重み
        self.b = b # バイアス
        self.x = None # 入力データ
        self.original_x_shape = None # 入力データのサイズ
        self.dW = None # 重みに関する勾配
        self.db = None # バイアスに関する勾配
    
    # 順伝播メソッドの定義
    def forward(self, x):
        # 入力データのサイズを保存
        self.original_x_shape = x.shape
        
        # バッチサイズ行の2次元配列に変形
        x = x.reshape(x.shape[0], -1)
        self.x = x
        
        # 重み付きバイアスの和の計算
        out = np.dot(self.x, self.W) + self.b

        return out
    
    # 逆伝播メソッドの定義
    def backward(self, dout):
        # 勾配を計算
        dx = np.dot(dout, self.W.T)
        self.dW = np.dot(self.x.T, dout)
        self.db = np.sum(dout, axis=0)
        
        # 入力データのサイズに変形
        dx = dx.reshape(*self.original_x_shape)
        return dx
    
# Batch Normalizationの実装
class BatchNormalization:
    
    # インスタンス変数の定義
    def __init__(self, gamma, beta, momentum=0.9, running_mean=None, running_var=None):
        
        # 再変換用のパラメータ
        self.gamma = gamma # 標準偏差
        self.beta = beta # 平均
        self.momentum = momentum # 減衰率
        
        # テスト時に使用する統計量
        self.running_mean = running_mean # 平均
        self.running_var = running_var # 分散 
        
        # 逆伝播時に使用する統計量
        self.batch_size = None # データ数
        self.xc = None # 偏差
        self.std = None # 標準偏差
        self.dgamma = None # (再変換用の)標準偏差の微分
        self.dbeta = None # (再変換用の)平均の微分
    
    # 順伝播メソッドの定義
    def forward(self, x, train_flg=True):
        # 初期値を与える
        if self.running_mean is None:
            N, D = x.shape
            self.running_mean = np.zeros(D)
            self.running_var = np.zeros(D)
                        
        if train_flg: # 学習時
            # 正規化の計算
            mu = x.mean(axis=0) # 平均
            xc = x - mu # 偏差
            var = np.mean(xc ** 2, axis=0) # 分散
            std = np.sqrt(var + 10e-7) # 標準偏差
            xn = xc / std # 標準化:式(6.7)
            
            # 計算結果を(逆伝播用に)インスタンス変数として保存
            self.batch_size = x.shape[0]
            self.xc = xc # 偏差
            self.xn = xn # 標準化データ
            self.std = std # 標準偏差
            self.running_mean = self.momentum * self.running_mean + (1 - self.momentum) * mu # 過去の平均の情報
            self.running_var = self.momentum * self.running_var + (1 - self.momentum) * var # 過去の分散の情報
        else: # テスト時
            xc = x - self.running_mean
            xn = xc / np.sqrt(self.running_var + 10e-7) # 標準化:式(6.7')
        
        # 再変換
        out = self.gamma * xn + self.beta # 式(6.8)
        return out
    
    # 逆伝播メソッドの定義
    def backward(self, dout):
        
        # 微分の計算
        dbeta = dout.sum(axis=0) # 調整後の平均
        dgamma = np.sum(self.xn * dout, axis=0) # 調整後の標準偏差
        dxn = self.gamma * dout # 正規化後のデータ
        dxc = dxn / self.std # 偏差
        dstd = -np.sum((dxn * self.xc) / (self.std * self.std), axis=0) # 標準偏差
        dvar = 0.5 * dstd / self.std # 分散
        dxc += (2.0 / self.batch_size) * self.xc * dvar # 偏差
        dmu = np.sum(dxc, axis=0) # 平均
        dx = dxc - dmu / self.batch_size # 入力データ
        
        # インスタンス変数に保存
        self.dgamma = dgamma
        self.dbeta = dbeta
        
        return dx

# Dropoutの実装
class Dropout:
    
    # インスタンスの定義
    def __init__(self, dropout_ratio=0.5):
        self.dropout_ratio = dropout_ratio
        self.mask = None
    
    # 順伝播メソッドの定義
    def forward(self, x, train_flg=True):
        # ランダムにニューロンを消去
        if train_flg: # 訓練時
            self.mask = np.random.rand(*x.shape) > self.dropout_ratio
            return x * self.mask
        else: # テスト時
            return x * (1.0 - self.dropout_ratio)
    
    # 逆伝播メソッドの定義
    def backward(self, dout):
        return dout * self.mask

class ReLU:
    def __init__(self):
        self.x = None
        self.y = None
        self.del_en_y = None
    def forward(self, x):
        self.y = np.maximum(0, x)
        return self.y
    def backward(self, y, del_en_y):
        self.del_en_y = del_en_y
        new_y = np.where(y > 0, 1, 0)
        result = self.del_en_y * new_y
        return result
    
# 出力層のクラス
class OutputLayer:
    def __init__(self, x, softmax):
        self.x = x
        self.softmax = softmax
    def output(self):
        return self.softmax(self.x)
    
class ErrorBackCrossEntropy:
    def __init__(self, x, onehot):
        self.x = x
        self.onehot = onehot
    def del_en_x(self):
        batch = self.x.shape[1]
        return (self.x - self.onehot) / batch
    
# クロスエントロピーを計算するクラス
class CrossEntropy:
    def __init__(self, x, onehot):
        self.x = x
        self.onehot = onehot
    def safelog(self):
        try:
            result = -np.log(self.x)
        except RuntimeWarning as e:
            result = np.where(self.x <= 0, 100, -np.log(self.x))
        return result
    def result(self):
        loglist = self.safelog()
        crossentropy = np.sum(self.onehot * loglist, axis=0)
        batch = loglist.shape[1]
        return np.sum(crossentropy) / batch

In [28]:
#関数集
# 入力データの展開関数を定義
def im2col(input_data, filter_h, filter_w, stride=1, pad=0):
    
    # 入力データのサイズを取得
    N, C, H, W = input_data.shape
    
    # 出力データのサイズを計算
    out_h = (H + 2 * pad - filter_h) // stride + 1
    out_w = (W + 2 * pad - filter_w) // stride + 1
    
    # パディング
    img = np.pad(input_data, [(0, 0), (0, 0), (pad, pad), (pad, pad)], 'constant')
    
    # 出力データの受け皿を初期化
    col = np.zeros((N, C, filter_h, filter_w, out_h, out_w))
    
    # 行方向のインデックス
    for y in range(filter_h):
        # 行方向の最大値を計算
        y_max = y + stride * out_h
        
        # 列方向のインデックス
        for x in range(filter_w):
            # 列方向の最大値を計算
            x_max = x + stride * out_w
            
            # フィルターのy,x要素に対応する入力データの要素を抽出
            col[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride]
    
    # 出力サイズに整形
    col = col.transpose(0, 4, 5, 1, 2, 3).reshape(N * out_h * out_w, -1)
    return col

# 出力データの再変換関数の定義
def col2im(col, input_shape, filter_h, filter_w, stride=1, pad=0):
    
    # 入力データのサイズを取得
    N, C, H, W = input_shape
    
    # 出力データのサイズを計算
    out_h = (H + 2 * pad - filter_h) // stride + 1
    out_w = (W + 2 * pad - filter_w) // stride + 1
    
    # データとチャンネルに関する軸を分割
    col = col.reshape(N, out_h, out_w, C, filter_h, filter_w).transpose(0, 3, 4, 5, 1, 2)
    
    # 出力データの受け皿を初期化
    img = np.zeros((N, C, H + 2 * pad + stride - 1, W + 2 * pad + stride - 1))
    
    # 行方向のインデックス
    for y in range(filter_h):
        # 行方向の最大値を計算
        y_max = y + stride * out_h
        
        # 列方向のインデックス
        for x in range(filter_w):
            # 列方向の最大値を計算
            x_max = x + stride * out_w
            
            # フィルターのy,x要素に対応する入力データの要素を抽出
            img[:, :, y:y_max:stride, x:x_max:stride] += col[:, :, y, x, :, :]

    return img[:, :, pad:H + pad, pad:W + pad]

# ソフトマックス関数
def softmax(x):
    x = x - np.max(x, axis = 0)
    return np.exp(np.array(x)) / np.sum(np.exp(np.array(x)), axis=0)


# リストの一致率を示す関数
def calculate_similarity(list1, list2):
    if len(list1) != len(list2):
        raise ValueError("リストの長さが異なります")

    # 一致した要素の数を数える
    match_count = sum(1 for a, b in zip(list1, list2) if a == b)

    # 一致率を計算
    similarity = (match_count / len(list1)) * 100  # パーセントで表示

    return similarity


In [32]:
np.random.seed(1)
#ゼロつくに照らし合わせたモデル
ch = 1
K = 30
C = 10
#畳み込み層
R = 3
S = 1
P = 1
#プーリング層のフィルタサイズ
r = 2
s = 2
p = 0
d = K * 14 * 14
#フィルター行列
filter_matrix = np.array(np.random.normal(0, 1/np.sqrt(d), (K, ch, R, R)))
bias_vector = np.array(np.random.normal(0, 1/np.sqrt(d), K))
#全結合のパラメータ
W_matrix = np.array(np.random.normal(0, 1/np.sqrt(d), (d, C)))
b_vector = np.array(np.random.normal(0, 1/np.sqrt(d), C))
gamma_init = np.ones(d)
beta_init = np.zeros(d)
mean_init = np.zeros(d)
var_init = np.zeros(d)

def mnistcontest_train(batch, W_init, b_init, gamma_init, beta_init, filter_init,\
                       bias_init, mean_init, var_init):
    #変数を初期化する
    W = W_init
    b = b_init
    gamma = gamma_init
    beta = beta_init
    mean_cross_entropy = 0
    filter_matrix = filter_init
    bias = bias_init
    mean = mean_init
    var = var_init
    #学習率
    eta = 0.1
    #0~50000までを重複なく取得
    sampled_data =  np.random.choice(np.arange(0, 50000), size=(int(50000/batch), batch), replace=False)
    i = len(sampled_data)-1
    X_train = X[:, np.newaxis, :, :]
    while(i > 0):
        batch_index = sampled_data[i]
        #正規化
        batch_matrix = np.array(X_train[batch_index])/255
        #正解データ
        correct_labels = Y[batch_index]
        #one-hot
        one_hot = np.array([np.eye(10)[y] for y in correct_labels])
        #畳み込み
        convolution = Convolution(filter_matrix, bias, S, P)
        convolution_output = convolution.forward(batch_matrix)
        #活性化1
        active_output1 = ReLU().forward(convolution_output)
        #プーリング
        pooling = Pooling(r, r, s, p)
        pooling_output = pooling.forward(active_output1)
        #行列を整形
        preaffine = pooling_output.reshape(batch, -1)
        #バッチ正規化
        batchnormalize = BatchNormalization(gamma, beta, 0.9, mean, var)
        batchnormalize_output = batchnormalize.forward(preaffine)
        #活性化2
        active_output2 = ReLU().forward(batchnormalize_output)
        #ドロップアウト
        dropout = Dropout(0.5)
        dropout_output = dropout.forward(active_output2)
        #全結合
        affine = Affine(W, b)
        affine_output = affine.forward(dropout_output)
        #ソフトマックス
        output = OutputLayer(affine_output, softmax)
        #クロスエントロピー誤差伝播
        errorback_crossentropy = ErrorBackCrossEntropy(output.output(), one_hot)
        #全結合層の逆伝播
        affine_back = affine.backward(errorback_crossentropy.del_en_x())
        #ドロップアウトの誤差逆伝播
        dropout_back = dropout.backward(affine_back)
        #活性化2の誤差逆伝播
        active_back2 = ReLU().backward(active_output2, dropout_back)
        #バッチ正規化の誤差逆伝播
        batchnormalize_back = batchnormalize.backward(active_back2)
        #行列の変換 14*14*30
        batch_dummy, l = batchnormalize_back.shape
        dx = int(np.sqrt(int(l/K)))
        tensor_del = batchnormalize_back.reshape(batch, K, dx, dx)
        #プーリングの誤差逆伝播
        pooling_back = pooling.backward(tensor_del)
        #活性化1の誤差逆伝播
        active_back1 = ReLU().backward(active_output1, pooling_back)
        #畳み込みの誤差逆伝播
        convolution_back = convolution.backward(active_back1)
        #変数を更新
        W = W - eta * affine.W
        b = b - eta * affine.b
        gamma = gamma - eta * batchnormalize.gamma
        beta = beta - eta * batchnormalize.beta
        filter_matrix = filter_matrix - eta * convolution.W
        bias = bias - eta * convolution.b
        i -= 1
        crossentropy = CrossEntropy(output.output().T, one_hot.T)
        mean_cross_entropy += crossentropy.result()
        mean = batchnormalize.running_mean
        var = batchnormalize.running_var
        if(i==0):
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/W", W)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/b", b)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/gamma", gamma)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/beta", beta)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/test_mean", mean)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/test_var", var)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/filter_matrix", filter_matrix)
            np.save("/Users/mst923/OneDrive - Kyoto University/3年後期/計算機科学実験4/画像処理/mnist_test/bias", bias)
            print("平均のクロスエントロピー"+str(mean_cross_entropy/len(sampled_data)))
            print("正解率:" + str(calculate_similarity(np.argmax(output.output(), axis=1).tolist(), correct_labels)))
            print("テスト開始")
            test_matrix = X_train[50000:]
            testbatch, k, dx, dy = test_matrix.shape
            #正規化
            test_matrix = np.array(test_matrix) / 255
            answer_labels = Y[50000:]
            convolution = Convolution(filter_matrix, bias, S, P)
            convolution_output = convolution.forward(test_matrix)
            #活性化1
            active_output1 = ReLU().forward(convolution_output)
            #プーリング
            pooling = Pooling(r, r, s, p)
            pooling_output = pooling.forward(active_output1)
            #行列を整形
            preaffine = pooling_output.reshape(testbatch, -1)
            #バッチ正規化
            batchnormalize = BatchNormalization(gamma, beta, 0.9, mean, var)
            batchnormalize_output = batchnormalize.forward(preaffine, False)
            #活性化2
            active_output2 = ReLU().forward(batchnormalize_output)
            #ドロップアウト
            dropout = Dropout(0.5)
            dropout_output = dropout.forward(active_output2, False)
            #全結合
            affine = Affine(W, b)
            affine_output = affine.forward(dropout_output)
            #ソフトマックス
            output = OutputLayer(affine_output, softmax)
            print("テスト正解率:" + str(calculate_similarity(np.argmax(output.output(), \
                                                                 axis=1).tolist(), answer_labels)))
        
mnistcontest_train(100, W_matrix, b_vector, gamma_init, beta_init, filter_matrix,\
                       bias_vector, mean_init, var_init)

平均のクロスエントロピー4.597044814973372
正解率:9.0
テスト開始


AttributeError: 'function' object has no attribute 'T'