In [1]:
# coding: utf-8
import cPickle
import gzip
import time

import numpy as np

import theano
import theano.tensor as T


class LogisticRegression(object):

    def __init__(self, input, n_in, n_out):
        """ロジスティック回帰モデルの初期化
        input: ミニバッチ単位のデータ行列（n_samples, n_in）
        n_in : 入力の次元数
        n_out: 出力の次元数
        """
        # 重み行列を初期化
        self.W = theano.shared(value=np.zeros((n_in, n_out),
                                              dtype=theano.config.floatX),
                               name='W',
                               borrow=True)

        # バイアスベクトルを初期化
        self.b = theano.shared(value=np.zeros((n_out,),
                                              dtype=theano.config.floatX),
                               name='b',
                               borrow=True)

        # 各サンプルが各クラスに分類される確率を計算するシンボル
        # 全データを行列化してまとめて計算している
        # 出力は(n_samples, n_out)の行列
        self.p_y_given_x = T.nnet.softmax(T.dot(input, self.W) + self.b)

        # 確率が最大のクラスのインデックスを計算
        # 出力は(n_samples,)のベクトル
        self.y_pred = T.argmax(self.p_y_given_x, axis=1)

        # ロジスティック回帰モデルのパラメータ
        self.params = [self.W, self.b]
        
        # 入力値
        self._input = input

    def negative_log_likelihood(self, y, x=None):
        """誤差関数である負の対数尤度を計算するシンボルを返す
        yにはinputに対応する正解クラスを渡す
        """
        # 式通りに計算するとsumだがmeanの方がよい
        
        return -T.mean(T.log(self.p_y_given_x)[T.arange(y.shape[0]), y])

    def errors(self, y):
        """分類の誤差率を計算するシンボルを返す
        yにはinputに対応する正解クラスを渡す"""
        if y.ndim != self.y_pred.ndim:
            raise TypeError('y should have the same shape as self.y_pred',
                            ('y', y.type, 'y_pred', self.y_pred.type))

        if y.dtype.startswith('int'):
            return T.mean(T.neq(self.y_pred, y))
        else:
            raise NotImplementedError()
            
    def inputs(self):
        return self._input
    
    def pred(self):
        return self.y_pred


def load_data(dataset):
    """データセットをロードしてGPUの共有変数に格納"""
    
    f = gzip.open(dataset, 'rb')
    train_set, valid_set, test_set = cPickle.load(f)
    f.close()

    def shared_dataset(data_xy, borrow=True):
        data_x, data_y = data_xy

        # 共有変数には必ずfloat型で格納
        shared_x = theano.shared(
            np.asarray(data_x, dtype=theano.config.floatX), borrow=borrow)
        shared_y = theano.shared(
            np.asarray(data_y, dtype=theano.config.floatX), borrow=borrow)

        # ラベルはint型なのでキャストして返す
        return shared_x, T.cast(shared_y, 'int32')

    test_set_x, test_set_y = shared_dataset(test_set)
    valid_set_x, valid_set_y = shared_dataset(valid_set)
    train_set_x, train_set_y = shared_dataset(train_set)

    rval = [(train_set_x, train_set_y),
            (valid_set_x, valid_set_y),
            (test_set_x, test_set_y)]

    return rval


def sgd_optimization_mnist(learning_rate=0.13, n_epochs=1000, batch_size=600):
    
    # =================================
    # １．プリプロセス
    # =================================
    
    # =================================
    # １．１．データの読み込み
    # =================================
    
    # 学習データの準備
    datasets = load_data('mnist.pkl.gz')

    train_set_x, train_set_y = datasets[0]
    valid_set_x, valid_set_y = datasets[1]
    test_set_x, test_set_y = datasets[2]

    # ミニバッチの数
    n_train_batches = train_set_x.get_value(borrow=True).shape[0] / batch_size
    n_valid_batches = valid_set_x.get_value(borrow=True).shape[0] / batch_size
    n_test_batches = test_set_x.get_value(borrow=True).shape[0] / batch_size

    print "building the model ..."

    # =================================
    # １．２．シンボルの設定
    # =================================
    
    # シンボルの割り当て
    # ミニバッチのインデックスを表すシンボル
    index = T.lscalar()

    # ミニバッチの学習データとラベルを表すシンボル
    x = T.matrix('x')
    y = T.ivector('y')

    # MNISTの手書き数字を分類するロジスティック回帰モデル
    # 入力は28ピクセルx28ピクセルの画像、出力は0から9のラベル
    # 入力はシンボルxを割り当てておいてあとで具体的なデータに置換する
    classifier = LogisticRegression(input=x, n_in=28 * 28, n_out=10)

    # 誤差（コスト）を計算 => 最小化したい
    cost = classifier.negative_log_likelihood(y, x)
    
    # =================================
    # １．３．ミニバッチの設定
    # =================================

    # index番目のテスト用ミニバッチを入力してエラー率を返す関数を定義
    test_model = theano.function(
        inputs=[index],
        outputs=classifier.errors(y),
        givens={  # ここで初めてシンボル x, y を具体的な値で置き換える
            x: test_set_x[index * batch_size: (index + 1) * batch_size],
            y: test_set_y[index * batch_size: (index + 1) * batch_size]
        })

    # index番目のバリデーション用ミニバッチを入力してエラー率を返す関数を定義
    validate_model = theano.function(
        inputs=[index],
        outputs=classifier.errors(y),
        givens={
            x: valid_set_x[index * batch_size: (index + 1) * batch_size],
            y: valid_set_y[index * batch_size: (index + 1) * batch_size]
        })

    # =================================
    # １．４．式の設定
    # =================================
    
    # コスト関数の各パラメータでの微分を計算
    g_W = T.grad(cost=cost, wrt=classifier.W)
    g_b = T.grad(cost=cost, wrt=classifier.b)

    # パラメータ更新式
    updates = [(classifier.W, classifier.W - learning_rate * g_W),
               (classifier.b, classifier.b - learning_rate * g_b)]

    # index番目の訓練バッチを入力し、パラメータを更新する関数を定義
    # 戻り値としてコストが返される
    # この関数の呼び出し時にindexに具体的な値が初めて渡される
    train_model = theano.function(
        inputs=[index],
        outputs=cost,
        updates=updates,
        givens={
            x: train_set_x[index * batch_size: (index + 1) * batch_size],
            y: train_set_y[index * batch_size: (index + 1) * batch_size]
        })
    
    # =================================
    # １．５．入出力を表示
    # =================================
    
    # index番目のテスト用ミニバッチを入力して画素と輝度を返す関数を定義
    test_image = theano.function(
        inputs=[index],
        outputs=classifier.inputs(),
        givens={  # ここで初めてシンボル xを具体的な値で置き換える
            x: test_set_x[index * batch_size: (index + 1) * batch_size]
        })
    
    # 出力結果を表示
    test_output = theano.function(
        inputs=[index],
        outputs=classifier.pred(),
        givens={
            x: test_set_x[index * batch_size: (index + 1) * batch_size]
        })
    
    # =================================
    # ２．トレーニング
    # =================================

    # =================================
    # ２．１．パラメータ設定
    # =================================
    
    # モデル訓練
    print 'training the model ...'

    # eary-stoppingのパラメータ
    patience = 5000
    patience_increase = 2
    improvement_threshold = 0.995
    validation_frequency = min(n_train_batches, patience / 2)

    best_validation_loss = np.inf
    test_score = 0
    start_time = time.clock()

    done_looping = False
    epoch = 0

    
    while (epoch < n_epochs) and (not done_looping):
        epoch = epoch + 1
        for minibatch_index in xrange(n_train_batches):
            
            # =================================
            # ２．２．誤差逆伝播
            # =================================
            
            # minibatch_index番目の訓練データのミニバッチを用いてパラメータ更新
            train_model(minibatch_index)

            # =================================
            # ２．３．訓練結果の検証
            # =================================
            
            # validation_frequency回の更新ごとにバリデーションセットによるモデル検証が入る
            iteration = (epoch - 1) * n_train_batches + minibatch_index
            if (iteration + 1) % validation_frequency == 0:
                # バリデーションセットの平均エラー率を計算
                validation_losses = [
                    validate_model(i) for i in xrange(n_valid_batches)]
                this_validation_loss = np.mean(validation_losses)
                print "epoch %i, minibatch %i/%i, validation error %f %%" % \
                    (epoch, minibatch_index + 1, n_train_batches,
                     this_validation_loss * 100)

            # patienceを超えたらループを終了
            if patience <= iteration:
                done_looping = True
                break

    end_time = time.clock()
    print "Optimization complete with best validation score of %f %%, " \
        "with test performance %f %%" % \
        (best_validation_loss * 100, test_score * 100)
    print "The code run for %d epochs, with %f epochs/sec" % \
        (epoch, 1.0 * epoch / (end_time - start_time))
    with open("weight.txt", "w") as f:
        strOut = ""
        res = classifier.W.get_value(borrow=True)
        for i in range(len(res)):
            strOut += str(res[i])
        f.write(strOut)
    
    import cv2
    _n = 0
    minibatch_index = 0
    res = test_image(minibatch_index) # 600データ引っ張ってくる? len(res) => 600
    for i in range(len(res)):
        cv2.imwrite("output/num_{n}.png".format(n=_n), np.reshape(res[i], (28,28))*255)
        _n += 1
        print("output[{n}] is :".format(n=_n))
        print(test_output(minibatch_index)[i])
        
    print(n_train_batches)

if __name__ == "__main__":
    sgd_optimization_mnist()

SyntaxError: Missing parentheses in call to 'print' (<ipython-input-1-02bb1e25a56c>, line 126)

In [None]:
%debug

> [1;32m<ipython-input-2-76738cbee0eb>[0m(94)[0;36mload_data[1;34m()[0m
[1;32m     93 [1;33m    [1;31m# データのフォーマットを確認してみよう！[0m[1;33m[0m[1;33m[0m[0m
[0m[1;32m---> 94 [1;33m    [1;32mprint[0m[1;33m([0m[0mhogehogehoge[0m[1;33m)[0m[1;33m[0m[0m
[0m[1;32m     95 [1;33m[1;33m[0m[0m
[0m
ipdb> type(test_set)
<type 'tuple'>
ipdb> len(test_set)
2
ipdb> test_set[0]
array([[ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       ..., 
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.]], dtype=float32)
ipdb> test_set[1]
array([7, 2, 1, ..., 4, 5, 6], dtype=int64)
ipdb> len(test_set[0])
10000
ipdb> len(test_set[0][0])
784
ipdb> len(train_set[0])
50000
ipdb> len(train_set[0][1])
784
