In [1]:
# ニューラルネットワーク
# * 適応可能な重みとバイアスを持つ
# * 重みとバイアスを訓練データに適応するように調整することを「学習」と呼ぶ
# * ニューラルネットワークの学習は下記の4つの手順で行う

# ステップ1 (ミニバッチ)
# 訓練データの中からランダムに一部のデータを選ぶ(ミニバッチ)
# ミニバッチの値を減らすことを目的とする

# ステップ2 (勾配の算出)
# ミニバッチの損失関数を減らすために、各重みパラメータの
# 勾配を求める
# 勾配は損失関数の値を最も減らす方向を示す

# ステップ3 (パラメータの更新)
# 重みパラメータを勾配方向に微小量だけ更新

# ステップ4 (繰り返す)
# ステップ1, ステップ2, ステップ3 を繰り返す

# ==> 確率的勾配降下方 (stochastic gradient descent)
# 無作為に選び出したデータに対して行う勾配降下方 (SGD)

In [2]:
import sys, os
sys.path.append(os.pardir)

In [3]:
import numpy as np
from two_layer_net import TwoLayerNet

In [4]:
# 入力は 28 * 28 の784個で、出力は 0~9 のラベルに該当する配列で10個
# 隠れ層の個数は適当
net = TwoLayerNet(input_size=784, hidden_size=100, output_size=10)
print(net.params["W1"].shape)
print(net.params["b1"].shape)
print(net.params["W2"].shape)
print(net.params["b2"].shape)

(784, 100)
(100,)
(100, 10)
(10,)


In [5]:
x = np.random.rand(100, 784) # ダミーの入力データ(100枚分)
y = net.predict(x)
print(y[:10])

[[ 0.09975769  0.09569285  0.09414434  0.10634695  0.10044565  0.09978512
   0.10995193  0.09986102  0.09506614  0.09894832]
 [ 0.10021527  0.09554692  0.09395609  0.10621823  0.10057195  0.09995801
   0.10983428  0.09961972  0.09542599  0.09865354]
 [ 0.10008986  0.09594958  0.09383852  0.10608965  0.10031056  0.09982403
   0.11029844  0.09962606  0.09508858  0.09888472]
 [ 0.09999379  0.0956334   0.09410746  0.1061865   0.10010306  0.10006823
   0.10948392  0.09987131  0.09545137  0.09910095]
 [ 0.10036845  0.09597084  0.09363798  0.10600661  0.10001059  0.10040245
   0.10979914  0.09969463  0.09522213  0.09888718]
 [ 0.09997935  0.09615998  0.09393316  0.10596536  0.10048283  0.10003977
   0.10988057  0.09949506  0.09499634  0.09906758]
 [ 0.10037955  0.09569347  0.09404043  0.10603377  0.10034352  0.10009323
   0.10989416  0.09944293  0.09518215  0.09889681]
 [ 0.10024168  0.09553642  0.09390123  0.10618156  0.10022077  0.1000125
   0.10971707  0.10006043  0.09548218  0.09864617]
 

In [6]:
x = np.random.rand(100, 784) # ダミーの入力データ(100枚分)
t = np.random.rand(100,10) # ダミーの正解ラベル(100枚分)
grads = net.numerical_gradient(x, t) # 勾配を計算

print(grads["W1"].shape)
print(grads["b1"].shape)
print(grads["W2"].shape)
print(grads["b2"].shape)

(784, 100)
(100,)
(100, 10)
(10,)
