# 手写MNIST

神经网络的输入层有784个神经元，输出层有10个神经元。输入层的784这个数字来源于图像大小的28×28=784，输出层的10这个数字来源于10类别分类（数字0到9，共10类别）。   
此外，这个神经网络有2个隐藏层，**第1个隐藏层有50个神经元，第2个隐藏层有100个神经元**。   
> 这个50和100可以设置为任何值。

In [3]:
# coding: utf-8
import sys, os
sys.path.append(os.pardir)  # 为了导入父目录的文件而进行的设定
from dataset.mnist import load_mnist
import numpy as np
import pickle
from dataset.mnist import load_mnist
from common.functions import sigmoid, softmax

`init_network()`会读入保存在pickle文件`sample_weight.pkl`中的学习到的权重参数A。这个文件中以**字典变量**的形式保存了权重和偏置参数。

In [4]:
def get_data():
    (x_train, t_train), (x_test, t_test) = load_mnist(normalize=True, flatten=True, one_hot_label=False)
    return x_test, t_test

def init_network():
    file_path = os.path.abspath("./sample_weight.pkl")
    with open(file_path, 'rb') as f:
        network = pickle.load(f)
    return network

# 分类函数进行预测
def predict(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']

    # 前向传播
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3

    # 输出层，softmax函数以NumPy数组的形式输出各个标签对应的概率
    y = softmax(a3)

    return y

In [None]:
x, t = get_data() # 获取测试数据
network = init_network() # 初始化网络
accuracy_cnt = 0 # 

# 对每个图像进行预测
for i in range(len(x)):
    y = predict(network, x[i])
    p= np.argmax(y) # 获取概率最高的元素的索引，取出这个概率列表中的最大值的索引（第几个元素的概率最高）
    if p == t[i]:
        accuracy_cnt += 1

print("Accuracy:" + str(float(accuracy_cnt) / len(x)))

Accuracy:0.0937


解释变量x以及权重的形状

In [9]:
x, t = get_data()
network = init_network()
W1, W2, W3 = network['W1'], network['W2'], network['W3']
b1, b2, b3 = network['b1'], network['b2'], network['b3']

print("x.shape:", x.shape)
print("x[0].shape:", x[0].shape) # 这是因为x[0]是第一行测试数据，有784维
print("W1.shape:", W1.shape)
print("b1.shape:", b1.shape)
print("W2.shape:", W2.shape)
print("b2.shape:", b2.shape)
print("W3.shape:", W3.shape)
print("b3.shape:", b3.shape)

x.shape: (10000, 784)
x[0].shape: (784,)
W1.shape: (784, 50)
b1.shape: (50,)
W2.shape: (50, 100)
b2.shape: (100,)
W3.shape: (100, 10)
b3.shape: (10,)
