### 在模拟数据集上面训练神经网络。下面给出了一个完整的程序来训练神经网络解决二分类问题。

In [2]:
import tensorflow as tf
from numpy.random import RandomState

In [15]:
# 定义训练数据batch的大小
batch_size = 8

# 定义神经网络的参数。
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1))

# 在shape的一个维度上使用None可以方便使用不同的batch大小。在训练时需要把数据
# 分成比较小的batch，但是在测试时候，可以一次性使用全部的数据。
# 当数据集比较小时这样比较方便测试，但数据集比较大时，将大量数据放入一个batch可能会导致内存溢出。
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

# 定义神经网络前向传播的过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

# 定义损失函数和反向传播算法。
y = tf.sigmoid(y)
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)) + (1-y) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

# 通过随机数生成一个模拟数据集.
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)

# 定义规则来给出样本的标签。在这里所有x1+x2<1的样例都被认为是正样本（比如零件合格），
# 而其他为负样本。
Y = [[int((x1+x2) < 1)] for (x1, x2) in X]

# 创建一个会话来运行TensorFlow程序。
with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    # 初始化变量
    sess.run(init_op)
    
    print('训练前的参数：')
    print('w1:', sess.run(w1))
    print('w2:', sess.run(w2))
    
    '''    
    在训练之前神经网络参数的值：
    wl = [[-0.81131822 , 1.48459876 , 0.06532937)
            [-2.44270396 , 0.0992484 , 0.59122431]]
    w2 = [[-0.81131822) , [1.48459876) , [0.06532937]]
    
    '''
    
    # 设定训练的轮数
    STEPS = 5000
    for i in range(STEPS):
        # 每次选取batch_size个样本尽快训练。
        start = (i * batch_size) % dataset_size
        end = min(start+batch_size, dataset_size)

        # 通过选取的样本训练神经网络并更新参数。
        sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]})
        if i % 1000 == 0:
            # 每隔一段时间计算在所有数据上的交叉熵输出。
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_:Y})
            print("After %d training step(s), cross entropy on all data is %g"%(i, total_cross_entropy))
            
    print('训练后的参数：')
    print('w1:', sess.run(w1))
    print('w2:', sess.run(w2))

训练前的参数：
w1: [[-0.8113182   1.4845988   0.06532937]
 [-2.4427042   0.0992484   0.5912243 ]]
w2: [[-0.8113182 ]
 [ 1.4845988 ]
 [ 0.06532937]]
After 0 training step(s), cross entropy on all data is 0.314006
After 1000 training step(s), cross entropy on all data is 0.0684551
After 2000 training step(s), cross entropy on all data is 0.033715
After 3000 training step(s), cross entropy on all data is 0.020558
After 4000 training step(s), cross entropy on all data is 0.0136867
训练后的参数：
w1: [[-2.548655   3.0793087  2.8951712]
 [-4.1112747  1.6259071  3.3972702]]
w2: [[-2.3230937]
 [ 3.3011687]
 [ 2.4632082]]
