In [1]:
# 样例解决二分类问题

In [None]:
import tensorflow as tf

from numpy.random import RandomState

# 定义训练数据的batch大小
batch_size = 8

# 定义神经网络的参数
w1 = tf.Variable(tf.random.normal((2, 3), stddev = 1, seed = 1))
w2 = tf.Variable(tf.random.normal((3, 1), stddev = 1, seed = 1))

# 在shape的维度上使用None,可以方便使用不用的batch大小，在训练时需要把数据分成比较小的batch,但是在测试时，可以一次性使用全部的数据。
# 当数据集比较小时，这样比较方便测试，当数据集比较大时，将大量数据放入一个batch，肯能会导致内存溢出
x = tf.placeholder(tf.float32, shape = (None,2), name = 'x-input')
y_ = tf.placeholder(tf.float32, shape = (None,1), name = 'y-input')

# 定义神经网络前向传播的过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

# 定义损失函数和反向传播算法
# 使用sigmoid函数将y转换为0-1之间的数值，转化后y代表预测是正样本的概率，1-y代表预测是负样本的概率
y = tf.sigmoid(y)

# 定义损失函数来刻画预测值和真实值之间的差距
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10,1.0)) +
                               (1-y) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0)))

# 定义反向传播算法来优化神经网络中的参数
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

# 通过随机数生成一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)

# 定义规则来给出样本的标签，在这里所有x1+x2<1的样例都被认为是正样本(比如零件合格)，
# 而其他为负样本 0表示负样本，1表示正样本
Y = [[int( x1 + x2 < 1)] for (x1, x2) in X]

# 创建一个会话来运行TensorFlow程序
with tf.Session() as sess:
    init_op = tf.compat.v1.global_variables_initializer()
    # 初始化变量
    sess.run(init_op)
    
    # 打印训练之前神经网络的参数值
    print(sess.run(w1))
    print(sess.run(w2))
    
    # 设定训练轮数
    STEPS = 5000
    for i in range(STEPS):
        # 每次选取batch_size个样本进行训练
        start = (i * batch_size) % dataset_size
        end = min(start + batch_size, dataset_size)
        
        # 通过选取的样本训练神经网络并更新参数
        sess.run(train_step, feed_dict = {x : X[start : end], y_, Y[start : end]})
        
        if i % 1000 == 0:
            # 每隔一段时间计算在所有数据上的交叉熵并输出
            total_cross_entropy = sess.run(cross_entropy, feed_dict = {x : X, y : Y})
            
            print("After %d training step(s), cross_entropy on all data is %g" %(i, total_cross_entropy))
            
    
    # 打印训练之后神经网络的参数值
    print(sess.run(w1))
    print(sess.run(w2))
    
# 可以发现权重参数在训练前后发生了变化，它使得这个神经网络能更好的拟合提供的训练数据