# 张量实现方式

In [None]:
import tensorflow as tf

In [None]:
x = tf.random.normal([2,784])

In [None]:
# 隐藏层 1 张量
w1 = tf.Variable(tf.random.truncated_normal([784, 256], stddev=0.1))
b1 = tf.Variable(tf.zeros([256]))

In [None]:
# 隐藏层 2 张量
w2 = tf.Variable(tf.random.truncated_normal([256, 128], stddev=0.1))
b2 = tf.Variable(tf.zeros([128]))

In [None]:
# 隐藏层 3 张量
w3 = tf.Variable(tf.random.truncated_normal([128, 64], stddev=0.1))
b3 = tf.Variable(tf.zeros([64]))

In [None]:
# 输出层张量
w4 = tf.Variable(tf.random.truncated_normal([64, 10], stddev=0.1))
b4 = tf.Variable(tf.zeros([10]))

在计算时，只需要按照网络层的顺序，将上一层的输出作为当前层的输入即可，重复
直至最后一层，并将输出层的输出作为网络的输出，代码如下：

In [None]:
with tf.GradientTape() as tape: # 梯度记录器
     # x: [b, 28*28]
     # 隐藏层 1 前向计算，[b, 28*28] => [b, 256]
     h1 = x@w1 + tf.broadcast_to(b1, [x.shape[0], 256])
     h1 = tf.nn.relu(h1)
     # 隐藏层 2 前向计算，[b, 256] => [b, 128]
     h2 = h1@w2 + b2
     h2 = tf.nn.relu(h2)
     # 隐藏层 3 前向计算，[b, 128] => [b, 64]
     h3 = h2@w3 + b3
     h3 = tf.nn.relu(h3)
     # 输出层前向计算，[b, 64] => [b, 10]
     h4 = h3@w4 + b4

在使用 TensorFlow 自动求导功能计算梯度时，需要将前向计算过程放置在
tf.GradientTape()环境中，从而利用 GradientTape 对象的 gradient()方法自动求解参数的梯
度，并利用 optimizers 对象更新参数。

# 层实现方式

In [None]:
# 导入常用网络层 layers
from tensorflow.keras import layers,Sequential
fc1 = layers.Dense(256, activation=tf.nn.relu) # 隐藏层 1
fc2 = layers.Dense(128, activation=tf.nn.relu) # 隐藏层 2
fc3 = layers.Dense(64, activation=tf.nn.relu) # 隐藏层 3
fc4 = layers.Dense(10, activation=None) # 输出层

In [None]:
x = tf.random.normal([4,28*28])
h1 = fc1(x) # 通过隐藏层 1 得到输出
h2 = fc2(h1) # 通过隐藏层 2 得到输出
h3 = fc3(h2) # 通过隐藏层 3 得到输出
h4 = fc4(h3) # 通过输出层得到网络输出
h4

# sequential 实现
对于这种数据依次向前传播的网络，也可以通过 Sequential 容器封装成一个网络大类
对象，调用大类的前向计算函数一次即可完成所有层的前向计算，使用起来更加方便

In [None]:
# 导入 Sequential 容器
from tensorflow.keras import layers,Sequential
# 通过 Sequential 容器封装为一个网络类
model = Sequential([
  layers.Dense(256, activation=tf.nn.relu) , # 创建隐藏层 1
  layers.Dense(128, activation=tf.nn.relu) , # 创建隐藏层 2
  layers.Dense(64, activation=tf.nn.relu) , # 创建隐藏层 3
  layers.Dense(10, activation=None) , # 创建输出层
])

In [None]:
out = model(x) # 前向计算得到输出