# 简介

本指南旨在指导您使用低级别` TensorFlow API `(`TensorFlow Core`) 开始编程。您可以学习执行以下操作：
1. 管理您自己的 `TensorFlow` 程序 (`tf.Graph`) 和` TensorFlow `运行时 (`tf.Session`)，而不是依靠 `Estimator` 来管理它们
2. 使用 `tf.Session` 运行 `TensorFlow` 操作
3. 在此低级别环境中使用高级别组件（`数据集`、`层`和` feature_columns`）
4. 构建自己的训练循环，而不是使用` Estimator` 提供的训练循环


我们建议尽可能使用更高阶的` API` 构建模型。以下是 `TensorFlow Core` 为何很重要的原因：
1. 如果您能够直接使用低阶 `TensorFlow` 操作，实验和调试都会更直接
2. 在使用更高阶的` API` 时，能够理解其内部工作原理

# 设置

要充分理解本指南中的内容，您应当具备以下方面的知识：
1. 如何使用 Python 编程
2. 对阵列有所了解
3. 理想情况下，最好对机器学习有一定的了解

您随时可以启动` python`，并按照以下演示进行操作。运行以下行来设置您的` Python `环境：

In [1]:
from __future__ import absolute_import

绝对引入，即不在当前目录搜寻模块，而是直接从系统路径中搜寻相应的模块。

In [2]:
from __future__ import division

在python2中，3/2 = 1，而如果我们想使用python3中的除法，则需要导入该语句，它使得3/2 = 1.5

In [3]:
from __future__ import print_function

在python2中使用python3的print函数。

# 张量值

`TensorFlow `中的核心数据单位是**张量**。一个张量由一组形成阵列（任意维数）的原始值组成。**张量的阶**是它的维数，而**它的形状**是一个**整数元组，指定了阵列每个维度的长度**。以下是张量值的一些示例：

```Python
3. # a rank 0 tensor; a scalar with shape [],       0阶张量，形状是[]
[1., 2., 3.] # a rank 1 tensor; a vector with shape [3]  1阶张量，形状是[3]
[[1., 2., 3.], [4., 5., 6.]] # a rank 2 tensor; a matrix with shape [2, 3]  2阶张量，形状是[2,3]
[[[1., 2., 3.]], [[7., 8., 9.]]] # a rank 3 tensor with shape [2, 1, 3]  3阶张量，形状是[2,1,3]
```

TensorFlow 使用 numpy 阵列来表示张量**值**

# TensorFlow Core 演示

您可以将 `TensorFlow Core` 程序看作由**两个互相独立的部分**组成：
1. 构建计算图 (`tf.Graph`)
2. 运行计算图（使用 `tf.Session`）

## 图

**计算图**是排列成一个图的一系列 `TensorFlow `指令。图由**两种类型的对象**组成:

1. 操作（简称“op”）：图的节点。操作描述了消耗和生成张量的计算
2. 张量：图的边。它们代表将流经图的值。大多数` TensorFlow` 函数会返回 `tf.Tensors`

<font color='red'>重要提示：`tf.Tensors` 不具有值，它们只是计算图中元素的手柄</font>

我们来构建一个简单的计算图。

最基本的指令是一个常量。构建指令的` Python `函数将一个张量值作为输入值。生成的指令不需要输入值。它在运行时输出的是被传递给构造函数的值。我们可以创建如下所示的两个浮点数常量` a` 和 `b`：

In [4]:
import tensorflow as tf

a = tf.constant(3.0,dtype=tf.float32)
b = tf.constant(4.0) # also tf.float32
total = a + b
print(a)
print(b)
print(total)

Tensor("Const:0", shape=(), dtype=float32)
Tensor("Const_1:0", shape=(), dtype=float32)
Tensor("add:0", shape=(), dtype=float32)


请注意，打印张量并不会如您可能预期的那样输出值 3.0、4.0 和 7.0。上述语句只会构建计算图。这些 `tf.Tensor `对象仅代表将要运行的操作的结果。

图中的每个指令都拥有唯一的名称。这个名称不同于使用 `Python `分配给相应对象的名称。**张量是根据生成它们的指令命名的，后面跟着输出索引**，如上文的 "add:0" 所示。

## TensorBoard

`TensorFlow `提供了一个名为` TensorBoard `的实用程序。`TensorBoard` 的诸多功能之一是**将计算图可视化**。您只需要使用几个简单的命令就能轻松完成此操作。

### 将计算图保存为摘要文件

首先将计算图保存为 `TensorBoard `摘要文件，具体操作如下所示：

In [5]:
writer = tf.summary.FileWriter('./code/')
writer.add_graph(tf.get_default_graph())

这将在当前目录中生成一个`event`文件，其名称格式如下：
`events.out.tfevents.{timestamp}.{hostname}`

### 在shell终端启动TensorBoard

```Python
tensorboard --logdir .
```

## 会话(Session)

要评估张量，需要实例化一个 `tf.Session` 对象（非正式名称为会话）。会话会封装` TensorFlow` 运行时的状态，并运行 `TensorFlow `操作。**如果说` tf.Graph` 像一个 `.py` 文件，那么 `tf.Session` 就像一个 `python` 可执行对象**。

### 创建会话，并传递一个张量

下面的代码会创建一个` tf.Session `对象，然后调用其 `run `方法来评估我们在上文中创建的 `total `张量：

In [6]:
sess = tf.Session()
print(sess.run(total))

7.0


当您使用 `Session.run `请求输出节点时，`TensorFlow` 会回溯整个图，并流经 提供了所请求的 输出节点对应的输入值的所有节点。因此此指令会打印预期的值 7.0：

### 将多个张量传递给会话

您可以将多个张量传递给` tf.Session.run`。`run` 方法以透明方式处理**元组或字典的任何组合**，如下例所示：

In [7]:
print(sess.run({'ab':(a,b),'total':total}))

{'ab': (3.0, 4.0), 'total': 7.0}


它返回的结果拥有相同的布局结构。

在调用 `tf.Session.run` 期间，任何 `tf.Tensor `都只有**单个值**。例如，以下代码调用 `tf.random_uniform `来生成一个 `tf.Tensor`，后者会生成随机的**三元素矢量（值位于 \[0,1) 区间内）**：

In [8]:
vec = tf.random_uniform(shape=(3,))
out1 = vec + 1
out2 = vec + 2
print(sess.run(vec))
print(sess.run(vec))
print(sess.run((out1,out2)))

[0.18239975 0.8381349  0.51726115]
[0.09218693 0.6186353  0.62429035]
(array([1.6016812, 1.4864638, 1.2159048], dtype=float32), array([2.6016812, 2.4864638, 2.2159047], dtype=float32))


每次调用 `run `时，结果都会显示不同的随机值，但在单个` run` 期间（`out1` 和` out2 `接收到相同的随机输入值），结果显示的值是一致的。

部分 `TensorFlow` 函数会返回 `tf.Operations`，而不是` tf.Tensors`。对指令调用` run `的结果是` None`。您运行指令是为了产生副作用，而不是为了检索一个值。这方面的例子包括稍后将演示的初始化和训练操作。

## 供给：占位符和feed_dict

目前来讲，这个图不是特别有趣，因为它总是生成一个常量结果。**图可以参数化以便接受外部输入，也称为占位符。占位符表示承诺在稍后提供值，它就像函数参数**。

In [9]:
x = tf.placeholder(tf.float32)
y = tf.placeholder(tf.float32)
z = x + y

前面三行有点像函数。我们定义了这个函数的两个输入参数（`x` 和` y`），然后对它们运行指令。我们可以使用 `run` 方法的 `feed_dict` 参数为**占位符提供具体的值**，从而评估这个具有多个输入的图：

In [10]:
print(sess.run(z,feed_dict={x:3,y:4.5}))
print(sess.run(z,feed_dict={x:[1,3],y:[2,4]}))

7.5
[3. 7.]


另请注意，`feed_dict `参数可用于覆盖图中的任何张量。占位符和其他` tf.Tensors` 的唯一不同之处在于**如果没有为占位符提供值，那么占位符会抛出错误**。

# 数据集：

**占位符**适用于简单的实验，而**数据集是将数据流式传输到模型的首选方法**。

要从数据集中获取可运行的 `tf.Tensor`，您必须先将其转换成` tf.data.Iterator`，然后调用迭代器的 `get_next `方法。

## 为数据集创建迭代器

创建迭代器的最简单的方式是采用` make_one_shot_iterator` 方法。例如，在下面的代码中，`next_item `张量将在每次` run` 调用时从 `my_data `阵列返回一行：

In [11]:
my_data = [
    [0,1],
    [2,3],
    [4,5],
    [6,7],
]

slices = tf.data.Dataset.from_tensor_slices(my_data)
next_item = slices.make_one_shot_iterator().get_next()

## 检查是否到达数据集末端

到达数据流末端时，`Dataset `会抛出` OutOfRangeError`。例如，下面的代码会一直读取` next_item`，直到没有数据可读：

In [12]:
while True:
    try:
        print(sess.run(next_item))
    except tf.errors.OutOfRangeError:
        break

[0 1]
[2 3]
[4 5]
[6 7]


## 初始化迭代器

如果` Dataset` 依赖于有状态操作，则可能需要**在使用迭代器之前先初始化它**，如下所示：

In [13]:
r = tf.random_normal([10,3])
dataset = tf.data.Dataset.from_tensor_slices(r)
iterator = dataset.make_initializable_iterator()
next_row = iterator.get_next()

# 初始化迭代器
sess.run(iterator.initializer)
while True:
    try:
        print(sess.run(next_row))
    except tf.errors.OutOfRangeError:
        break

Instructions for updating:
Colocations handled automatically by placer.
[-0.8745127  1.1531501  3.148776 ]
[ 1.0594535   0.02045189 -0.7889617 ]
[ 0.03965719 -0.306316   -0.33138922]
[-2.252769   0.2920087  1.0636153]
[-0.94206524  1.159319   -0.41664416]
[0.00402342 1.732038   1.6371913 ]
[ 0.7096187 -1.0286368 -1.1046615]
[-0.5538976   0.69938475  2.1647782 ]
[ 0.9300321  1.174774  -0.117594 ]
[-1.4865223 -1.1875577 -1.4742011]


# 层

可训练的模型必须修改图中的值，以便在输入相同值的情况下获得新的输出值。**将可训练参数添加到图中的首选方法是`层`**。

**层将变量和作用于它们的操作打包在一起**。例如，密集连接层会对每个输出对应的所有输入执行加权和，并应用激活函数（可选）。**连接权重和偏差由层对象管理**。

## 创建层

下面的代码会创建一个` Dense `层，该层会接受一批输入矢量，并为每个矢量生成一个输出值。**要将层应用于输入值，请将该层当做函数来调用**。例如：

In [14]:
x = tf.placeholder(tf.float32,shape=[None,3])
linear_model = tf.layers.Dense(units=1)
y = linear_model(x)

**层会检查其输入数据，以确定其内部变量的大小**。因此，我们必须在这里**设置` x` 占位符的形状**，以便层构建正确大小的权重矩阵。

我们现在已经定义了输出值` y `的计算，在我们运行计算之前，还需要处理一个细节。

## 初始化层

层包含的变量必须先初始化，然后才能使用。尽管可以单独初始化各个变量，但也可以轻松地初始化一个` TensorFlow `图中的所有变量（如下所示）：

In [15]:
init = tf.global_variables_initializer()
sess.run(init)

重要提示：调用 `tf.global_variables_initializer `仅会创建并返回 `TensorFlow `操作的句柄。当我们使用 `tf.Session.run` 运行该操作时，该操作**将初始化所有全局变量**。

另请注意，此 `global_variables_initializer` **仅会初始化创建初始化程序时图中就存在的变量**。因此您应该**在构建图表的最后一步添加初始化程序**。

## 执行层

我们现在已经完成了层的初始化，可以像处理任何其他张量一样评估 `linear_model `的输出张量了。例如，下面的代码：

In [16]:
print(sess.run(y,{x:[[1,2,3],[4,5,6]]}))

[[2.265516 ]
 [4.5221624]]


生成一个两元素输出向量。

## 层函数的快捷方式

对于每个**层类**（如 `tf.layers.Dense`)，`TensorFlow `还提供了一个快捷函数（如 `tf.layers.dense`）。两者唯一的区别是快捷函数版本是在单次调用中创建和运行层。例如，以下代码等同于较早的版本：

In [17]:
x = tf.placeholder(tf.float32, shape=[None, 3])
y = tf.layers.dense(x, units=1)

init = tf.global_variables_initializer()
sess.run(init)

print(sess.run(y, {x: [[1, 2, 3], [4, 5, 6]]}))

Instructions for updating:
Use keras.layers.dense instead.
[[-1.6517069]
 [-2.493249 ]]


尽管这种方法很方便，但无法访问 `tf.layers.Layer `对象。**这会让自省和调试变得更加困难，并且无法重复使用相应的层**。

# 特征列

使用特征列进行实验的最简单方法是使用 `tf.feature_column.input_layer` 函数。此函数只接受密集列作为输入，因此要查看类别列的结果，您必须将其封装在` tf.feature_column.indicator_column` 中。例如：

In [18]:
import warnings
warnings.filterwarnings('ignore')

features = {
    'sales':[[5],[10],[8],[9]],
    'department':['sports','sports','gardening','gardening']
}

department_column = tf.feature_column.categorical_column_with_vocabulary_list(
    'department',['sports','gardening']
)

department_column = tf.feature_column.indicator_column(department_column)

columns = [
    tf.feature_column.numeric_column('sales'),
    department_column
]

inputs = tf.feature_column.input_layer(features,columns)

Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
Use tf.cast instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please use the new FeatureColumn APIs instead.
Instructions for updating:
The old _FeatureColumn APIs are being deprecated. Please 

运行` inputs `张量会将` features `解析为一批向量。

**特征列 和 层 一样具有内部状态，因此通常需要将它们初始化**。类别列会在内部使用**对照表**，而这些表需要**单独的初始化操作** `tf.tables_initializer`

In [19]:
var_init = tf.global_variables_initializer()

# 对类别列单独初始化
table_init = tf.tables_initializer()

sess = tf.Session()
sess.run((var_init,table_init))

(None, None)

初始化内部状态后，您可以运行` inputs`（像运行任何其他 `tf.Tensor `一样）：

In [20]:
print(sess.run(inputs))

[[ 1.  0.  5.]
 [ 1.  0. 10.]
 [ 0.  1.  8.]
 [ 0.  1.  9.]]


这显示了特征列如何打包输入矢量，并将**独热“department”**作为第一和第二个索引，将**“sales”**作为第三个索引。

# 训练

您现在已经了解 `TensorFlow `核心部分的基础知识了，我们来手动训练一个小型回归模型吧。

## 定义数据

我们首先来定义一些输入值` x`，以及每个输入值的预期输出值` y_true`：

In [21]:
x = tf.constant([[1],[2],[3],[4]],dtype=tf.float32)
y_true = tf.constant([[0],[-1],[-2],[-3]],dtype=tf.float32)

## 定义模型

接下来，建立一个简单的线性模型，其输出值只有 `1 `个：

In [22]:
linear_model = tf.layers.Dense(units=1)
y_pred = linear_model(x)

您可以如下评估预测值：

In [23]:
sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)

该模型尚未接受训练，因此四个“预测”值并不理想。以下是我们得到的结果，您自己的输出应该有所不同：

In [24]:
print(sess.run(y_pred))

[[-1.4092606]
 [-2.8185213]
 [-4.227782 ]
 [-5.6370425]]


## 损失

要优化模型，您首先需要定义损失。我们将使用**均方误差，这是回归问题的标准损失**。

虽然您可以使用较低级别的数学运算手动定义，但 `tf.losses` 模块提供了一系列常用的损失函数。您可以使用它来计算均方误差，具体操作如下所示：

In [25]:
loss = tf.losses.mean_squared_error(labels=y_true,predictions=y_pred)

这会生成如下所示的一个损失值：

In [26]:
print(sess.run(loss))

4.30251


## 训练

`TensorFlow `提供了执行标准优化算法的优化器。这些优化器被实现为` tf.train.Optimizer `的子类。它们会逐渐改变每个变量，以便将损失最小化。

最简单的优化算法是梯度下降法，由 `tf.train.GradientDescentOptimizer` 实现。它会根据损失相对于变量的导数大小来修改各个变量。例如：

In [27]:
optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

该代码构建了优化所需的所有图组件，并返回一个训练指令。该训练指令在运行时会更新图中的变量。您可以按以下方式运行该指令：

In [28]:
for _ in range(10):
    _,loss_value = sess.run((train,loss))
    print(loss_value)

4.30251
3.0152617
2.1218882
1.5018175
1.071387
0.77254593
0.56501186
0.42083547
0.3206222
0.2509153


由于 `train` 是**一个指令而不是张量，因此它在运行时不会返回一个值**。为了查看训练期间损失的进展，我们会同时运行损失张量，生成如上所示的输出值。

## 完整程序

In [29]:
x = tf.constant([[1], [2], [3], [4]], dtype=tf.float32)
y_true = tf.constant([[0], [-1], [-2], [-3]], dtype=tf.float32)

linear_model = tf.layers.Dense(units=1)

y_pred = linear_model(x)
loss = tf.losses.mean_squared_error(labels=y_true, predictions=y_pred)

optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

init = tf.global_variables_initializer()

sess = tf.Session()
sess.run(init)
for i in range(10):
  _, loss_value = sess.run((train, loss))
  print(loss_value)

print(sess.run(y_pred))

1.7991261
1.3135391
0.97621125
0.7417592
0.5786929
0.465162
0.38600498
0.3307014
0.29195175
0.26469046
[[-0.641314 ]
 [-1.1986932]
 [-1.7560723]
 [-2.3134515]]


# 后续步骤

要详细了解如何使用` TensorFlow` 构建模型，请参阅: 自定义` Estimator`，了解如何使用 `TensorFlow `构建自定义模型。掌握 `TensorFlow Core` 知识有助于理解和调试您自己的模型。