# 初识TensorFlow

TensorFlow是 google 开源的机器学习工具，在2015年11月其实现正式开源，开源协议Apache 2.0。

## 1. TensorFlow 的基本概念

* TensorFlow的神经网络：用张量表示数据，用计算图表示神经网络，用会话执行计算图，优化计算图中的参数，得到模型

    * 下面我们来看一个TensorFlow搭建的计算图

假设我们要实现这样的一个数据图

<img src="img/计算图.jpg" width = "300" height = "200" alt="图片名称" align=left />

当需要计算e时就需要计算c与d，而计算c就需要计算a与b，计算d需要计算b。这样就形成了依赖关系。这种有向无环图就叫做计算图

### 张量

张量就是多维数组(列表)，用“阶”表示张量的维度。

- 0 阶张量称作标量，表示一个单独的数; 举例 S=123
- 1 阶张量称作向量，表示一个一维数组; 举例 V=[1,2,3]
- 2 阶张量称作矩阵，表示一个二维数组，它可以有 i 行 j 列个元素，每个元素可 以用行号和列号共同索引到;
- 举例 m=[[1, 2, 3], [4, 5, 6], [7, 8, 9]] 判断张量是几阶的，就通过张量右边的方括号数，0 个是 0 阶，n 个是 n 阶，张 量可以表示 0 阶到 n 阶数组(列表);
- 举例 t=[ [ [... ] ] ]为 3 阶。


### 数据类型

- Tensorflow 的数据类型有 tf.float32、tf.int32 等。

- 举例

In [19]:
#我们实现 Tensorflow 的加法:
import tensorflow as tf
# 定义一个张量 等于[1.0, 2.0]
a = tf.constant([1.0, 2.0])
#定义一个张量等于[3.0, 4.0]
b = tf.constant([3.0, 4.0])
#实现a+b的加法
result = a+b
print(result)

Tensor("add:0", shape=(2,), dtype=float32)


意思为 result 是一个名称为 add:0 的张量，shape=(2,)表示一维数组长度为 2， dtype=float32 表示数据类型为浮点型。

### 计算图(Graph)

搭建神经网络的计算过程，是承载一个或多个计算节点的一 张图，只搭建网络，不运算

#### 举例

神经网络的基本模型是神经元，神经元的基本模型其 实就是数学中的乘、加运算。我们搭建如下的计算图:

<img src="img/图x.png" width = "500" height = "300" alt="graph" align=left />

x1、x2 表示输入，w1、w2 分别是 x1 到 y 和 x2 到 y 的权重，y=x1*w1+x2*w2。

下面我们使用TensorFlow实现上述计算图:

In [21]:
# 首先要引入TensorFlow
import tensorflow as tf
# 定义二阶张量x
x = tf.constant([[1.0, 2.0]])
# 定于二阶张量w
w = tf.constant([[3.0], [4.0]])

# 计算y
y = tf.matmul(x, w)
# 打印出y的值
print(y)

Tensor("MatMul:0", shape=(1, 1), dtype=float32)


从这里我们可以看出，print 的结果显示 y 是一个张量，只搭建承载计算过程的 计算图，并没有运算，如果我们想得到运算结果就要用到“会话 Session()”了。

### 会话(Session)

with 结构实现Session，语法如下:

In [23]:
with tf.Session() as sess:
    print(sess.run(y))

[[ 11.]]


运行 Session()会话前只打印出 y 是个张量的提示，运行 Session() 会话后打印出了 y 的结果 1.0 * 3.0 + 2.0 * 4.0 = 11.0。

我们来看一个例子

In [3]:
# 引入TensorFlow
import  tensorflow as tf
# 定义一个计算图
graph  = tf.Graph()

with  graph.as_default():
    # 定义计算图的变量a tf.Variable是定义变量并赋予初值
    a = tf.Variable(3,name='a')
    # 定义计算图的变量b 
    b = tf.Variable(2,name='b')

    result = a + b

    initialize =  tf.global_variables_initializer()

我们来输出一下result

In [16]:
print(result)

Tensor("add:0", shape=(), dtype=int32)


输出的result是一个张量

下面我们来使用会话计算这个图

In [17]:
with  tf.Session(graph=graph) as sess:

    sess.run(initialize)
    tf.summary.FileWriter('./logs/summary', sess.graph)
    res = sess.run(result)
    print(res) 

5


这段代码中，定义了session，并在session中执行了真正的初始化，并且求得result的值并打印出来。可以看到，在session中产生了真正的计算，得出值为5。


我们利用tensorboard查看一下数据图

在终端中输入代码：
`tensorboard --logdir=logs/summary`

使用tensorboard可视化工具查看数据流图

<img src="img/graph.png" width = "800" height = "500" alt="graph" align=left />

## 2.训练神经网络的参数

神经网络的参数:是指神经元线上的权重 w，用变量表示，一般会先随机生成 这些参数。生成参数的方法是让 w 等于 tf.Variable，把生成的方式写在括号里。

- 神经网络中常用的生成随机数/数组的函数有:

    * tf.random_normal()  生成正态分布随机数

    * tf.truncated_normal() 生成去掉过大偏离点的正态分布随机数

    * tf.random_uniform() 生成均匀分布随机数

    * tf.zeros 表示生成全 0 数组

    * tf.ones 表示生成全 1 数组

    * tf.fill 表示生成全定值数组

    * tf.constant 表示生成直接给定值的数组

### 举例

- w=tf.Variable(tf.random_normal([2,3],stddev=2, mean=0, seed=1))

    表示生成正态分布随机数，形状两行三列，标准差是 2，均值是 0，随机种子是 1

- w=tf.Variable(tf.Truncated_normal([2,3],stddev=2, mean=0, seed=1))

    表示去掉偏离过大的正态分布，也就是如果随机出来的数据偏离平均值超过两个 标准差，这个数据将重新生成。

- w=random_uniform(shape=7,minval=0,maxval=1,dtype=tf.int32，seed=1),

    表示从一个均匀分布[minval maxval)中随机采样，注意定义域是左闭右开，即 包含 minval，不包含 maxval。

- tf.zeros([3,2],int32)表示生成 [[0,0],[0,0],[0,0]];

- tf.ones([3,2],int32)表示生成[[1,1],[1,1],[1,1]

- tf.fill([3,2],6)表示生成[[6,6],[6,6],[6,6]];

- tf.constant([3,2,1])表示 生成[3,2,1]。

ps：如果没有特殊要求标准差、均值、随机种子是可以不写的。随机种子如果去掉每次生成的随机数将不一致。