# TensorFlow基础



TensorFlow™是Google开发的一个基于数据流图编程的开源软件库，被广泛应用于各类机器学习算法的编程实现，可部署于各类服务器、PC终端和移动端等多种设备上，并支持GPU和TPU高性能数值计算，是机器学习和深度学习领域的主流框架之一。

In [5]:
# 测试安装是否成功
import tensorflow as tf
tf.__version__



'1.13.1'

### 用TensorFlow说Hello World!

In [8]:
# 创建一个常值

hello = tf.constant("1")
# 创建一个TF会话

sess = tf.Session()

# 运行并获得结果
print(sess.run(hello))


b'1'


这里‘b’表示Bytes literals（字节文字）。

### 数据流图

TensorFlow程序的执行分为创建流图、执行对话两个部分。

TensorFlow内部将上述计算过程表征为**数据流图**，也称为**计算图**。

创建流图（或计算图）就是建立计算模型，执行对话则是提供数据并获得结果。

计算图是一个有向图，由以下内容构成：

- 一组节点，每个节点都代表一种运算


- 一组有向边，每个边代表实施运算所需要的数据

TensorFlow有两种边：

- 常规边：带有节点之间的数据结构。一个节点的运算输出成为另一个节点的输入，连接两个节点的边携带着值。


- 特殊边：不携带值，值表示两个节点之间的控制相关性。比如，$X$和$Y$之间的边可以表示只有当$X$中的运算执行完毕后才执行$X$。


In [11]:
# 一个简单计算图

node1 = tf.constant(3.0,tf.float32,name="node1")
node2 = tf.constant(4.0,tf.float32,name="node2")
node3 = tf.add(node1,node2)
print(node3)
sess = tf.Session()
print(sess.run(node3))
sess.close()

Tensor("Add_2:0", shape=(), dtype=float32)
7.0


In [17]:
print(node3)

Tensor("Add_3:0", shape=(), dtype=float32)


输出的结果不是一个具体的数字，而是一个张量的结构

In [18]:
print(node1)

Tensor("node1_2:0", shape=(), dtype=float32)


In [19]:
# 建立会话并显示运行结果
sess = tf.Session()
print("运行sess.run(node1)的结果：", sess.run(node1))

运行sess.run(node1)的结果： 3.0


In [20]:
# 更新变量并返回计算结果
print("运行sess.run(node3)的结果：", sess.run(node3))

# 关闭session
sess.close()

运行sess.run(node3)的结果： 7.0


### 张量的属性

Tensor("add:0", shape=(2,), dtype=float32)

名字（name）

	“node:src_output”：node 节点名称，src_output 来自节点的第几个输出
    
形状（shape）

	张量的维度信息， shape=(2,) 一维数组，长度为2
    
类型（type）

	每一个张量会有一个唯一的类型。
    
	TensorFlow会对参与运算的所有张量进行类型的检查，发现类型不匹配时会报错
    

### 张量的阶（Rank）、秩

张量的阶（rank）表征了张量的维度

阶为0的张量等价于标量；

阶为1的张量等价于向量；

阶为2的张量等价于矩阵，通过t[i,j] 获取元素；

阶为3的张量，通过t[i,j,k] 获取元素；

In [14]:

tensor1 = tf.constant([[[1,2],[3,4]],[[5,6],[7,8]]])
sess = tf.Session()
print(tensor1)
print(sess.run(tensor1)[1,1,1])
sess.close()

Tensor("Const_3:0", shape=(2, 2, 2), dtype=int32)
8


下标从0开始

### 张量的形状（Shape）

In [15]:


tensor2= tf.constant([[[1,2],[2,3]],[[3,4],[5,6]],[[7,8],[9,10]]])
print(tensor2)

Tensor("Const_4:0", shape=(3, 2, 2), dtype=int32)


In [18]:
scalar = tf.constant(100)
vector = tf.constant([1, 2, 3, 4, 5])
matrix = tf.constant([[1, 2, 3], [4, 5, 6]])
cube_matrix = tf.constant([[[1], [2]], [[3], [4]], [[5], [6]]])

print(scalar.get_shape())
print(vector.get_shape())
print(matrix.get_shape())
print(cube_matrix.get_shape())

()
(5,)
(2, 3)
(3, 2, 1)


### 张量的数据类型

TensorFlow支持14种不同的数据类型

实数 	tf.float32, tf.float64

整数 	tf.int8, tf.int16, tf.int32, tf.int64, tf.uint8

布尔 	tf.bool

复数 	tf.complex64, tf.complex128



默认类型：

不带小数点的数会被默认为int32

带小数点的会被默认为float32


In [19]:
a = tf.constant([1, 2], name="a")
b = tf.constant([2.0, 3.0], name="b")
result = tf.add(a,b)

TypeError: Input 'y' of 'Add' Op has type float32 that does not match type int32 of argument 'x'.

运行报错：

ValueError: Tensor conversion requested dtype int32 for Tensor with dtype float32: 'Tensor("b_3:0", shape=(2,), dtype=float32)'

TensorFlow会对参与运算的所有张量进行类型的检查，发现类型不匹配时会报错


### 会话 Session

会话拥有并管理TensorFlow程序运行时的所有资源

当所有计算完成之后需要关闭会话帮助系统回收资源


### 会话的典型模式1

In [None]:
# 创建一个会话
sess = tf.Session()
#使用这个创建好的会话来得到关心的运算的结果。比如可以调用 sess.run(result)
#来得到张量result的取值
sess.run()
#关闭会话使得本次运行中使用到的资源可以被释放
sess.close()


需要明确调用 Session.close函数来关闭会话并释放资源


### 会话的典型模式2 


In [None]:
node1 = tf.constant(1.0,tf.float32,name="node1")
node2 = tf.constant(2.0,tf.float32,name="node2")
result = tf.add(node1, node2)

#创建一个会话，并通过Python中的上下文管理器来管理这个会话
with tf.Session() as sess:
    #使用这创建好的会话来计算关心的结果
    print(sess.run(result))
# 不需要再调用 Session.close() 函数来关闭会话
# 当上下文退出时会话关闭和资源释放也自动完成了

with tf.Session() as sess:
    print(sess.run(result))


### 指定默认的会话

在构造静态的计算图时，如果没有特殊指定，tensorflow会生成默认的计算图，运算会自动加入这个默认的计算图中。
对于会话功能，也有类似的机制，但是不会生成默认的会话，需要手动指定。当默认的会话被指定之后就可以通过tf.tensor.eval( )函数来计算一个张量的值。

In [23]:
node1 = tf.constant(1.0,tf.float32,name="node1")
node2 = tf.constant(2.0,tf.float32,name="node2")
result = tf.add(node1, node2)

sess = tf.Session()
with sess.as_default():
    print(result.eval())


3.0


下面代码也可以完成相同的功能

In [27]:
sess = tf.Session()

#下面两个命令有相同的功能
print(sess.run(result))

print(result.eval())


3.0


ValueError: Cannot evaluate tensor using `eval()`: No default session is registered. Use `with sess.as_default()` or pass an explicit session to `eval(session=sess)`

### 交互式环境下设置默认会话

在交互式环境下，Python脚本或者Jupyter编辑器下，通过设置默认会话来获取张量的取值更加方便

使用tf.InteractiveSession( ) 这个函数会自动将生成的会话注册为默认会话


In [30]:
node1 = tf.constant(1.0,tf.float32,name="node1")
node2 = tf.constant(2.0,tf.float32,name="node2")
result = tf.add(node1, node2)

sess = tf.InteractiveSession()
print(result.eval())
sess.close()


3.0


### 常量

In [31]:
a = tf.constant(1.0, name='a')
b = tf.constant(2.5, name='b')
c = tf.add(a, b, name='c')

with tf.Session() as sess:
    c_value=sess.run(c)
    print(c_value)

3.5


### 变量

在运行时值可以改变的参数

创建语句：

name_variable = tf.Variable(value, name)

注意V是大写字母

初始化语句：

个别变量初始化：

init_op = name_variable.initializer()

所有变量初始化：

init_op = tf.global_variables_initializer()


In [34]:
node1 = tf.Variable(1.0,tf.float32,name="node1")
node2 = tf.Variable(2.0,tf.float32,name="node2")
result = tf.add(node1, node2, name='add')

with tf.Session() as sess:
    #变量初始化
    init = tf.global_variables_initializer()
    sess.run(init)
    
    
    print(sess.run(result))

3.0


以上代码在Session对话变量后，增加了一个init初始化变量，并调用会话的run命令对参数进行初始化。

使用了Variable变量类型，不进行初始化数值会出现运行错误

### 变量赋值 assign

In [41]:
value = tf.Variable(0, name="value")
one = tf.constant(1)
new_value = tf.add(value, one)
update_value = tf.assign(value, new_value)

init = tf.global_variables_initializer()


        
with tf.Session() as sess:
    sess.run(init)
    print(sess.run(value))
    for i in range(10):
        sess.run(update_value)
        print(sess.run(value))

0
1
2
3
4
5
6
7
8
9
10


与传统编程语言不同，TensorFlow中的变量一般定义后，无须人工手动赋值，系统会根据算法模型自动调整变量的数值。后面在将机器学习模型训练时会更能体会，比如权重Weight变量w，经过多次迭代，会自动调整。

### 占位符

TensorFlow中的Variable变量类型，在定义时需要初始化，但有些变量定义时并不知道其数值，只有当真正开始运行程序时，才由外部输入，比如训练数据，这时候需要用到占位符

tf.placeholder占位符，是TensorFlow中特有的一种数据结构，类似动态变量，或者传统语言的“宏替换”符号；

TensorFlow占位符Placeholder，先定义一种数据，其参数为数据的type和shape，占位符Placeholder的函数接口如下：

tf.placeholder(dtype, shape=None, name=None)

In [43]:

x = tf.placeholder(tf.float32, [2,2],name='tx')

# 此代码生成一个2x2的二维矩阵，矩阵中每个元素的类型都是tf.float32，内部对应的符号名称是tx

### Feed提交数据和Fetch提取输出


In [44]:
a = tf.placeholder(tf.float32, name='ta')
b = tf.placeholder(tf.float32, name='tb')
c = tf.multiply(a, b, name='tc')

with tf.Session() as sess:
    result = sess.run(c, feed_dict={a:2.0, b:10.0})
    print(result)

20.0


In [45]:
a = tf.placeholder(tf.float32, name='ta')
b = tf.placeholder(tf.float32, name='tb')
c = tf.multiply(a, b, name='tc')
d = tf.subtract(a, b, name='td')

with tf.Session() as sess: 
    result = sess.run([c,d], feed_dict={a:[3,4], b:[1,2]})
    print(result)
    print(result[0])

[array([3., 8.], dtype=float32), array([2., 2.], dtype=float32)]
[3. 8.]


### 可视化 TesnorBoard

TensorBoard是TensorFlow的可视化工具

通过TensorFlow程序运行过程中输出的日志文件可视化TensorFlow程序的运行状态

TensorBoard和TensorFlow程序跑在不同的进程中


In [47]:
import tensorflow as tf

# logdir改为自己机器上的合适路径
logdir='./log'

#定义一个简单的计算图，实现向量加法的操作
input1 = tf.constant([1.0, 2.0, 3.0], name="input1")
input2 = tf.Variable(tf.random_uniform([3]), name="input2")
output = tf.add_n([input1, input2], name="add")

#生成一个写日志的writer，并将当前的TensorFlow计算图写入日志。
writer = tf.summary.FileWriter(logdir,tf.get_default_graph())
writer.close()
writer = tf.summary.FileWriter(logdir,tf.get_default_graph())

#### 启动TensorBoard

TensorBoard不需要额外安装，在TensorFlow安装时已自动完成

在Anaconda Prompt中运行TensorBoard，并将日志的地址指向程序日志输出的地址

命令：tensorboard --logdir=/path/log

启动服务的端口默认为6006；使用 --port 参数可以改编启动服务的端口


#### 访问TensorBoard

浏览器访问网址

http://localhost:6006
