In [1]:
import tensorflow as tf
import numpy as np

# TensorFlow的基本概念

TF中主要有如下三个部分：  
+ 张量——数据模型  
张量也就是多维数组，用于表示数据
+ 计算图——计算模型  
计算图是整个计算过程的表示，图中的节点表示运算操作，边表示运算操作之间的依赖关系
+ 会话——运行模型  
计算图中定义的每个运算操作必须在会话中执行

TensorFlow计算图表示如下含义：  
+ 每一个节点表示一个计算，或者说操作(operation)
+ 节点之间的边描述了计算之间的依赖关系。

<img src="images/f1.png" width="40%" align="left">

上述的图定义的是如下的运算：  
$add = a + b$   
对应的TF实现如下

In [14]:
a = tf.constant(1)
b = tf.constant(2)
add = tf.add(a,b)
print(a)
print(add)

Tensor("Const_12:0", shape=(), dtype=int32)
Tensor("Add_8:0", shape=(), dtype=int32)


上述定义的add是表示加法的这个操作，实际上，a和b也是表示操作——对应于常量赋值这个操作，这就是每个节点是一个计算的含义。 

节点a和b经过相加后得到节点add，这就是一个依赖关系。

因为是定义的计算节点，所以打印出的结果并不是实际的值。**要想打印出计算节点对应的值，必须要开启一个会话，在会话中进行图的计算**

In [17]:
# 使用tf.Session()创建一个会话
with tf.Session() as sess:
    # 使用 session.run()方法实际执行图中的计算节点，传入的参数是某个节点，返回的是该计算节点对应的值
    print(sess.run(a))
    print(sess.run(b))
    print(sess.run(add))

1
2
3


+ 以下是一个矩阵乘法的例子

In [4]:
# 定义两个常量赋值操作
a = tf.constant([ [3,3] ])
b = tf.constant([ [2], [3] ])

# 定义一个矩阵乘法操作
prod = tf.matmul(a, b)
print(prod)

Tensor("MatMul:0", shape=(1, 1), dtype=int32)


In [16]:
# 使用会话来运行上述定义的运算
with tf.Session() as sess:
    # 调用sess.run()方法来执行上述定义的运算
    result = sess.run(prod)
    print(result.__class__,"\n",result)

<class 'numpy.ndarray'> 
 [[15]]


+ 变量的使用

In [13]:
# 定义一个变量并初始化为0的操作
state = tf.Variable(0, name="state")
# 定义一个运算，使var每次加1
new_value = tf.add(state, 1)
# 定义赋值操作
update = tf.assign(state, new_value)
# 定义变量初始化操作
init = tf.global_variables_initializer()

# 创建会话运行上述定义的操作
with tf.Session() as sess:
    # 执行变量的初始化操作
    sess.run(init)
    print(sess.run(state))
    for _ in range(5):
        sess.run(update)
        print(sess.run(state))

0
1
2
3
4
5


+ Fetch和Feed  
Fetch是指一个session中运行多个operation。 
Feed是指以字典的形式传入多个数据。  

上述两个概念都是`Session.run()`方法的参数，可以查阅该函数的帮助文档

+ 简单使用案例

In [3]:
# 构造100个数据点
x_data = np.random.rand(100)
y_data = x_data * 0.1 + 0.2

#构造一个带训练的线性模型
a = tf.Variable(0.)
b = tf.Variable(0.)
y = a * x_data + b

# 二次代价函数
loss = tf.reduce_mean(tf.square(y - y_data))

# 定义优化器
optimizer = tf.train.GradientDescentOptimizer(0.2)

#最小化代价函数
train = optimizer.minimize(loss)

# 初始化变量
init = tf.global_variables_initializer()

# 构建session
with tf.Session() as sess:
    sess.run(init)
    for step in range(201):
        sess.run(train)
        if step%20 == 0:
            print(step, sess.run([a, b]))

0 [0.04929078, 0.098659955]
20 [0.099961706, 0.20001897]
40 [0.09997764, 0.20001116]
60 [0.099986926, 0.20000653]
80 [0.09999237, 0.20000382]
100 [0.09999553, 0.20000224]
120 [0.09999739, 0.20000131]
140 [0.09999846, 0.20000076]
160 [0.099999085, 0.20000045]
180 [0.099999465, 0.20000027]
200 [0.09999967, 0.20000017]
