# TF Variables （变量）
  
  
## tf.Variable是一个类（class)
 - 在run调用过程中， 变量维护图（graph）中的状态，可以创建一个Variable类的实例并增加到图中（graph)
 - Variable构造函数要求：变量的初始化值（任何type和shape的Tensor）, 在实例创建完成之后，Variable的type和shape固定不变，但变量的值可通过赋值方法修改
 - 常用于保存网络中需要学习的参数
 - 在使用变量值的操作中，必须先初始化变量
 - 变量初始化方法：
  -  sess.run(w.initializer)  # Run the variable initializer.
  - 初始化所有变量：使用global_variables_initializer()增加一个Op到图中
    

## tf.constant 与 tf.Variable的区别
 - tf.constant 是一个操作（op）
 - tf.Variable 是一个包含许多操作（ops)的类

## tf.Variable类构造函数 (tf.Variable)
__init__(
    initial_value=None,
    trainable=True,
    collections=None,
    validate_shape=True,
    caching_device=None,
    name=None,
    variable_def=None,
    dtype=None,
    expected_shape=None,
    import_scope=None,
    constraint=None
)

- 此构造函数把类实例（变量）增加到集合**GraphKeys.GLOBAL_VARIABLES** （可通过函数：global_variables() 获取）
- 若trainable=True, 变量也被增加到集合 **GraphKeys.TRAINABLE_VARIABLES** （可通过函数：trainable_variables() 获取）

## tf.Variable的常用操作（ops）
 - x = tf.Variable(...)
 - x.initializer　　　# init op
 - x.value()　　　　# read op
 - x.assign(...)　　　# write op
 - x.assign_add(...)　# and more
 

# tf.get_variable
tf.get_variable(
    name,
    shape=None,
    dtype=None,
    initializer=None,
    regularizer=None,
    trainable=True,
    collections=None,
    caching_device=None,
    partitioner=None,
    validate_shape=True,
    use_resource=None,
    custom_getter=None,
    constraint=None
)
 - 使用这些参数获取一个已经存在的变量或创建一个新的变量；
 - 可根据 name 值，返回该变量，如果该 name 不存在的话，则会进行创建；
 - 与tf.variable_scope()配合使用, 

# tf.Variable与tf.get_variable的区别
 - 都用于创建变量
 - tf.Variable() 每次调用都会创建新的变量，在变量名重复的时候不会报错，而是会自动创建新的变量，只是后缀加上 $_1, _2$ 类似的用以区别。通常 lr 或 global step 之类的辅助变量会使用它来创建。
 - tf.get_variable() 则主要用于网络的权值设置，它可以实现权值共享，在多 GPU 的并行计算的时候使用较多，其实通过 get 的前缀就可以很好看出它们的区别，它一定是和tf.variable_scope()共同使用的，不然二者就没有太大的区别了。
 - 如果在 tf.name_scope() 环境下分别使用 tf.get_variable() 和 tf.Variable()，两者的主要区别在于:
  - tf.get_variable() 创建的变量名不受 name_scope 的影响；
  - tf.get_variable() 创建的变量名受name_scope的影响，在同一个name_scope中，name 属性值不可以相同；tf.Variable() 创建变量时，name 属性值允许重复（底层实现时，会自动引入别名机制）
 - tf.get_variable() 与 tf.Variable() 相比，多了一个 initilizer （初始化子）可选参数； 
 - tf.Variable() 对应地多了一个 initial_value 关键字参数，也即对于 tf.Variable 创建变量的方式，必须显式初始化；

In [1]:
import tensorflow as tf

with tf.name_scope('a_name_scope1'):
    s = tf.get_variable('scalar', initializer=tf.constant(2))
    #s1 = tf.get_variable('scalar', initializer=tf.constant(3))
    m = tf.get_variable('matrix', initializer=tf.constant([[1,2,3],[4,5,6]]))
    w = tf.get_variable('big_matrix', shape=(784,10), initializer=tf.zeros_initializer())
    
    V1 = tf.Variable([1,2,3], name="V1")
    V2 = tf.Variable([4,5,6], name="V1")
    

with tf.Session() as sess:
    #sess.run(tf.global_variables_initializer())  # init all the variables at once
    sess.run(tf.variables_initializer([s,m]))  # init only a subset of variables
    print(s.name, sess.run(s))
    print(m.name, sess.run(m))
    #print(w.name, sess.run(w))
    sess.run(V1.initializer)
    sess.run(V2.initializer)
    print(V1.name, sess.run(V1))
    print(V2.name, sess.run(V2))
    
    

scalar:0 2
matrix:0 [[1 2 3]
 [4 5 6]]
a_name_scope1/V1:0 [1 2 3]
a_name_scope1/V1_1:0 [4 5 6]


In [5]:
import tensorflow as tf
W = tf.Variable(tf.truncated_normal([700, 10]))

with tf.Session() as sess:
    sess.run(W.initializer)
    print(W)
    #print(sess.run(W))
    print(W.name, W.eval())

<tf.Variable 'Variable_3:0' shape=(700, 10) dtype=float32_ref>
Variable_3:0 [[-0.43859518  0.2781226   1.319621   ...  1.0081005   0.182192
  -0.22677897]
 [-0.89711714  0.11727114 -1.5676941  ... -1.1863619  -0.90292066
  -0.18442577]
 [-1.4942753   0.19102633 -1.6815547  ...  0.32588097 -0.92992514
   0.09963764]
 ...
 [ 0.2552708   0.45992097  1.5574944  ... -0.10122806 -0.43588033
   0.40415704]
 [ 1.6478871  -0.64953315  0.33808044 ...  0.18847999  0.7887517
   0.8116403 ]
 [-1.620304   -1.4811673   1.4582502  ... -0.29823163  1.8483113
   0.04658151]]


## tf.Variable.assign() 是一个操作，必须在Session中被执行
 - 变量的Var.eval()操作类似sess.run(Var)

In [11]:
import tensorflow as tf
W = tf.Variable(10)
#W.assign(1000)  # create an assign op, the op needs to be executed in a session
assign_op = W.assign(1000)

var = tf.Variable(2, name='var')
var_times_two = var.assign(3 * var)

with tf.Session() as sess:
    sess.run(W.initializer)
    sess.run(assign_op)
    print(W.name, W.eval())
    
    sess.run(var.initializer)
    sess.run(var_times_two)
    print(var.name, var.eval())　　#　var.eval()类似sess.run(var)
    
    sess.run(var_times_two)
    print(var.name, var.eval())
    

Variable_9:0 1000
var_1:0 6
var_1:0 18


## tf.Variable.assign_add和tf.Variable.assign_sub


In [13]:
import tensorflow as tf
var = tf.Variable(10)

with tf.Session() as sess:
    sess.run(var.initializer)
    print(sess.run(var.assign_add(5)))
    print(sess.run(var.assign_sub(6)))
    

15
9


## 每个Session维护自己的变量copy
 - Session类似Linux中的进程

In [15]:
import tensorflow as tf
var = tf.Variable(10)

with tf.Session() as sess:
    sess.run(var.initializer)
    print('First:')
    print(sess.run(var.assign_add(5)))
    print(sess.run(var.assign_sub(6)))
    
with tf.Session() as sess:
    sess.run(var.initializer)
    print('Second')
    print(sess.run(var.assign_add(10)))
    print(sess.run(var.assign_sub(5)))   
    

First:
15
9
Second
20
15


# TF程序由两个阶段组成
 1）组装一个图（Assemble a graph）  
 2）使用Session执行图中的操作（Node）
 - 因为在定义计算时无法提供用于计算的数据，则可使用tf.placeholder
 - **tf.placeholder(dtype, shape=None, name=None)**
 - **placeholder是 一 个有效的操作（在图中的一个Node）**
 - shape: 列表[]中一个数字，表示一个向量，向量元素为列表中的数字；2个数字表示一个矩阵，前面的表示行数，后面的表示列数；3个数字表示三维数组
 - shape=None: 表示它可接受任何shape的tensor作为placeholder的输入值，但是也为调试带来了困难
 - 可以feed_dict任何可以传入的tensor, 判断tensor是否可传入的方式：
  **tf.Graph.is_feedable(tensor)**
 - placeholder：表明必须被传入数据
 

In [4]:
import tensorflow as tf
# create a placeholder for a vector with 3 elements, type tf.float32
a = tf.placeholder(tf.float32, shape=[3])
b = tf.constant([3,2,1], tf.float32)
c = a + b  # short for tf.add(a,b)

with tf.Session() as sess:
#     print(sess.run(c, feed_dict={a:[4,5,6]}))  # the tensor a is the key, not the string 'a'
    print(sess.run(c, {a:[4,5,10]}))  # the tensor a is the key, not the string 'a'
    

[ 7.  7. 11.]


## 把值传入TF操作
 - 在测试一个大的Graph的一部分子图时，通过传入默认值很有用

In [13]:
import tensorflow as tf
# create operations, tensor, etc
a = tf.add(2, 5)
b = tf.multiply(a, 5)

with tf.Session() as sess:
    # compute the value of b given a is 15
    print(sess.run(b, feed_dict={a:30}))

150


# Normal Loading vs. Lazy Loading
 - Normal Loading: 在Session外创建或初始化对象，在Graph中只有一个Node
 - Lazy Loading: 在Session内创建或初始化对象，在Graph中执行一次就创建一个Node，执行多次就有多个Node

In [6]:
import tensorflow as tf
# normal loading
x = tf.Variable(10, name='x')
y = tf.Variable(15, name='y')
z = tf.add(x,y)

writer = tf.summary.FileWriter('/home/ai/work/log/graphs/', tf.get_default_graph())
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for var in range(10):
        print(sess.run(z))
writer.close()


25
25
25
25
25
25
25
25
25
25


In [8]:
import tensorflow as tf
# lazy loading
x = tf.Variable(10, name='x')
y = tf.Variable(15, name='y')
#z = tf.add(x,y)

writer = tf.summary.FileWriter('/home/ai/work/log/graphs', tf.get_default_graph())
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for var in range(10):
        print(sess.run(tf.add(x,y)))
writer.close()

25
25
25
25
25
25
25
25
25
25


## tf.constant 和tf.Variable
 - 常量值被存储在图定义中
 - Session分配内存存储变量的值

In [12]:
import tensorflow as tf
x = 2
y = 8
add_op = tf.add(x,y,name='add_op')
mul_op = tf.multiply(x,y,name='add_op')
useless = tf.multiply(x, add_op, name='useless')
pow_op = tf.pow(add_op, mul_op, name='power_op')
writer = tf.summary.FileWriter('/home/ai/work/log/graphs', tf.get_default_graph())

with tf.Session() as sess:
    z = sess.run(pow_op)
    print(z)

writer.close()

1874919424


In [1]:
import tensorflow as tf
a = tf.constant([1, 2, 3, 4, 5], name='a')
print(a)
print(id(a))  # id()获取Tensor的地址

Tensor("a:0", shape=(5,), dtype=int32)
140208805686128
