# tensorflow使用一些总结

## 2018-4-3 

## (1)问题
- 将tf.random_normal传入给tf.constant发生错误,**TypeError: List of Tensors when single Tensor expected**

In [4]:
import tensorflow as tf
# a = tf.constant(tf.random_normal([2, 2]))     运行该代码出现错误
# print(a)

## (2)出现问题原因
[参考文章](https://stackoverflow.com/questions/35661677/tensorflow-generating-a-random-constant/35662013#35662013)

#### 1 首先查看tf.random_normal函数定义:

`def random_normal(shape,
                  mean=0.0,
                  stddev=1.0,
                  dtype=dtypes.float32,
                  seed=None,
                  name=None):
`
- Returns: A tensor of the specified shape filled with random normal values.

#### 2 查看tf.constant函数定义:
` def constant(value, dtype=None, shape=None, name="Const", verify_shape=False) `
- value:          **A constant value (or list)** of output type \`dtype\`.
- Returns: A Constant Tensor.

**结论:** 因为tf.random_normal返回值是一个Tensor,但是tf.constat传入的形参是list二者类型是不匹配的,所以出现错误

## (3)解决

### 方法1:
####  Use NumPy to generate the random value and put it in a tf.constant()<br/>
`
some_test = tf.constant(
    np.random.normal(loc=0.0, scale=1.0, size=(2, 2)).astype(np.float32))
`
### 方法2:
#### (Potentially faster, as it can use the GPU to generate the random numbers) Use TensorFlow to generate the random value and put it in a tf.Variable:
`
some_test = tf.Variable(
    tf.random_normal([2, 2], mean=0.0, stddev=1.0, dtype=tf.float32)
sess.run(some_test.initializer) 
`

#### 查看tf.Variable函数定义:
`
def __init__(self,
               initial_value=None,
               trainable=True,
               collections=None,
               validate_shape=True,
               caching_device=None,
               name=None,
               variable_def=None,
               dtype=None,
               expected_shape=None,
               import_scope=None,
               constraint=None):
               ...
               )
`
- args: initial_value: A \`Tensor\`, or Python object convertible to a \`Tensor\`,which is the initial value for the Variable.


## 2018-4-11 tensorflow一些常见库函数使用

### 1. tf.nn.moments返回数据的均值和方差
`
tf.nn.moments(x, axes, shift=None, name=None, keep_dims=False)
`

- x是输入张量
- axes是在哪个维度上求解， 即想要 normalize的维度, [0] 代表 batch 维度，如果是图像数据，可以传入 [0, 1, 2]，相当于求[batch, height, width] 的均值/方差，注意不要加入channel 维度。
- name: Name used to scope the operations that compute the moments.
- keep_dims: produce moments with the same dimensionality as the input.
- return: 该函数返回两个张量，均值mean和方差variance。

In [18]:
import tensorflow as tf
import numpy as np
#batch = np.array(np.random.randint(1, 100,size=(5,5))) 一开始错误没有进行类型转换出现data type not understood,表示moments处理的数据需要是tf.float32类型的
batch = np.array(np.random.randint(1, 100, size=(10, 5)))
batch = tf.cast(batch, tf.float32)  # 如果直接在np使用dtype=np.float32类型转换的时候,还是会出现data type not understand错误,因此我们使用tf.cast进行强制类型转换
#print(batch)
mm, vv = tf.nn.moments(batch, axes=[0])
with tf.Session() as sess:
    print(sess.run(mm))


[ 38.20000076  47.79999924  60.59999847  50.09999847  35.09999847]


### 2. tf.train.ExponentialMovingAverage(decay)

- Some training algorithms, such as GradientDescent and Momentum often benefit from maintaining a moving average of variables during optimization. Using the moving averages for evaluations often improve results significantly. 
 tensorflow 
- 官网上对于这个方法功能的介绍。GradientDescent 和 Momentum 方式的训练 都能够从 ExponentialMovingAverage 方法中获益。

 
 
$$shadowVariable = decay * shadowVariable + (1 - decay) * variable $$
 
 - 一般取decay=0.999或者0.9999

In [19]:
import tensorflow as tf
w = tf.Variable(1.0)
ema = tf.train.ExponentialMovingAverage(0.9)
update = tf.assign_add(w, 1.0)

with tf.control_dependencies([update]):
    #返回一个op,这个op用来更新moving_average,i.e. shadow value
    ema_op = ema.apply([w])#这句和下面那句不能调换顺序
# 以 w 当作 key， 获取 shadow value 的值
ema_val = ema.average(w)#参数不能是list，有点蛋疼

with tf.Session() as sess:
    tf.global_variables_initializer().run()
    for i in range(3):
        sess.run(ema_op)
        print(sess.run(ema_val))

1.1
1.29
1.561


###  3.  tf.tf.assign(ref, value, validate_shape=None, use_locking=None, name=None)

- 将　value 赋值给　ref，并输出 ref，即  **ref = value**；

- 这使得需要使用复位值的连续操作变简单

- return: Same as “ref”. Returned as a convenience for operations that want to use the new value after the variable has been reset.

In [30]:
import tensorflow as tf
a = tf.Variable(tf.constant(1.0), dtype=tf.float32)
b = tf.assign(a,2.0)  # assign可以用于分配数值
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(b))

2.0


### 4 tf.assign_add(ref,value,use_locking=None,name=None)

- Update 'ref' by adding 'value' to it.

- 更新ref的值，通过增加value，即：ref = ref + value；

- This operation outputs "ref" after the update is done. This makes it easier to chain operations that need to use the reset value.

In [34]:
import tensorflow as tf
a = tf.Variable(tf.constant(1.0), dtype=tf.float32)
a = tf.assign_add(a,2.0)  # assign可以用于分配数值
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(a))

3.0


### 5 tf.identity(input,name=None)

- Return a tensor with the same shape and contents as input.返回一个具有相同形状张量和内容作为输入；

- Args:
 input: A Tensor.
 name: A name for the operation (optional).

- Returns:
 A Tensor. Has the same type as input.

### 6 tf.control_dependencies(control_inputs)
- tf.control_dependencies()设计是用来控制计算流图的，给图中的某些计算指定顺序。比如：我们想要获取参数更新后的值，那么我们可以这么组织我们的代码。自己的理解：如果不是tf的tensor，并且没有加入到整个图中，则不会执行；

- Wrapper for Graph.control_dependencies() using the default graph.



### 测试代码1

In [45]:
x = tf.Variable(0.0)
#返回一个op，表示给变量x加1的操作
x_plus_1 = tf.assign_add(x, 1)
  
#control_dependencies的意义是，在执行with包含的内容（在这里就是 y = x）前
#先执行control_dependencies中的内容（在这里就是 x_plus_1）
with tf.control_dependencies([x_plus_1]):  # 表明并没有执行x_plus_1这个操作,y仅仅是x复制都是0
    y = x + 0.0
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for i in range(5):
        print(sess.run(y))

1.0
2.0
3.0
4.0
5.0


### 测试代码2

In [46]:
import tensorflow as tf
x = tf.Variable(0.0)
print(x)  # 一开始x仅仅是一个变量
x_plus_1 = tf.assign_add(x, 1)
with tf.control_dependencies([x_plus_1]):
    y = x + 0.0  # 这个时候变成立一个node?就可以执行了?
    print(y) #z=tf.identity(x,name='x')
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for i in range(5):
        print(sess.run(y))

# 可以看到当y定义为节点的输出后，就可以顺利执行操作了，此时y成为节点的输出，可以被图识别。

<tf.Variable 'Variable_21:0' shape=() dtype=float32_ref>
Tensor("add_1:0", shape=(), dtype=float32)
1.0
2.0
3.0
4.0
5.0


### 测试代码3

In [47]:
x = tf.Variable(0.0)
x_plus_1 = tf.assign_add(x, 1)
  
with tf.control_dependencies([x_plus_1]):
    y = tf.identity(x)#修改部分
init = tf.initialize_all_variables()
  
with tf.Session() as session:
    init.run()
    for i in range(5):
        print(y.eval())
        
# 查询y为：Tensor("Identity_1:0", shape=(), dtype=float32)，和节点联系起来了。
#tf.identity是返回了一个一模一样新的tensor，再control_dependencies的作用块下，需要增加一个新节点到gragh中。

1.0
2.0
3.0
4.0
5.0


### 解释:
- 从上面的三个小小的测试我们可以知道,tensorflow下的control_dependencies函数中包含的语句必须是一个op或者说是一种操作,而不能是tensor,所以,一开始的话我们使用y=x相当于是tensor变量,并没有执行x_puls_1语句,从而进一步导致输出的y全是0,第二个测试y=x+0.0表示是一种op,是可以正确执行的;第三种比较通用,y=tf.identity(x)其中identity返回的是和x一样的变量但是他是一个op,因此是可以执行x_plus_1语句的,进而y值更新了,输出正确的结果了.

### 7   在TensorFlow中，Session.run()和Tensor.eval()有什么区别？

#### 7.1 如果你有一个Tensor t, 调用t.eval()相当于调用了tf.get_default_session().run(t)

In [50]:
# 可以按照一下方式设置成默认会话:
import tensorflow as tf
t = tf.constant(42)
sess = tf.Session()
with sess.as_default():
    assert sess is tf.get_default_session()  # 结果证明二者等价
    assert t.eval() == sess.run(t)  # 结果证明二者也是等价的

#### 7.2 另外一点sess.run是可以在相同的步骤输出多个值

In [62]:
import tensorflow as tf
t = tf.constant(42.0)
u = tf.constant(12.0)
tu = tf.multiply(t, u)
ut = tf.multiply(u, t)
# sess = tf.Session()
with tf.Session() as sess:
    print(tu.eval())
    print(ut.eval())
    print(sess.run([tu, ut]))   # sess.run(?) 可以一次性输出多个值

504.0
504.0
[504.0, 504.0]


### 8 如何正确理解关键字"with"与上下文管理器
[参考文章](https://foofish.net/with-and-context-manager.html)

#### 自己一些理解:

- 一般在文件中我们打开一个文件,然后对文件进行处理最后把他关闭,极端情况之下出现打开文件过多的情况; 当我们在链接数据库的时候,如果我们链接的
 数据之后没有断开,极端的情况下出现链接数据库过多的情况,这个时候我们也是需要断开数据库的. 也就是我们在使用某些资源之后,可能需要**断开资源**
 
- 那么with可以帮助我们断开这种链接,相当于是**try/finally** 语句,本质上是由于上下文管理器的原因.

- 任何实现了 __enter__() 和 __exit__() 方法的对象都可称之为上下文管理器，上下文管理器对象可以使用 with 关键字。显然，文件（file）对象也实现了上下文管理器。此外，Python 还提供了一个 contextmanager 装饰器，更进一步简化上下管理器的实现方式。

### 9  tf.InteractiveSession()与tf.Session()的区别
[参考文章](https://blog.csdn.net/yeqiang19910412/article/details/78651849)

* tf.InteractiveSession():它能让你在运行图的时候，插入一些计算图，这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利，比如使用IPython。

* tf.Session():需要在启动session之前构建整个计算图，然后启动该计算图。

* 意思就是在我们使用tf.InteractiveSession()来构建会话的时候，我们可以先构建一个session然后再定义操作（operation），如果我们使用tf.Session()来构建会话我们需要在会话构建之前定义好全部的操作（operation）然后再构建会话。

