#### 队列
1. 队列和变量类似，都是计算图上的有状态节点，其它计算节点可以修改它的状态；    
   对于变量可以通过赋值操作来修改变量的取值；    
   对于队列，则要通过Enqueue，EnqueueMany和Dequeue    
1. Tensorflow主要提供了FIFOQueue和RandomShuffleQueue两种队列    
   后面看文档，还有很多：    
   tf.PaddingFIFOQueue 以固定长度批量出列的队列    
   tf.PriorityQueue 带优先级出列的队列
1. 入列超过Queue Size的数据，enqueue操作会阻塞，直到有数据（被其他线程）从队列取出。    
   对一个已经取空的队列使用dequeue操作也会阻塞，直到有新的数据（从其他线程）写入    
   
> Dataset处理框架比队列更加易用和高效

#### 1. 创建队列，并操作里面的元素。

In [10]:
import tensorflow as tf

q = tf.FIFOQueue(2, "int32")
init = q.enqueue_many(([0, 10],))
x = q.dequeue()
y = x + 1
q_inc = q.enqueue([y])
with tf.Session() as sess:
    init.run()
    for _ in range(5):
        v, inc = sess.run([x, q_inc])
        print("result={",v,inc,"}")

result={ 0 None }
result={ 10 None }
result={ 1 None }
result={ 11 None }
result={ 2 None }


In [None]:
import tensorflow as tf
s = tf.InteractiveSession()

q = tf.FIFOQueue(2, "float")
init = q.enqueue_many(([0,0],))

x = q.dequeue()
y = x+1
q_inc = q.enqueue([y])

init.run()
#queue: 0,0
q_inc.run()
#queue: 0,1
q_inc.run()
#queue: 1,1
q_inc.run()
#queue: 1,2
print("start")
print(x.eval() ) # 返回1
print(x.eval() ) # 返回2
#x.eval()  # 阻塞

tf.InteractiveSession.close(s)

### 多线程输入数据处理框架
    Tensorflow 提供了tf.coordinator和tf.QueueRunner两个类来完成多线程协同的功能
### tf.Coordinator    
```
    coord   = tf.train.Coordinator()
    threads = [threading.Thread(target=MyLoop, args=(coord,i,)) for i in xrange (5)]
    fort in threads: t.start()
    coord.join(threads)  
```

### tf.QueueRunner  
>tf.QueueRunner 用于启动多个线程来操作同一个队列，可以通过tf.Coordinator来统一管理；
>主要用于协同多个线程一起停止，提供should_stop,request_stop和join三个函数；    
```
    queue = tf.FIFOQueue(100,"float")    
    enqueue_op = queue.enqueue([tf.random_normal([1])])   
```
> 通过QueueRunner来创建多个线程来运行队列的入队操作    
> [enqueue_op] * 5表示启动5个线程，线程运行enqueue_op操作      

```
    qr = tf.train.QueueRunner(queue, [enqueue_op] * 5)    
```

>通过add_queue_runner将定义过的QueueRunner加入计算图上指定集合    
>默认加入: tf.GraphKey.QUEUE_RUNNERS    

```
    tf.train.add_queue_runner(qr)
```

>当调用出队操作时，程序会一直等待入队操作被运行    
>通过tf.train.start_queue_runners来启动所有线程,        
>*该函数会默认启动tf.GraphKey.QUEUE_RUNNERS集合中所有的QueueRunner*

```
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
```

> 看下面例子qr.create_threads(sess, start=True)貌似也可以启动线程，执行入队操作    
  而且还可以干些其它操作：enqueue_ops=[increment_op, enqueue_op]，一个计数，一个入队；     
  第一种，显式的创建QueueRunner，然后调用它的create_threads方法启动线程。    
  第二种，使用全局的start_queue_runners方法启动线程 
  
> tf.train.string_input_produecer会将一个隐含的QueueRunner添加到全局图中        
 （类似的操作还有tf.train.shuffle_batch等）    
  由于没有显式地返回QueueRunner来用create_threads启动线程，这里使用了       
  tf.train.start_queue_runners方法直接启动tf.GraphKeys.QUEUE_RUNNERS    
  集合中的所有队列线程。        

####     tf.Coordinator 例子
       这个程序每隔1秒判断是否需要停止并打印自己的ID。
       创建、启动并退出线程。

In [15]:
import tensorflow as tf
import numpy as np
import threading
import time

def MyLoop(coord, worker_id):
    while not coord.should_stop():
        if np.random.rand()<0.1:
            print ("Stoping from id: %d\n" % worker_id, coord.request_stop())
        else:
            print ("Working on id: %d\n" % worker_id,  time.sleep(1))
            
coord = tf.train.Coordinator()
threads = [threading.Thread(target=MyLoop, args=(coord, i, )) for i in range(5)]
for t in threads:t.start()
coord.join(threads)

##### tf.QueueRunner例子
    定义队列及其操作。
    启动线程。

In [19]:
import tensorflow as tf

queue = tf.FIFOQueue(100,"float")
enqueue_op = queue.enqueue([tf.random_normal([1])])
qr = tf.train.QueueRunner(queue, [enqueue_op] * 1)
tf.train.add_queue_runner(qr)
out_tensor = queue.dequeue()

with tf.Session() as sess:
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    #coord.request_stop()
    #OutOfRangeError: FIFOQueue '_3_fifo_queue' is closed and has insufficient elements (requested 1, current size 0)
    for _ in range(7): print(sess.run(out_tensor)[0])
    coord.request_stop()
    coord.join(threads)

-1.9845314
-1.3450793
-0.30068743
-0.22051239
-0.5759071
0.15754099
-1.6470085


In [1]:
import tensorflow as tf  
import sys  
q = tf.FIFOQueue(10, "float")  
counter = tf.Variable(0.0)  #计数器
# 给计数器加一
increment_op = tf.assign_add(counter, 1.0)
# 将计数器加入队列
enqueue_op = q.enqueue(counter)

# 创建QueueRunner
# 用多个线程向队列添加数据
# 这里实际创建了4个线程，两个增加计数，两个执行入队
qr = tf.train.QueueRunner(q, enqueue_ops=[increment_op, enqueue_op] * 2)

# 主线程
sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
# 启动入队线程
qr.create_threads(sess, start=True)
for i in range(20):
    print (sess.run(q.dequeue()))

Instructions for updating:
To construct input pipelines, use the `tf.data` module.
1.0
3.0
3.0
5.0
6.0
6.0
8.0
10.0
10.0
11.0
13.0
13.0
15.0
23.0
38.0
54.0
69.0
85.0
102.0
113.0


In [9]:
import tensorflow as tf
import numpy as np

# 1000个4维输入向量，每个数取值为1-10之间的随机数
data = 10 * np.random.randn(1000, 4) + 1

# 1000个随机的目标值，值为0或1
target = np.random.randint(0, 2, size=1000)
print(type(target),len(target))
# 创建Queue，队列中每一项包含一个输入数据和相应的目标值
queue = tf.FIFOQueue(capacity=50, dtypes=[tf.float32, tf.int32], shapes=[[4], []])

# 批量入列数据（这是一个Operation）
enqueue_op = queue.enqueue_many([data, target])
# 出列数据（这是一个Tensor定义）
data_sample, label_sample = queue.dequeue()

# 创建包含4个线程的QueueRunner
qr = tf.train.QueueRunner(queue, [enqueue_op] * 4)

with tf.Session() as sess:
    # 创建Coordinator
    coord = tf.train.Coordinator()
    # 启动QueueRunner管理的线程
    enqueue_threads = qr.create_threads(sess, coord=coord, start=True)
    # 主线程，消费100个数据
    for step in range(100):
        if coord.should_stop():
            print("stop at:",step )
            break
        data_batch, label_batch = sess.run([data_sample, label_sample])
        if step % 10 == 0:
            print("data_batch",data_batch,label_batch)
        
    # 主线程计算完成，停止所有采集数据的进程
    coord.request_stop()
    coord.join(enqueue_threads)


<class 'numpy.ndarray'> 1000
data_batch [15.115156   5.6821494 -2.903629  10.217741 ] 0
data_batch [ 2.5738194 12.917025  -0.7074584 12.723311 ] 1
data_batch [-4.300045   1.5434257 23.04318   -9.072009 ] 0
data_batch [  9.537529   -12.222232    -0.96428925   3.1091497 ] 1
data_batch [ 0.35485595 -3.2539256  12.915486   -4.2451897 ] 1
data_batch [-3.5407958  4.8119445 -1.5941198 13.874815 ] 0
data_batch [-1.2610637 29.647507  -3.3941422  8.937757 ] 1
data_batch [6.488802  8.545857  7.8399205 1.5252098] 1
data_batch [-7.462132   8.844004   1.2375625 20.538057 ] 1
data_batch [12.926416    5.236176   -0.30591613 -3.0188367 ] 0


In [None]:
import tensorflow as tf

# 同时打开多个文件，显示创建Queue，同时隐含了QueueRunner的创建
filename_queue = tf.train.string_input_producer(["data1.csv","data2.csv"])
reader = tf.TextLineReader(skip_header_lines=1)
# Tensorflow的Reader对象可以直接接受一个Queue作为输入
key, value = reader.read(filename_queue)

with tf.Session() as sess:
    coord = tf.train.Coordinator()
    # 启动计算图中所有的队列线程
    threads = tf.train.start_queue_runners(coord=coord)
    # 主线程，消费100个数据
    for _ in range(100):
        features, labels = sess.run([data_batch, label_batch])
    # 主线程计算完成，停止所有采集数据的进程
    coord.request_stop()
    coord.join(threads)