我们知道，在TensorFlow中可以使用feed-dict的方式输入数据信息，但是这种方法的速度是最慢的，在实际应用中应该尽量避免这种方法。而使用输入管道就可以保证GPU在工作时无需等待新的数据输入，这才是正确的方法。
幸运的是，TensorFlow提供了一种内置的API——Dataset，使得我们可以很容易地就利用输入管道的方式输入数据。在这篇教程中，我们将介绍如何创建和使用输入管道以及如何高效地向模型输入数据。
原文链接：https://blog.csdn.net/dqcfkyqdxym3f8rb0/article/details/79342369

使用Dataset的三个步骤：
1. 载入数据：为数据创建一个Dataset实例
2. 创建一个迭代器：使用创建的数据集来构造一个Iterator实例以遍历数据集
3. 使用数据：使用创建的迭代器，我们可以从数据集中获取数据元素，从而输入到模型中去。

In [7]:
# 从numpy载入数据
import numpy as np
import tensorflow as tf
# create a random vector of shape (100,2)
x = np.random.sample((100, 2))
# make a dataset from a numpy array假设我们有一个numpy数组，我们想将它传递给TensorFlow
dataset = tf.data.Dataset.from_tensor_slices(x)

# 我们也可以传递多个numpy数组，最典型的例子是当数据被划分为特征和标签的时候
features, labels = (np.random.sample((100, 2)), np.random.sample((100, 1)))
dataset = tf.data.Dataset.from_tensor_slices((features, labels))


In [None]:
# 从tensors中载入数据
# 我们当然也可以用一些张量初始化数据集
dataset = tf.data.Dataset.from_tensor_slices(tf.random_uniform([100, 2]))

# 从placeholder中载入
# 如果我们想动态地改变Dataset中的数据，使用这种方式是很有用的。
x = tf.placeholder(tf.float32, shape=[None, 2])
dataset = tf.data.Dataset.from_tensor_slices(x)

# 从generator载入
# 我们也可以从generator中初始化一个Dataset。当一个数组中元素长度不相同时，使用这种方式处理是很有效的。（例如一个序列）
sequence = np.array([[1], [2, 3], [3, 4]])
def generator():
    for el in sequence:
        yield el
dataset = tf.data.Dataset.from_generator(generator, 
                                         output_types=tf.float32, 
                                         output_shapes=[2])

TypeError: Cannot convert <dtype: 'float32'> to Dimension