**資料集對象的建立**

tf.data 的核心是 tf.data.Dataset 類別，提供了對資料集的高層封裝。tf.data.Dataset 由一系列的可疊代訪問的元素（element）組成，每個元素包含一個或多個張量。比如說，對於一個由圖片組成的資料集，每個元素可以是一個形狀為 長×寬×通道數 的圖片張量，也可以是由圖片張量和圖片標籤張量組成的元組（Tuple）。

最基礎的建立 tf.data.Dataset 的方法是使用 tf.data.Dataset.from_tensor_slices() ，適用於資料量較小（能夠整個裝進內存）的情況。具體而言，如果我們的資料集中的所有元素通過張量的第 0 維，拼接成一個大的張量（例如，前節的 MNIST 資料集的訓練集即為一個 [60000, 28, 28, 1] 的張量，表示了 60000 張 28*28 的單通道灰階圖片），那麼我們提供一個這樣的張量或者第 0 維大小相同的多個張量作為輸入，即可按張量的第 0 維展開來建構資料集，資料集的元素數量為張量第 0 位的大小。具體範例如下：

In [None]:
import tensorflow as tf
import numpy as np

X = tf.constant([2013, 2014, 2015, 2016, 2017])
Y = tf.constant([12000, 14000, 15000, 16500, 17500])

# 也可以使用NumPy陣列，效果相同
# X = np.array([2013, 2014, 2015, 2016, 2017])
# Y = np.array([12000, 14000, 15000, 16500, 17500])

dataset = tf.data.Dataset.from_tensor_slices((X, Y))

for x, y in dataset:
    print(x, y)
    print(x.numpy(), y.numpy())

我們可以載入前章的 MNIST 資料集：

In [None]:
import matplotlib.pyplot as plt 

(train_data, train_label), (_, _) = tf.keras.datasets.mnist.load_data()
train_data = np.expand_dims(train_data.astype(np.float32) / 255.0, axis=-1)      # [60000, 28, 28, 1]
mnist_dataset = tf.data.Dataset.from_tensor_slices((train_data, train_label))

for image, label in mnist_dataset:
    plt.title(label.numpy())
    plt.imshow(image.numpy()[:, :, 0])
    plt.show()