In [2]:
"""一個Dataset 對象包含多個元素，每個元素的結構都相同。
每個元素包含一個或多個tf.Tensor 對象，這些對像被稱為組件。
每個組件都有tf.DType 屬性，表示Tensor 中元素的類型；以及tf.TensorShape 屬性
，表示每個元素（可能部分指定）的靜態形狀。您可以通過Dataset.output_types 和
Dataset.output_shapes 屬性檢查數據集元素各個組件的類型和形狀。Dataset 的屬性由構成該Dataset 的元素的屬性映射得到
，元素可以是單個張量、張量元組，也可以是張量的嵌套元組。例如："""
import tensorflow as tf
import numpy as np

In [3]:
#單個張量
"""tf.random.uniform(
    shape,
    minval=0,
    maxval=None,
    dtype=tf.dtypes.float32,
    seed=None,
    name=None
ARGS：
shape：1-D整數Tensor或Python數組。輸出張量的形狀。
minval：類型的0-D Tensor或Python值dtype。要生成的隨機值範圍的下限。默認為0。
maxval：類型的0-D Tensor或Python值dtype。要生成的隨機值範圍的上限。如果dtype是浮點，則默認為1 。
dtype：類型輸出的：float16，float32，float64，int32，或int64。
seed：一個Python整數。用於為分發創建隨機種子。可看tf.set_random_seed 。
name：操作的名稱（可選）。
)"""
dataset1 = tf.data.Dataset.from_tensor_slices(tf.random.uniform([4,10]))
print(dataset1.output_types)
print(dataset1.output_shapes)

<dtype: 'float32'>
(10,)


In [4]:
#張量元組(張量,張量)
dataset2 = tf.data.Dataset.from_tensor_slices((tf.random.uniform([4]),
                                              tf.random.uniform([4,100],maxval=100,dtype=tf.int32)))
print(dataset2.output_types)
print(dataset2.output_shapes)

(tf.float32, tf.int32)
(TensorShape([]), TensorShape([Dimension(100)]))


In [6]:
#元組嵌套(元組,元組)
dataset3 = tf.data.Dataset.zip((dataset1,dataset2))
print(dataset3.output_types)
print(dataset3.output_shapes)

(tf.float32, (tf.float32, tf.int32))
(TensorShape([Dimension(10)]), (TensorShape([]), TensorShape([Dimension(100)])))


In [10]:
#Dataset中的元素的各個組件命名通常會帶來便利性（例如，元素的各個組件表示不同特徵時）。
# 除了元組之外，還可以使用命名元組（collections.namedtuple）或字典來表示Dataset的單個元素
dataset4 = tf.data.Dataset.from_tensor_slices(
    {"a":tf.random.uniform([4]),
     "b":tf.random.uniform([4,100], maxval = 100,dtype= tf.int32)})
print(dataset4.output_types)
print(dataset4.output_shapes)




{'a': tf.float32, 'b': tf.int32}
{'a': TensorShape([]), 'b': TensorShape([Dimension(100)])}
{'a': <class 'tensorflow.python.framework.ops.Tensor'>, 'b': <class 'tensorflow.python.framework.ops.Tensor'>}
