Skip to content

Latest commit

 

History

History
25 lines (16 loc) · 858 Bytes

random_split_cn.rst

File metadata and controls

25 lines (16 loc) · 858 Bytes

random_split

给定子集合 dataset 的长度数组,随机切分出原数据集合的非重复子集合。

参数

  • dataset (Dataset) - 此参数必须是 paddle.io.Datasetpaddle.io.IterableDataset 的一个子类实例或实现了 __len__ 的 Python 对象,用于生成样本下标。默认值为 None。
  • lengths (list) - 总和为原数组长度的,子集合长度数组。
  • generator (Generator,可选) - 指定采样 data_source 的采样器。默认值为 None。

返回

list,返回按给定长度数组描述随机分割的原数据集合的非重复子集合。

代码示例

COPY-FROM: paddle.io.random_split