Skip to content

自定义数据集

Mr.Li edited this page Jun 21, 2022 · 11 revisions

分类任务

一.原始目录结构

假设图像根路径为/home/xxx/CatDog/ ,格式如下

├── cat
    ├── cat_x.jpg
    ├── cat_y.jpg
    ├── ....
├── dog
    ├── dog_x.jpg
    ├── dog_y.jpg
    ├── ....

二.划分数据集

默认Config/下生成dataset.txt。

python  ./ExtraTools/build_dataset.py  --ImgsPath=/home/xxx/CatDog/ 
- ImgsPath    数据集根路径
- Ratio       训练集:验证集:测试集的各类别划分比例,默认"0.7,0.1,0.2"
- Verify      验证图像完整性(耗时,可选)
- TxtPath     保存路径

三. 训练格式

dataset.txt 格式为[类型,类别名,图像路径]

train, dog,  /xxxx/img1.jpg
val,   cat,  /xxxx/img2.jpg
test,  cat,  /xxxx/img3.jpg