本项目基于paddlepaddle框架复现了ENCNet语义分割模型,ENCNet提取出特征图中的类别信息,同时引出注意力机制损失(se_loss)来提升网络性能。
论文:
- [1] Hang Zhang, Kristin Dana, Jianping Shi, Zhongyue Zhang, Xiaogang Wang, Ambrish Tyagi, Amit Agrawal. Context Encoding for Semantic Segmentation
项目参考:
在CityScapes val数据集的测试效果如下表。
NetWork | steps | opt | image_size | batch_size | dataset | memory | card | mIou | config | weight | log |
---|---|---|---|---|---|---|---|---|---|---|---|
DMNet | 80K | SGD | 1024x512 | 8 | CityScapes | 32G | 4 | 78.70 | encnet_cityscapes_1024x512_80k.yml | link | log |
- 数据集大小:
- 训练集: 2975
- 验证集: 500
-
硬件: Tesla V100 * 4
-
框架:
- PaddlePaddle == 2.2.0
# clone this repo
git clone https://github.com/justld/ENCNet_paddle.git
cd ENCNet_paddle
安装第三方库
pip install -r requirements.txt
单卡训练:
python train.py --config configs/encnet_cityscapes_1024x512_80k.yml --do_eval --use_vdl --log_iter 100 --save_interval 1000 --save_dir output
多卡训练:
python -m paddle.distributed.launch train.py --config configs/encnet_cityscapes_1024x512_80k.yml --do_eval --use_vdl --log_iter 100 --save_interval 1000 --save_dir output
output目录下包含已经训练好的模型参数以及对应的日志文件。
python val.py --config configs/encnet_cityscapes_1024x512_80k.yml --model_path
在linux下,进入ENCNet_paddle文件夹,运行命令
bash test_tipc/prepare.sh ./test_tipc/configs/encnet_small/train_infer_python.txt 'lite_train_lite_infer'
bash test_tipc/test_train_inference_python.sh ./test_tipc/configs/encnet_small/train_infer_python.txt 'lite_train_lite_infer'
代码结构
├─configs
├─images
├─output
├─paddleseg
├─test_tipc
│ export.py
│ predict.py
│ README.md
│ README_CN.md
│ requirements.txt
│ setup.py
│ train.py
│ val.py
说明
1、本项目在Aistudio平台,使用Tesla V100 * 4 脚本任务训练80K miou达到78.70%。
2、本项目基于PaddleSeg开发。
相关信息:
信息 | 描述 |
---|---|
作者 | 郎督 |
日期 | 2021年11月 |
框架版本 | PaddlePaddle==2.2.0 |
应用场景 | 语义分割 |
硬件支持 | GPU、CPU |
在线体验 | notebook, Script |