GitHub - bitcjm/MLDA-Net-repo: MLDA-Net-repo

中文

MLDA-Net深度估计模型

1、简介

该模型的目标生成具有更完整边界和丰富深度细节的深度图。详情可以参考论文原文。

该模型的总体结构如上图所示。最左边一列为多个不同尺度的输入数据，该尺度为可选参数scales。输入数据过两路卷积网络来提取特征，接着用注意网络GA进行整合并进一步提取特征。这部分就是该模型的第一个网络结构，在代码中名为models["encoder"]。

在提取特征后，该模型就进入第二个网络结构models["depth"]，即为上图右侧一半结构。该网络主要基于两种注意力块进行特征提取和上采样，最终输出不同尺度输入图所对应的不同尺度的深度图。

模型输出示例：

本项目也集成到了百度飞浆AI Studio中，可更快进行复现。

地址：【第六届论文复现赛103题】 MLDA-Net深度估计模型 paddle复现 - 飞桨AI Studio (baidu.com)

2、准备工作

2.1 数据集准备

该模型的训练需要kitti数据集，并且需要生成depth_hint。可以参考链接来获取完整的数据集，并生成相应的depth_hint。完整的数据集有176GB的大小，本项目也提供了较小规模的kitti数据集，该数据集是kitti数据集中的10_03部分，并提供了生成的depth_hint进行简化训练。

链接：https://pan.baidu.com/s/1Rj5biYkAR2pURuzR881GQw ，提取码：n5wa

下载后，文件组织形式如下

|-- data/kitti_data
	|-- 2011_10_03
		|-- 2011_10_03_drive_0027_sync
			|-- image_00
			|-- image_01
			|-- image_02
			|-- ...
		|-- 2011_10_03_drive_0034_sync
			|-- ......
		|-- 2011_10_03_drive_0042_sync
			|-- ......
		|-- 2011_10_03_drive_0047_sync
		    |-- ......
		|-- calib_cam_to_cam.txt
		|-- calib_imu_to_velo.txt
		|-- calib_velo_to_cam.txt

2.2 模型准备

模型参数文件下载地址：

链接：https://pan.baidu.com/s/19Nl8d_SUOO-ihhgxegtE6w 提取码：owf6

从链接中下载模型参数,并放到项目根目录下的data文件夹下，这样data文件夹的文件结构如下：

文件结构

  data/
        |-- lite_data              #predict和infer用的测试图片
        |-- lite_train_data        #少量训练数据，用于tipc进行小批量训练和测试
        |-- kitti_data             #完整训练数据
        |-- pretrain_weights       #预训练的的模型参数文件
            |-- depth.pdparams
            |-- encoder.pdparams
            |-- pose.pdparams
            |-- pose_encoder.pdparams

复现精度(192 x 640 分辨率)：

Backbone	Train dataset	Test dataset	RMSE	checkpoints_dir
MLDA	kitti/10_03/train	kitti/10_03/val	4.690
MLDA	kitti/10_03/train	kitti/10_03/val	4.216(复现)	pretrain_weights

3、开始使用

3.1 模型训练

对模型进行训练时，在控制台输入代码：

python train.py --data_path ../data --depth_hint_path ../data/depth_hints

训练过程中会在MLDA-Net-repo/log_train/文件夹下生成train.log文件夹，用于保存训练日志。

模型训练需使用paddle2.2版本，paddle2.3版本由于paddle.cumsum函数存在问题，会输出错误结果。

3.2 模型评估

对模型进行评估时，在控制台输入以下代码：

python test.py --data_path ./data/kitti_data --depth_hint_path ./data/kitti_data/depth_hints --load_weights_folder ./data/pretrain_weights

如果要在自己提供的模型上进行测试，请将修改参数 --load_weights_folder your_weight_folder

3.3 模型单图像测试

对模型进行单图像的简单测试时，在控制台输入以下代码。

python predict.py --load_weights_folder ./data/pretrain_weights

#如果要在自己提供的模型上进行测试，load_weights_folder。 如果要在自己提供的图片上进行测试，在控制台按如下格式输入代码。
python predict.py --load_weights_folder ./data/pretrain_weights  --color_path your_img_path --no_rmse True

输出示例如下:

predict_img saved to ./predict_figs/depth_predict.jpg
eval
   abs_rel |   sq_rel |     rmse | rmse_log |       a1 |       a2 |       a3 | 
&   0.120  &   0.765  &   4.355  &   0.170  &   0.848  &   0.973  &   0.992  \\
-> Done!

模型输出的图片与第一部分的图2相同。

4. Tipc

4.1 导出inference模型

python export.py --load_weights_folder ./data/pretrain_weights --save_dir ./inference

上述命令将生成预测所需的模型结构文件model.pdmodel和模型权重文件model.pdiparams以及model.pdiparams.info文件，均存放在inference/目录下。

由于该模型的主体实际上是两组模型，所以会生成两组文件model_encoder和model_depth。

4.2 使用预测引擎推理

python inference.py

推理结束会默认保存下模型生成的修复图像，并输出测试得到的RMSE值。效果与3.3相似。

4.3 调用脚本完成训推一体测试

4.3.1 数据准备

从以下链接下载少量训练数据用于tipc训练，文件组织形式参考2.2。

链接：https://pan.baidu.com/s/1_XelODK9nDVc8YLKCADC1w 提取码：73mw

4.3.2 开始测试

测试基本训练预测功能的lite_train_lite_infer模式，运行：

# 运行测试
bash test_tipc/test_train_inference_python.sh ./test_tipc/configs/GPEN/train_infer_python.txt 'lite_train_lite_infer'

5. 代码结构说明

MLDA-Net-repo/ 
    |-- data/              #存放一些测试数据的文件夹
    |-- dataset/            #存放数据预处理相关的代码
    |-- networks/            #存放模型结构相关的代码
    |-- losses/             #存放损失函数计算相关的代码
    |-- utils/              #存放一些工具函数和类
    |-- test_tipc/           #存放tipc相关文件
    |-- splits/             #存放训练和测试数据列表
    |-- log_train/           #训练时生成的文件夹，用于存放训练过程中保存的模型参数和测试图片
      |-- trainer.py/         #模型训练和测试用到的类
      |-- train.py/          #模型训练时调用
      |-- test.py           #模型评估时调用
      |-- predict.py         #用模型测试单张图片时调用
      |-- export.py          #tipc生成推理模型时调用
      |-- inference.py        #tipc进行推理时调用
      |-- readme.md          #项目说明文档

6、参考文献与链接

论文地址：https://ieeexplore.ieee.org/abstract/document/9416235

论文复现指南-CV方向：https://github.com/PaddlePaddle/models/blob/release%2F2.2/tutorials/article-implementation/ArticleReproduction_CV.md

readme文档模板：https://github.com/PaddlePaddle/models/blob/release/2.2/community/repo_template/README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MLDA-Net深度估计模型

目录

1、简介

2、准备工作

2.1 数据集准备

2.2 模型准备

3、开始使用

3.1 模型训练

3.2 模型评估

3.3 模型单图像测试

4. Tipc

4.1 导出inference模型

4.2 使用预测引擎推理

4.3 调用脚本完成训推一体测试

4.3.1 数据准备

4.3.2 开始测试

5. 代码结构说明

6、参考文献与链接

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data/lite_data/10_03		data/lite_data/10_03
datasets		datasets
losses		losses
networks		networks
splits		splits
test_tipc		test_tipc
utils		utils
README.md		README.md
export.py		export.py
inference.py		inference.py
predict.py		predict.py
test.py		test.py
train.py		train.py
trainer.py		trainer.py

bitcjm/MLDA-Net-repo

Folders and files

Latest commit

History

Repository files navigation

MLDA-Net深度估计模型

目录

1、简介

2、准备工作

2.1 数据集准备

2.2 模型准备

3、开始使用

3.1 模型训练

3.2 模型评估

3.3 模型单图像测试

4. Tipc

4.1 导出inference模型

4.2 使用预测引擎推理

4.3 调用脚本完成训推一体测试

4.3.1 数据准备

4.3.2 开始测试

5. 代码结构说明

6、参考文献与链接

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages