训练检测模型时出现以下错误 #84

bboxzhen · 2020-05-21T06:28:45Z

LDOUBLEV · 2020-05-21T08:39:54Z

问下，你是在自己的数据集上训练的吗，还是用的readme中提到的数据集。方便的话，提供下

启动训练的指令
训练环境：paddle版本，cuda版本等

初步怀疑是数据读取有问题

bboxzhen · 2020-05-21T08:50:12Z

问下，你是在自己的数据集上训练的吗，还是用的readme中提到的数据集。方便的话，提供下

启动训练的指令

训练环境：paddle版本，cuda版本等

初步怀疑是数据读取有问题

readme上面的，应该是gpu内存不足

请问该如何减少训练模型大小

LDOUBLEV · 2020-05-21T08:51:23Z

训练模型很小了，轻量的模型只有4M多，你的GPU有多少内存，用的是哪一个算法

LDOUBLEV · 2020-05-21T08:52:43Z

watch nvidia-smi 看一下GPU内存使用情况，如果有其他程序占用了内存，但是GPU没有利用率，可以kill掉

bboxzhen · 2020-05-21T08:53:03Z

训练模型很小了，轻量的模型只有4M多，你的GPU有多少内存，用的是哪一个算法
export PYTHONPATH=.&&/opt/conda_venv3.7/bin/python3 tools/train.py -c configs/det/det_mv3_db.yml -o Optimizer.base_lr=0.0001

LDOUBLEV · 2020-05-21T08:54:05Z

这个程序没有利用率，可能是python程序非正常关闭，但是进程依然存在，导致一直再占着显存

bboxzhen · 2020-05-21T08:55:19Z

这个程序没有优化，可能是python程序非正常关闭，但是进程依然存在，导致一直再占着显存
可是我已经全部清理才开始跑的
sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh

LDOUBLEV · 2020-05-21T08:56:09Z

那试试减小batchsize

bboxzhen · 2020-05-21T08:59:46Z

batchsize

减少test_batch_size_per_card，train_batch_size_per_card可以解决问题，非常感谢

LDOUBLEV · 2020-05-21T09:00:12Z

batchsize

减少test_batch_size_per_card，train_batch_size_per_card可以解决问题，非常感谢

好的

LDOUBLEV closed this as completed May 21, 2020

adigest mentioned this issue Oct 15, 2020

Fatal signal 11 (SIGSEGV), code 1 (SEGV_MAPERR) #944

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

训练检测模型时出现以下错误 #84

训练检测模型时出现以下错误 #84

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020 •

edited

Loading

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

LDOUBLEV commented May 21, 2020

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

训练检测模型时出现以下错误 #84

训练检测模型时出现以下错误 #84

Comments

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020 • edited Loading

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

LDOUBLEV commented May 21, 2020

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

bboxzhen commented May 21, 2020

LDOUBLEV commented May 21, 2020

LDOUBLEV commented May 21, 2020 •

edited

Loading