模型参数文件为何这么大? #56

swim2sun · 2018-01-08T16:23:28Z

如果你想从头自己训练：下载好数据到任意目录下，然后修改cnn_coarse_to_fine/data_provider目录下所有文件的self.data_dir路径。
如果你只想跑一下我们的模型: 下载好train log文件（包括train_logs_coarse and train_log_fine）并解压到resource目录。

然后我看了一下train log竟然有1.22G, 而训练数据data.tar是239M. 虽然我对机器学习还没入门, 但按目前所了解的, 模型比训练数据大那么多总是不正常的. 模型其实就是几个权重矩阵, 再大应该也大不到这种程度. 真大到这种程度, 就那点训练数据也拟合不了吧

The text was updated successfully, but these errors were encountered:

pkuanjie · 2018-01-09T10:33:38Z

第一个问题，你要区分train_logs和参数有什么不同，没错，我写的模型参数量应该是MB量级的，如果单纯存参数的话其实只有MB大小，但是，为了方便导入导出的操作，各个深度学习框架都提供了直接保存计算图的接口（当然也有保存参数的接口），这里我使用的是tensorflow保存计算图的接口，计算图中包括了模型训练到当前状态的很多参数以外的状态信息，所以，比较大是很正常的。第二个问题，有关于过拟合，模型是否过拟合与train_logs大小和存储的数据多少没有任何关系，甚至可以说与参数量也不是完全线性的关系，目前我们的模型还没有观察到明显的过拟合现象

Prinsphield · 2018-01-09T11:10:29Z

我们重新精简了一下云盘的文件。因为有两个cnn model，fine model有440M，coarse model有380M，这个是正常的大小，你可以看一下model.py和model_fine.py里的架构，或者用TensorFlow下提供的工具看看模型的参数。
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/tools/inspect_checkpoint.py

带你检查一下fine model的参数储存大小。

python /path/to/tensorflow/python/tools/inspect_checkpoint.py --file_name resource/train_logs_fine/best_model.ckpt-53999 --all_tensor_names >> params.txt

这样你得到了一个params.txt文件，记录了所有的参数。然后我们大致估计一下参数需要的储存空间，在当前目录新建一个estimate.py文件

import ast
from six.moves import reduce

def main(filename):
    f = open(filename, 'r')
    storage = 0
    for i, line in enumerate(f):
        if len(line) <= 1: continue
        l = ast.literal_eval(line.split()[-1])
        if len(l) == 0:
            storage += 1 * 4
        else:
            storage += reduce(lambda x,y: x*y, l) * 4
    print(storage)

if __name__ == "__main__":
    filename = 'params.txt'
    main(filename)

然后运行python estimate.py，输出463876640，刚好是fine模型的参数储存大小。

这个是data文件的大小。我们提供的下载文件里面还有个meta文件，你要是觉得占硬盘了，可以删掉meta文件，还是可以正常运行的。

swim2sun · 2018-01-09T15:25:04Z

@RICHARD-AN @Prinsphield 感谢解答, 谢谢你们的工作☺️

zkailinzhang · 2018-02-02T06:16:18Z

厉害学习了

zkailinzhang · 2018-02-02T06:43:33Z

运行python estimate.py出错，params.txt 生成ok的

zkailinzhang · 2018-02-02T06:45:03Z

@Prinsphield大神

swim2sun closed this as completed Jan 9, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

模型参数文件为何这么大? #56

模型参数文件为何这么大? #56

swim2sun commented Jan 8, 2018

pkuanjie commented Jan 9, 2018 •

edited

Loading

Prinsphield commented Jan 9, 2018 •

edited

Loading

swim2sun commented Jan 9, 2018

zkailinzhang commented Feb 2, 2018

zkailinzhang commented Feb 2, 2018

zkailinzhang commented Feb 2, 2018 •

edited

Loading

模型参数文件为何这么大? #56

模型参数文件为何这么大? #56

Comments

swim2sun commented Jan 8, 2018

pkuanjie commented Jan 9, 2018 • edited Loading

Prinsphield commented Jan 9, 2018 • edited Loading

swim2sun commented Jan 9, 2018

zkailinzhang commented Feb 2, 2018

zkailinzhang commented Feb 2, 2018

zkailinzhang commented Feb 2, 2018 • edited Loading

pkuanjie commented Jan 9, 2018 •

edited

Loading

Prinsphield commented Jan 9, 2018 •

edited

Loading

zkailinzhang commented Feb 2, 2018 •

edited

Loading