update mkldnn design doc #5547

tensor-tang · 2017-11-10T09:14:03Z

No description provided.

luotao1

能在这篇文档中加入上次宣讲PPT中的三页内容么：

MKL-DNN，MKL与MKL-lite
PaddlePaddle中的MKL-DNN Engine –软件栈
PaddlePaddle中的MKL-DNN Engine – UML类模型

第一点：方便大家理解这三个库之间的关系
第二和第三点：以图的形式来说明，更容易清楚代码结构。

luotao1 · 2017-11-10T09:23:46Z

doc/design/mkldnn/README.MD

-8. 关于MKLDNN参数的保存。由于MKLDNN参数的格式与PaddlePaddle原有的格式存在不一样的情况，所以需要在保存参数时同时保存该格式信息。目前准备扩展[Header](https://github.com/PaddlePaddle/Paddle/blob/develop/paddle/parameter/Parameter.h#L247)里面的`int32_t version`。这个值不管是在v1还是在v2里面，一直保存的是0，所以可以充分利用这个信息，定义一个枚举处理所有MKLDNN的参数格式，从而`MKLDNNLayer`就可以从输入的参数中获取需要的格式信息。
+3. 创建`MKLDNNMatrix`，同时继承`CpuMatrix`和`mkldnn::memory`。用于管理MKL-DNN会用到的相关memory函数、接口以及会用的到格式信息。
+4. 创建`MKLDNNBase`，定义一些除了layer和memory相关的类和函数。包括MKL-DNN会用到`MKLDNNStream`和`CPUEngine`，和未来可能还会用到`FPGAEngine`等。
+5. 每个`MKLDNNlayer`都会有`inVal_`,`inGrad_`,`outVal_`和`outGrad_`，分别代表input value， input gradient，output value和output gradient。他们会存放MKL-DNN用到的internal memory。同时还会定义以*ext*开头的`MKLDNNMatrix`(表示external的memory)，主要是在格式与PaddlePaddle默认的`nchw`格式不匹配时，用于转换内存的工作。必要的转换函数也会在`MKLDNNLayer`中提前定义好，每个子类只需要调用定义好的reset buffer函数即可。


他们-》它们。下同。

luotao1 · 2017-11-10T09:29:33Z

doc/design/mkldnn/README.MD

+7. 一般来说，external的memory会尽量与PaddlePaddle中的`value`和`grad`共享内存。同时每个`MKLDNNLayer`中的external output value和gradient(也就是`extOutVal_`和`extOutGrad_`)必须分别与`output_.value`和`output_.grad`共享内存，因为PaddlePaddle的activation会直接使用`output_.value`和`output_.grad`。如果不需要external的buffer用于转换，那么internal的buffer也会与他们共享内存。
+8. 如果MKL-DNN layer的后面接有cpu device，那么就会使`output_.value`与`extOutVal_`共享内存，同时数据格式就是`nchw`，这样下一个cpu device就能拿到正确的数据。在有cpu device的时候，external的memory的格式始终是`nchw`或者`nc`。
+9. 由于MKL-DNN的输出操作都是覆盖data的，不是在原来的数据上累加，所以当网络出现分支时，在`backward`时会需要merge不同layer的梯度。`MKLDNNlayer`中会实现merge的方法，此时每个小分支的input gradient会先临时保存在一个`MKLDNNMatrix`中，由分支处的layer负责求和，并把结果放到这个layer的`output_.grad`中。所以整体上，每个子类并不会需要关心分支的事情，也是在父类都实现好了。
+10. 在原来的`FLAGS`中添加一个`use_mkldnn`的flag，用于选择是否使用MKL-DNN的相关功能。


这里10个需要注意的点：

能不能分下类？

能不能结合两张PPT的内容来讲。或者再增加图或表格说明？纯文字讲解代码不够直观易懂。

tensor-tang · 2017-11-10T10:18:13Z

非常同意你说这些点，不过我觉得这些需要再花点时间润色下，但是目前比较着急在出新tag前先把文档内容搞统一了。所以是不是可以加一个todo给我，我后期再润色文档。

luotao1

已经在https://github.com/PaddlePaddle/Paddle/projects/21 加TODO了。

update mkldnn design doc

cd4ecc9

tensor-tang requested a review from luotao1 November 10, 2017 09:14

tensor-tang added this to Doing in Optimization on Intel Platform Nov 10, 2017

luotao1 reviewed Nov 10, 2017

View reviewed changes

luotao1 approved these changes Nov 10, 2017

View reviewed changes

luotao1 merged commit b0f0104 into PaddlePaddle:develop Nov 10, 2017

tensor-tang deleted the doc branch November 12, 2017 12:13

tensor-tang moved this from Doing to Done in Optimization on Intel Platform Nov 12, 2017

tensor-tang mentioned this pull request Nov 21, 2017

Polish MKLDNN design doc #5790

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

update mkldnn design doc #5547

update mkldnn design doc #5547

tensor-tang commented Nov 10, 2017

luotao1 left a comment

luotao1 Nov 10, 2017

luotao1 Nov 10, 2017

tensor-tang commented Nov 10, 2017

luotao1 left a comment

update mkldnn design doc #5547

update mkldnn design doc #5547

Conversation

tensor-tang commented Nov 10, 2017

luotao1 left a comment

Choose a reason for hiding this comment

luotao1 Nov 10, 2017

Choose a reason for hiding this comment

luotao1 Nov 10, 2017

Choose a reason for hiding this comment

tensor-tang commented Nov 10, 2017

luotao1 left a comment

Choose a reason for hiding this comment