nn.Graph Tutorial of AMP #448

strint · 2022-03-17T09:41:51Z

AMP背景资料：

OneFlow AMP

打开AMP

全局开关 + 显示标记一定可以做fp16的tensor

class CustomGraph(flow.nn.Graph):
            def __init__(self):
                super().__init__()
                self.m = CustomModule()

                # amp开关
                self.config.enable_amp(True)

            def build(self, x):
                # 在自动推理的基础上，指定一定可以fp16执行的tensor
                x = flow._C.amp_white_identity(x)
                x = self.m(x)
                return x

关闭AMP

待讨论

GradScale

和torch接口对齐的GradScaler

class CustomGraph(flow.nn.Graph):
            def __init__(self):
                super().__init__()
                self.m = CustomModule()

                self.config.enable_amp(True)
                
                # 和torch接口对齐的GradScaler
                grad_scaler = flow.amp.GradScaler(
                    init_scale=3000,
                    growth_factor=2.0,
                    backoff_factor=0.5,
                    growth_interval=1000,
                )
                self.set_grad_scaler(grad_scaler)

            def build(self, x):
                x = self.m(x)
                return x

关联接口：

The text was updated successfully, but these errors were encountered:

strint · 2022-03-17T10:05:38Z

GradScaler还没导出API

amp_white_identity还没导出API

leaves-zwx · 2022-03-17T10:11:59Z

amp_white_identity 这个解释确实困难，感觉得把那个染色算法解释了，才好说清楚这个 op 的含义。

strint · 2022-03-17T10:38:58Z

明天能达到的标准，我们约定为How-To：

大致的概念介绍
API使用演示的一个How-To的例子

达到的效果：给我们自己的算法同事一个最基本的教程，他们可以参考把功能启动起来；而不是接口使用都要口口相传；

Alive1024 · 2022-03-18T09:31:41Z

GradScaler还没导出API

amp_white_identity还没导出API

想确认下这里说的“还没导出”指的是目前还不能从 onflow 访问到吗？nightly 版的 OneFlow 使用它会直接报 AttributeError
还用不了的话，编写 tutorial 中的例子时该怎么说呢？
另外，是需要在所有 "一定可以fp16执行的tensor" 上都要执行这个 op 吗？
@strint

strint · 2022-03-18T09:53:18Z

GradScaler还没导出API
amp_white_identity还没导出API

想确认下这里说的“还没导出”指的是目前还不能从 onflow 访问到吗？nightly 版的 OneFlow 使用它会直接报 AttributeError 还用不了的话，编写 tutorial 中的例子时该怎么说呢？

可以使用。不过没有加API Doc。我过会儿加下，在tutorial中不用管。

另外，是需要在所有 "一定可以fp16执行的tensor" 上都要执行这个 op 吗？

不是，默认可以不用加，amp_white_identity什么时候该使用比较隐晦，先不提这个api算了。

Alive1024 · 2022-03-29T07:44:05Z

@strint XiaoYu哥我想请教确认下， of 与 pytorch 有类似的 GradScaler，但是在使用 of 的 GradScaler 的时候，是只需要在 nn.Graph 中通过 set_grad_scaler 方法指定一个 GradScaler 对象就可以了，而不需要像 pytorch 那样手动显式调用 scale、step 等方法？看了一下 of 的 GradScaler 也没暴露出这些方法

strint · 2022-03-29T08:09:56Z

@strint XiaoYu哥我想请教确认下， of 与 pytorch 有类似的 GradScaler，但是在使用 of 的 GradScaler 的时候，是只需要在 nn.Graph 中通过 set_grad_scaler 方法指定一个 GradScaler 对象就可以了，而不需要像 pytorch 那样手动显式调用 scale、step 等方法？看了一下 of 的 GradScaler 也没暴露出这些方法

是的。这个也是 nn.Graph 中在图里面自动调度的。

Alive1024 mentioned this issue Mar 18, 2022

Add AMP & Activation Checkpointing Tutorials #451

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

nn.Graph Tutorial of AMP #448

nn.Graph Tutorial of AMP #448

strint commented Mar 17, 2022 •

edited

Loading

strint commented Mar 17, 2022

leaves-zwx commented Mar 17, 2022

strint commented Mar 17, 2022

Alive1024 commented Mar 18, 2022 •

edited

Loading

strint commented Mar 18, 2022 •

edited

Loading

Alive1024 commented Mar 29, 2022

strint commented Mar 29, 2022

nn.Graph Tutorial of AMP #448

nn.Graph Tutorial of AMP #448

Comments

strint commented Mar 17, 2022 • edited Loading

AMP背景资料：

OneFlow AMP

打开AMP

关闭AMP

GradScale

strint commented Mar 17, 2022

leaves-zwx commented Mar 17, 2022

strint commented Mar 17, 2022

Alive1024 commented Mar 18, 2022 • edited Loading

strint commented Mar 18, 2022 • edited Loading

Alive1024 commented Mar 29, 2022

strint commented Mar 29, 2022

strint commented Mar 17, 2022 •

edited

Loading

Alive1024 commented Mar 18, 2022 •

edited

Loading

strint commented Mar 18, 2022 •

edited

Loading