stop_gradient参数之后，ema存储的权重和非ema存储的不一致 #62622

Happy-zyy · 2024-03-11T08:51:07Z

如上图，可以看到word_embeding已freeze住，不同step是一致的，但是其对应的ema参数却不一致

存储代码如下：

def save_model_wrapper(args, exe, test_prog, graph_vars, model_name, step_name, ema_optim=None):
    save_path = os.path.join(args.output_dir, step_name, model_name)
    ema_save_path = os.path.join(args.output_dir, step_name, 'ema_' + model_name)
    try:
        fluid.io.save_persistables(exe, save_path, test_prog) # do not apply ema
        if args.use_ema and ema_optim is not None:
            log.info('save_ema_model to %s' % ema_save_path)
            with ema_optim.apply(exe, need_restore=True):
                fluid.io.save_inference_model(ema_save_path, feeded_var_names=graph_vars['infer_input_vars_name'], target_vars=graph_vars['infer_output_vars'], main_program=test_prog, executor=exe)
        else:
            log.info('save non-ema model to %s' % ema_save_path)
            fluid.io.save_inference_model(ema_save_path, feeded_var_names=graph_vars['infer_input_vars_name'], target_vars=graph_vars['infer_output_vars'], main_program=test_prog, executor=exe)

    except Exception as e:
        log.error('Save Model Error:%s' % str(e))

The text was updated successfully, but these errors were encountered:

JZ-LIANG · 2024-03-12T07:19:25Z

你们使用静态图训练对吧，可以把 program 打印出来，看一下 program 中是否有算子修改了对应的 parameter。
比如：
word_embedding 是否有类似 adam 等 op 修改了。

Happy-zyy added status/new-issue 新建 type/question 用户提问 labels Mar 11, 2024

paddle-bot bot assigned JZ-LIANG Mar 11, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

stop_gradient参数之后，ema存储的权重和非ema存储的不一致 #62622

stop_gradient参数之后，ema存储的权重和非ema存储的不一致 #62622

Happy-zyy commented Mar 11, 2024 •

edited

JZ-LIANG commented Mar 12, 2024

stop_gradient参数之后，ema存储的权重和非ema存储的不一致 #62622

stop_gradient参数之后，ema存储的权重和非ema存储的不一致 #62622

Comments

Happy-zyy commented Mar 11, 2024 • edited

JZ-LIANG commented Mar 12, 2024

Happy-zyy commented Mar 11, 2024 •

edited