Skip to content

[问题反馈]SFT后的checkpoint加载目录 #249

@hunter-xue

Description

@hunter-xue

做Qwen-7B的SFT后,输出目录如下:
image
然后通过swift app-ui --ckpt_dir进行推理测试:

  1. 如果ckpt_dir设置为/data/Qwen/output-Qwen/qwen-7b-chat/v4-20231224-173846,可以正常启动,但模型使用的仍然是原始模型
  2. 如果ckpt_dir设置为/data/Qwen/output-Qwen/qwen-7b-chat/v4-20231224-173846/checkpoint-100,则可以正常加载SFT之后的checkpoint

可否在启动过程打印一个提示,告知加载的是原始模型还是SFT之后的checkpoint. 或者在文档中说明一下加载哪个目录是正确的。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions