Skip to content

和DeepSpeed兼容 #12

@feifeibear

Description

@feifeibear

派大星的使命通过开源让PTM训练民主化,因此我们必须要让deepspeed的接口足够简单,并保证精度和某个广受认可的训练框架一致。广受认可的框架有几个选项

  1. PyTorch ZeroRedundancyOptimizer
  2. Zero系列 DeepSpeed

我们可以选择融入到deepspeed的生态中,具体来说就是精度和DeepSpeed对齐,尽可能小改动的去把派大星的弄到deepspeed里面去,有如下原因

  1. deepspeed是目前PTM训练的无法绕开的baseline,不仅有多篇顶级会议论文发表,用户如果寻求PTM训练时,优先会尝试DeepSpeed。
  2. deepspeed是微软内部大团队开发的,不仅涉及并行训练,还有量化稀疏,推理加速等一些工具选择。融入这个生态,意味着我们也可以享受这些技术的进步,复用deepspeed的功能组件。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions