和DeepSpeed兼容

派大星的使命通过开源让PTM训练民主化，因此我们必须要让deepspeed的**接口**足够简单，并保证**精度**和某个广受认可的训练框架一致。广受认可的框架有几个选项
1. PyTorch  [ZeroRedundancyOptimizer](https://pytorch.org/docs/stable/distributed.html?highlight=all_gather#torch.distributed.all_gather)
2. Zero系列 [DeepSpeed](https://github.com/microsoft/DeepSpeed)

我们可以选择融入到deepspeed的生态中，具体来说就是精度和DeepSpeed对齐，尽可能小改动的去把派大星的弄到deepspeed里面去，有如下原因

1. deepspeed是目前PTM训练的无法绕开的baseline，不仅有多篇顶级会议论文发表，用户如果寻求PTM训练时，优先会尝试DeepSpeed。
2. deepspeed是微软内部大团队开发的，不仅涉及并行训练，还有量化稀疏，推理加速等一些工具选择。融入这个生态，意味着我们也可以享受这些技术的进步，复用deepspeed的功能组件。


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

和DeepSpeed兼容 #12

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

和DeepSpeed兼容 #12

Description

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions