派大星的使命通过开源让PTM训练民主化,因此我们必须要让deepspeed的接口足够简单,并保证精度和某个广受认可的训练框架一致。广受认可的框架有几个选项
- PyTorch ZeroRedundancyOptimizer
- Zero系列 DeepSpeed
我们可以选择融入到deepspeed的生态中,具体来说就是精度和DeepSpeed对齐,尽可能小改动的去把派大星的弄到deepspeed里面去,有如下原因
- deepspeed是目前PTM训练的无法绕开的baseline,不仅有多篇顶级会议论文发表,用户如果寻求PTM训练时,优先会尝试DeepSpeed。
- deepspeed是微软内部大团队开发的,不仅涉及并行训练,还有量化稀疏,推理加速等一些工具选择。融入这个生态,意味着我们也可以享受这些技术的进步,复用deepspeed的功能组件。
派大星的使命通过开源让PTM训练民主化,因此我们必须要让deepspeed的接口足够简单,并保证精度和某个广受认可的训练框架一致。广受认可的框架有几个选项
我们可以选择融入到deepspeed的生态中,具体来说就是精度和DeepSpeed对齐,尽可能小改动的去把派大星的弄到deepspeed里面去,有如下原因