model-parallelism

Official implementation of DynPartition: Automatic Optimal Pipeline Parallelism of Dynamic Neural Networks over Heterogeneous GPU Systems for Inference Tasks

machine-learning reinforcement-learning scheduling pytorch neural-networks model-parallelism treelstm pipeline-parallelism dynamic-neural-network dynpartition

Updated May 5, 2023
Python

NERSC / sc23-dl-tutorial

Star

SC23 Deep Learning at Scale Tutorial Material

deep-learning data-parallelism model-parallelism vision-transformers ai-for-science

Updated Nov 13, 2023
Python

xrsrke / pipegoose

Star

Large scale 4D parallelism pre-training for 🤗 transformers in Mixture of Experts *(still work in progress)*

transformers moe data-parallelism distributed-optimizers model-parallelism megatron mixture-of-experts pipeline-parallelism huggingface-transformers megatron-lm tensor-parallelism large-scale-language-modeling 3d-parallelism zero-1 sequence-parallelism

Updated Dec 14, 2023
Python

hkproj / pytorch-transformer-distributed

Star

Distributed training (multi-node) of a Transformer model

machine-learning tutorial deep-learning pytorch data-parallelism model-parallelism distributed-training gradient-accumulation distributed-data-parallel collective-communication

Updated Apr 10, 2024
Python

PaddlePaddle / PaddleFleetX

Star

飞桨大模型开发套件，提供大语言模型、跨模态大模型、生物计算大模型等领域的全流程开发工具链。

benchmark cloud lightning elastic unsupervised-learning large-scale data-parallelism paddlepaddle model-parallelism distributed-algorithm self-supervised-learning pipeline-parallelism pretraining fleet-api paddlecloud

Updated May 24, 2024
Python

AlibabaPAI / FlashModels

Star

Fast and easy distributed model training examples.

deep-learning pytorch zero data-parallelism model-parallelism distributed-training xla tensor-parallelism fsdp sequence-parallelism

Updated Jun 28, 2024
Python

Oneflow-Inc / libai

Star

LiBai(李白): A Toolbox for Large-Scale Distributed Parallel Training

nlp deep-learning transformer large-scale data-parallelism model-parallelism distributed-training self-supervised-learning oneflow pipeline-parallelism vision-transformer

Updated Jun 28, 2024
Python

Improve this page

Add a description, image, and links to the model-parallelism topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the model-parallelism topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

model-parallelism

Here are 23 public repositories matching this topic...

mzj14 / mesh

EunjuYang / distributed-tf

dscpesu / NetTorrent

olk / mnist-performance

atakehiro / 3D-U-Net-pytorch-model-parallel

kakaobrain / torchgpipe

ankahira / chainermnx

kaiyuyue / torchshard

joelrorseth / HyperTune

garg-aayush / model-parallelism

ryantd / veloce

Shenggan / atp

alibaba / EasyParallelLibrary

fanpu / DynPartition

NERSC / sc23-dl-tutorial

xrsrke / pipegoose

hkproj / pytorch-transformer-distributed

PaddlePaddle / PaddleFleetX

AlibabaPAI / FlashModels

Oneflow-Inc / libai

Improve this page

Add this topic to your repo