Build software better, together

microsoft / DeepSpeed

DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.

machine-learning compression deep-learning gpu inference pytorch zero data-parallelism model-parallelism mixture-of-experts pipeline-parallelism billion-parameters trillion-parameters

Updated Jul 20, 2024
Python

AlibabaPAI / FlashModels

Star

Fast and easy distributed model training examples.

deep-learning pytorch zero data-parallelism model-parallelism distributed-training xla tensor-parallelism llm fsdp sequence-parallelism

Updated Jul 19, 2024
Python

hpcaitech / ColossalAI

Star

Making large AI models cheaper, faster and more accessible

ai deep-learning hpc distributed-computing inference big-model large-scale data-parallelism model-parallelism pipeline-parallelism foundation-models heterogeneous-training

Updated Jul 19, 2024
Python

diptorupd / numba-dpex

Star

A SYCL-like kernel compiler for Python

python compiler jit numba sycl data-parallelism

Updated Jul 18, 2024
Python

Oneflow-Inc / libai

Star

LiBai(李白): A Toolbox for Large-Scale Distributed Parallel Training

nlp deep-learning transformer large-scale data-parallelism model-parallelism distributed-training self-supervised-learning oneflow pipeline-parallelism vision-transformer

Updated Jul 18, 2024
Python

thomas-bouvier / distributed-continual-learning

Star

Towards Rehearsal-based Continual Learning at Scale: distributed CL with Horovod + PyTorch

deep-learning hpc data-parallelism ptychography continual-learning rehearsal experience-replay

Updated Jun 26, 2024
Python

PaddlePaddle / PaddleFleetX

Star

飞桨大模型开发套件，提供大语言模型、跨模态大模型、生物计算大模型等领域的全流程开发工具链。

benchmark cloud lightning elastic unsupervised-learning large-scale data-parallelism paddlepaddle model-parallelism distributed-algorithm self-supervised-learning pipeline-parallelism pretraining fleet-api paddlecloud

Updated May 24, 2024
Python

hkproj / pytorch-transformer-distributed

Star

Distributed training (multi-node) of a Transformer model

machine-learning tutorial deep-learning pytorch data-parallelism model-parallelism distributed-training gradient-accumulation distributed-data-parallel collective-communication

Updated Apr 10, 2024
Python

xrsrke / pipegoose

Star

Large scale 4D parallelism pre-training for 🤗 transformers in Mixture of Experts *(still work in progress)*

transformers moe data-parallelism distributed-optimizers model-parallelism megatron mixture-of-experts pipeline-parallelism huggingface-transformers megatron-lm tensor-parallelism large-scale-language-modeling 3d-parallelism zero-1 sequence-parallelism

Updated Dec 14, 2023
Python

NERSC / sc23-dl-tutorial

Star

SC23 Deep Learning at Scale Tutorial Material

deep-learning data-parallelism model-parallelism vision-transformers ai-for-science

Updated Nov 13, 2023
Python

alibaba / EasyParallelLibrary

Star

Easy Parallel Library (EPL) is a general and efficient deep learning framework for distributed model training.

deep-learning gpu memory-efficient data-parallelism model-parallelism distributed-training pipeline-parallelism

Updated Mar 31, 2023
Python

sjlee25 / batch-partitioning

Star

Batch Partitioning for Multi-PE Inference with TVM (2020)

deep-learning data-parallelism tvm inference-optimization dl-optimization dl-compiler

Updated Dec 17, 2022
Python

ryantd / veloce

Star

WIP. Veloce is a low-code Ray-based parallelization library that makes machine learning computation novel, efficient, and heterogeneous.

sparsity deep-learning distributed-computing pytorch distributed ray data-parallelism parameter-server heterogeneity model-parallelism

Updated Aug 4, 2022
Python

HiEST / DistMIS

Star

Distributing Deep Learning Hyperparameter Tuning for 3D Medical Image Segmentation

deep-neural-networks deep-learning tensorflow raylib distributed hyperparameter-tuning data-parallelism medical-image-segmentation 3d-unet ray-tune distributed-hyperparameter-tuning experiment-parallelism

Updated Jan 20, 2022
Python

joelrorseth / HyperTune

Star

A fully distributed hyperparameter optimization tool for PyTorch DNNs

pytorch data-parallelism model-parallelism horovod gpipe ray-tune

Updated Jan 12, 2022
Python

oriolaranda / DistMIS

Star

Official Repository for the paper: Distributing Deep Learning Hyperparameter Tuning for 3D Medical Image Segmentation

deep-neural-networks deep-learning tensorflow raylib distributed hyperparameter-tuning data-parallelism medical-image-segmentation 3d-unet ray-tune distributed-hyperparameter-tuning experiment-parallelism

Updated Dec 20, 2021
Python

namhoonlee / effect-dps-public

Star

Understanding the effects of data parallelism and sparsity on neural network training

sparsity data-parallelism neural-network-training sparse-neural-network

Updated Jul 27, 2021
Python

dkeras-project / dkeras

Star

Distributed Keras Engine, Make Keras faster with only one line of code.

Updated Oct 3, 2019
Python

dscpesu / NetTorrent

Star

A decentralized and distributed framework for training DNNs

distributed-computing data-parallelism model-parallelism p2p-networks

Updated Aug 25, 2019
Python

EunjuYang / DistributedPyTorch

Star

Example of Distributed pyTorch

pytorch data-parallelism distributed-training multi-node-dataparallelism multi-gpu-training modelparallelism pytorch-mp pytorch-dp

Updated Mar 23, 2019
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

data-parallelism

Here are 23 public repositories matching this topic...

microsoft / DeepSpeed

AlibabaPAI / FlashModels

hpcaitech / ColossalAI

diptorupd / numba-dpex

Oneflow-Inc / libai

thomas-bouvier / distributed-continual-learning

PaddlePaddle / PaddleFleetX

hkproj / pytorch-transformer-distributed

xrsrke / pipegoose

NERSC / sc23-dl-tutorial

alibaba / EasyParallelLibrary

sjlee25 / batch-partitioning

ryantd / veloce

HiEST / DistMIS

joelrorseth / HyperTune

oriolaranda / DistMIS

namhoonlee / effect-dps-public

dkeras-project / dkeras

dscpesu / NetTorrent

EunjuYang / DistributedPyTorch

Improve this page

Add this topic to your repo