Peter-Cao89

Follow

Peter.Cao Peter-Cao89

Follow

1 follower · 1 following

Popular repositories Loading

incubator-mxnet Public

Forked from apache/mxnet

Lightweight, Portable, Flexible Distributed/Mobile Deep Learning with Dynamic, Mutation-aware Dataflow Dep Scheduler; for Python, R, Julia, Scala, Go, Javascript and more

C++
cuda-samples-comments Public

Forked from NVIDIA/cuda-samples

Add comments in "Samples for CUDA Developers which demonstrates features in CUDA Toolkit".Fork from NVIDIA

C
ray-comment Public

Forked from ray-project/ray

Ray is a unified framework for scaling AI and Python applications. Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.

Python
flash-attention Public

Forked from Dao-AILab/flash-attention

Fast and memory-efficient exact attention

Python
FasterTransformer Public

Forked from NVIDIA/FasterTransformer

Transformer related optimization, including BERT, GPT

C++
llm-awq Public

Forked from mit-han-lab/llm-awq

[MLSys 2024 Best Paper Award] AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration

Python