#

CUDA

CUDA® is a parallel computing platform and programming model developed by NVIDIA for general computing on graphical processing units (GPUs). With CUDA, developers are able to dramatically speed up computing applications by harnessing the power of GPUs.

Here are 1,156 public repositories matching this topic...

instant-ngp

NVlabs / instant-ngp

Instant neural graphics primitives: lightning fast NeRF and more

machine-learning real-time computer-vision neural-network computer-graphics realtime cuda signed-distance-functions nerf 3d-reconstruction function-approximation real-time-rendering

Updated Apr 18, 2024
Cuda

CannyLab / tsne-cuda

GPU Accelerated t-SNE for CUDA with Python bindings

python gpu cuda multithreading data-visualization mnist data-analysis tsne-algorithm tsne barnes-hut-tsne barnes-hut fit-tsne tsne-cuda

Updated Apr 5, 2024
Cuda

cub

NVIDIA / cub

[ARCHIVED] Cooperative primitives for CUDA C++. See https://github.com/NVIDIA/cccl

cxx algorithms cpp gpu cpp14 cuda cpp11 nvidia cpp17 cub cpp20 cxx11 cxx14 cxx17 cxx20 nvidia-hpc-sdk

Updated Oct 9, 2023
Cuda

rapidsai / cugraph

cuGraph - RAPIDS Graph Analytics Library

graph graph-algorithms gpu cuda nvidia complex-networks graph-analysis graphml graph-framework rapids

Updated Jul 19, 2024
Cuda

BBuf / how-to-optim-algorithm-in-cuda

how to optimize some algorithm in cuda.

Updated Jul 18, 2024
Cuda

DefTruth / CUDA-Learn-Notes

🎉CUDA 笔记 / 大模型手撕CUDA / C++笔记，更新随缘: flash_attn、sgemm、sgemv、warp reduce、block reduce、dot product、elementwise、softmax、layernorm、rmsnorm、hist etc.

cuda cuda-kernels gemm softmax cuda-programming layernorm gemv elementwise rmsnorm flash-attention flash-attention-2 warp-reduce block-reduce

Updated Jul 19, 2024
Cuda

Celebrandil / CudaSift

A CUDA implementation of SIFT for NVidia GPUs (1.2 ms on a GTX 1060)

gpu cuda nvidia vision sift

Updated Sep 12, 2023
Cuda

flashinfer-ai / flashinfer

FlashInfer: Kernel Library for LLM Serving

gpu cuda pytorch tvm llm-inference flash-attention large-large-models

Updated Jul 19, 2024
Cuda

andyzeng / tsdf-fusion

Fuse multiple depth frames into a TSDF voxel volume.

cuda artificial-intelligence vision rgbd 3d 3d-reconstruction depth-camera volumetric-data 3d-deep-learning tsdf kinect-fusion

Updated May 7, 2019
Cuda

rapidsai / raft

RAFT contains fundamental widely-used algorithms and primitives for machine learning and information retrieval. The algorithms are CUDA-accelerated and form building blocks for more easily writing high performance applications.

Updated Jul 19, 2024
Cuda

NVIDIA / nvbench

CUDA Kernel Benchmarking Library

benchmark performance gpu cuda nvidia cuda-kernels kernel-benchmark

Updated Jun 5, 2024
Cuda

MegviiRobot / MegBA

MegBA: A GPU-Based Distributed Library for Large-Scale Bundle Adjustment

high-performance cuda distributed gpu-acceleration graph-optimization bundleadjustment

Updated Jun 3, 2024
Cuda

brucefan1983 / GPUMD

Graphics Processing Units Molecular Dynamics

machine-learning neural-network simulation gpu cuda molecular-dynamics neuroevolution high-performance-computing molecular-dynamics-simulation phonon physics-simulation natural-evolution-strategies heat-transport gpumd machine-learning-potential

Updated Jul 18, 2024
Cuda

alicevision / popsift

PopSift is an implementation of the SIFT algorithm in CUDA.

computer-vision gpu cuda image-processing feature-extraction sift

Updated Jun 25, 2024
Cuda

nosferalatu / SimpleGPUHashTable

A simple GPU hash table implemented in CUDA using lock free techniques

gpu cuda data-structures cuda-programming gpu-cuda-programs

Updated Feb 7, 2024
Cuda

NATTEN

SHI-Labs / NATTEN

Neighborhood Attention Extension. Bringing attention to a neighborhood near you!

cuda pytorch neighborhood-attention

Updated Jul 17, 2024
Cuda

NVIDIA-Genomics-Research / GenomeWorks

SDK for GPU accelerated genome assembly and analysis

genomics mapping gpu cuda nvidia alignment python-api poa partial-order-alignment

Updated May 3, 2024
Cuda

unlimblue / KNN_CUDA

pytorch knn [cuda version]

cuda pytorch-knn knn-cuda

Updated Dec 14, 2021
Cuda

yzhaiustc / Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

Optimizing SGEMM kernel functions on NVIDIA GPUs to a close-to-cuBLAS performance.

optimization cuda nvidia gemm

Updated Nov 28, 2021
Cuda

Bruce-Lee-LY / cuda_hgemm

Several optimization methods of half-precision general matrix multiplication (HGEMM) using tensor core with WMMA API and MMA PTX instruction.

gpu cuda cublas nvidia gemm matrix-multiply tensor-core hgemm

Updated Nov 7, 2023
Cuda

Created by Nvidia

Released June 23, 2007

Followers: 211 followers
Website: developer.nvidia.com/cuda-zone
Wikipedia: Wikipedia

Related Topics

nvcc