#

CUDA

CUDA® is a parallel computing platform and programming model developed by NVIDIA for general computing on graphical processing units (GPUs). With CUDA, developers are able to dramatically speed up computing applications by harnessing the power of GPUs.

Here are 1,154 public repositories matching this topic...

instant-ngp

NVlabs / instant-ngp

Instant neural graphics primitives: lightning fast NeRF and more

machine-learning real-time computer-vision neural-network computer-graphics realtime cuda signed-distance-functions nerf 3d-reconstruction function-approximation real-time-rendering

Updated Apr 18, 2024
Cuda

cub

NVIDIA / cub

[ARCHIVED] Cooperative primitives for CUDA C++. See https://github.com/NVIDIA/cccl

cxx algorithms cpp gpu cpp14 cuda cpp11 nvidia cpp17 cub cpp20 cxx11 cxx14 cxx17 cxx20 nvidia-hpc-sdk

Updated Oct 9, 2023
Cuda

rapidsai / cugraph

cuGraph - RAPIDS Graph Analytics Library

graph graph-algorithms gpu cuda nvidia complex-networks graph-analysis graphml graph-framework rapids

Updated Jul 16, 2024
Cuda

Celebrandil / CudaSift

A CUDA implementation of SIFT for NVidia GPUs (1.2 ms on a GTX 1060)

gpu cuda nvidia vision sift

Updated Sep 12, 2023
Cuda

rapidsai / raft

RAFT contains fundamental widely-used algorithms and primitives for machine learning and information retrieval. The algorithms are CUDA-accelerated and form building blocks for more easily writing high performance applications.

Updated Jul 16, 2024
Cuda

andyzeng / tsdf-fusion

Fuse multiple depth frames into a TSDF voxel volume.

cuda artificial-intelligence vision rgbd 3d 3d-reconstruction depth-camera volumetric-data 3d-deep-learning tsdf kinect-fusion

Updated May 7, 2019
Cuda

CannyLab / tsne-cuda

GPU Accelerated t-SNE for CUDA with Python bindings

python gpu cuda multithreading data-visualization mnist data-analysis tsne-algorithm tsne barnes-hut-tsne barnes-hut fit-tsne tsne-cuda

Updated Apr 5, 2024
Cuda

alicevision / popsift

PopSift is an implementation of the SIFT algorithm in CUDA.

computer-vision gpu cuda image-processing feature-extraction sift

Updated Jun 25, 2024
Cuda

brucefan1983 / GPUMD

Graphics Processing Units Molecular Dynamics

machine-learning neural-network simulation gpu cuda molecular-dynamics neuroevolution high-performance-computing molecular-dynamics-simulation phonon physics-simulation natural-evolution-strategies heat-transport gpumd machine-learning-potential

Updated Jul 16, 2024
Cuda

BBuf / how-to-optim-algorithm-in-cuda

how to optimize some algorithm in cuda.

Updated Jul 14, 2024
Cuda

DefTruth / CUDA-Learn-Notes

🎉CUDA 笔记 / 大模型手撕CUDA / C++笔记，更新随缘: flash_attn、sgemm、sgemv、warp reduce、block reduce、dot product、elementwise、softmax、layernorm、rmsnorm、hist etc.

cuda cuda-kernels gemm softmax cuda-programming layernorm gemv elementwise rmsnorm flash-attention flash-attention-2 warp-reduce block-reduce

Updated Jul 15, 2024
Cuda

NVIDIA-Genomics-Research / GenomeWorks

SDK for GPU accelerated genome assembly and analysis

genomics mapping gpu cuda nvidia alignment python-api poa partial-order-alignment

Updated May 3, 2024
Cuda

flashinfer-ai / flashinfer

FlashInfer: Kernel Library for LLM Serving

gpu cuda pytorch tvm llm-inference flash-attention large-large-models

Updated Jul 13, 2024
Cuda

NVIDIA / nvbench

CUDA Kernel Benchmarking Library

benchmark performance gpu cuda nvidia cuda-kernels kernel-benchmark

Updated Jun 5, 2024
Cuda

MegviiRobot / MegBA

MegBA: A GPU-Based Distributed Library for Large-Scale Bundle Adjustment

high-performance cuda distributed gpu-acceleration graph-optimization bundleadjustment

Updated Jun 3, 2024
Cuda

supranational / sppark

Zero-knowledge template library

cuda zero-knowledge zk-snarks ntt zk-starks zero-knowledge-proofs bls12-381 bls12-377 pasta-curves

Updated Jul 16, 2024
Cuda

Bruce-Lee-LY / cuda_hgemm

Several optimization methods of half-precision general matrix multiplication (HGEMM) using tensor core with WMMA API and MMA PTX instruction.

gpu cuda cublas nvidia gemm matrix-multiply tensor-core hgemm

Updated Nov 7, 2023
Cuda

FZJ-JSC / tutorial-multi-gpu

Efficient Distributed GPU Programming for Exascale, an SC/ISC Tutorial

hpc gpu mpi cuda multi-gpu supercomputing nccl exascale-computing sc23 sc21 nvshmem isc22 sc22 isc23 isc24

Updated May 28, 2024
Cuda

rapidsai / cuvs

cuVS - a library for vector search and clustering on the GPU

machine-learning information-retrieval statistics clustering gpu distance cuda sparse nearest-neighbors similarity-search vector-similarity anns vector-search llm vector-store neighborhood-methods

Updated Jul 16, 2024
Cuda

cuMF / cumf_als

CUDA Matrix Factorization Library with Alternating Least Square (ALS)

machine-learning gpu machine cuda matrix-factorization als

Updated Aug 14, 2018
Cuda

Created by Nvidia

Released June 23, 2007

Followers: 211 followers
Website: developer.nvidia.com/cuda-zone
Wikipedia: Wikipedia

Related Topics

nvcc