gpu-computing

Star

Here are 74 public repositories matching this topic...

jbush001 / NyuziProcessor

Star

GPGPU microprocessor architecture

processor-architecture fpga hardware gpu graphics verilog microprocessor gpu-computing

Updated Apr 26, 2024
C

huiscliu / Tutorials

Star

Parallel programming tutorials

cuda gpu-computing amg

Updated Mar 28, 2021
C

CodedK / CUDA-by-Example-source-code-for-the-book-s-examples-

Star

CUDA by Example, written by two senior members of the CUDA software platform team, shows programmers how to employ this new technology. The authors introduce each area of CUDA development through working examples.

cpp cuda gpgpu gpu-computing

Updated Jun 30, 2023
C

coldfunction / qCUDA

Star

qCUDA: GPGPU Virtualization at a New API Remoting Method with Para-virtualization

driver virtualization cuda qemu memory-allocation gpu-computing guest-os virtio gpgpu-computing cuda-runtime

Updated Feb 9, 2022
C

FARGO3D / fargo3d

Star

A versatile multifluid HD/MHD code that runs on clusters of CPUs or GPUs, with special emphasis on protoplanetary disks.

hpc parallel-computing astrophysics gpu-computing mpi-applications hydrodynamics planets n-body magnetohydrodynamics protoplanetary-disks

Updated Mar 19, 2024
C

ICLDisco / parsec

Star

PaRSEC is a generic framework for architecture aware scheduling and management of micro-tasks on distributed, GPU accelerated, many-core heterogeneous architectures. PaRSEC assigns computation threads to the cores, GPU accelerators, overlaps communications and computations and uses a dynamic, fully-distributed scheduler based on architectural fe…

high-performance-computing gpu-acceleration gpu-computing dataflow-programming runtime-system

Updated May 24, 2024
C

Arman92 / OhGodATool

Star

OhGodATool Backup Repository

gpu-computing mining-software overclocking

Updated Jun 4, 2019
C

SciRuby / rbcuda

Star

CUDA bindings for Ruby

ruby cuda high-performance-computing gpu-acceleration gpu-computing

Updated May 22, 2019
C

ICLDisco / dplasma

Star

DPLASMA is a highly optimized, accelerator-aware, implementation of a dense linear algebra package for distributed heterogeneous systems. It is designed to deliver sustained performance for distributed systems where each node featuring multiple sockets of multicore processors, and if available, accelerators, using the PaRSEC runtime as a backend.

high-performance-computing gpu-acceleration gpu-computing dataflow-programming linear-algebra-library

Updated May 21, 2024
C

trailofbits / sixtyfour

Star

How fast can we brute force a 64-bit comparison?

x86-64 cuda avx2 gpu-computing armv8 performance-test

Updated Dec 19, 2019
C

denglide / CudaDsmc

Star

CUDA implementation of a Direct Simulation Monte Carlo method for gas dynamics

cuda gpu-computing

Updated May 30, 2018
C

tallendev / uvm-eval

Star

This serves as a repository for reproducibility of the SC21 paper "In-Depth Analyses of Unified Virtual Memory System for GPU Accelerated Computing," as well as several components of the IPDPS21 paper "Demystifying GPU UVM Cost with Deep Runtime and Workload Analysis."

hpc gpgpu gpu-computing virtual-memory uvm