cuda_cnn

This is a convolutional neural network implemented using C and CUDA.The model is deployed on embedded devices.

Layer configuration

Convolution

Input: 28 * 28 * 1 Output: 24 * 24 * 6 Kernel size: 5 * 5 Kernel amount: 6 Stride: 1

Tanh
Pooling

Input: 24 * 24 * 6 Output: 12 * 12 * 6 Window size: 2 * 2 Stride: 2

FullyConnected1

Input: 12 * 12 * 6 Output: 45

Sigmoid
FullyConnected2

Input: 45 Output: 10

Sigmoid

Dataset

MNIST: 60k train set, 10k test set
28 * 28 * 1

Accuracy

20 epoch: 98.71%

Experiment environment

Development environment: HP Pavilion Gaming Notebook

CPU: Intel Core i7-6700HQ @ 2.60Ghz
GPU: NVIDIA GeForce GTX 950M

Production environment: NVIDIA Jetson Nano

CPU: Quad-core ARM A57 @ 1.43 GHz
GPU: 128-core Maxwell

Usage

Generating model

Do the following in a development environment.

make
./mnist CPU
./mnist GPU

Deployment model

The following operations are performed in the production environment.

sudo cp ./params.txt /usr/src/tensorrt/data/mnist
sudo mkdir /usr/src/tensorrt/samples/cuda_cnn
cd Jetson_Nano
sudo cp ./cuda_cnn.cpp /usr/src/tensorrt/samples/cuda_cnn
sudo cp ./Makefile /usr/src/tensorrt/samples/cuda_cnn
cd /usr/src/tensorrt/samples/cuda_cnn
sudo make
cd /usr/src/tensorrt/bin
./cuda_cnn

Focus on the frame, press the P key for prediction analysis, press the Q key to exit the program.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Jetson_Nano		Jetson_Nano
data		data
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
bp.cu		bp.cu
bp.cuh		bp.cuh
bp_gpu.cu		bp_gpu.cu
bp_gpu.cuh		bp_gpu.cuh
fp.cu		fp.cu
fp.cuh		fp.cuh
fp_gpu.cu		fp_gpu.cu
fp_gpu.cuh		fp_gpu.cuh
global.cu		global.cu
global.cuh		global.cuh
global_gpu.cu		global_gpu.cu
global_gpu.cuh		global_gpu.cuh
init.cu		init.cu
init.cuh		init.cuh
io.cu		io.cu
io.cuh		io.cuh
main.cu		main.cu
utils.cu		utils.cu
utils.cuh		utils.cuh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

cuda_cnn

Layer configuration

Dataset

Accuracy

Experiment environment

Development environment: HP Pavilion Gaming Notebook

Production environment: NVIDIA Jetson Nano

Usage

About

Releases

Packages

Languages

aininot260/cuda-cnn

Folders and files

Latest commit

History

Repository files navigation

cuda_cnn

Layer configuration

Dataset

Accuracy

Experiment environment

Development environment: HP Pavilion Gaming Notebook

Production environment: NVIDIA Jetson Nano

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages