NPU设计项目

目的在FPGA上面实现一个NPU计算单元。能够执行矩阵运算（ADD / ADDi / ADDs / MULT / MULTi / DOT等）、图像处理运算（CONV / POOL等）、非线性映射（RELU / TANH / SIGM等）。
优点考虑到灵活性较强，易于修改网络结构，适用于实现小型CNN/RNN网络。
缺陷由于指令串行执行、缺少Cache导致外存读写频繁，运算性能较低。
联系我们 chenxudong0318@gmail.com

projects

里面是代码和工程，选用的开发软件平台如下：

Python 3.6.3
Anaconda 5.1.0
TensorFlow-gpu 1.3.0
Keras 2.1.0
Quartus 16.1
Modelsim SE 10.4

· aFPGA

Intel FPGA的项目工程

· python

python的项目工程

快速上手步骤

默认配置为 LeNet-5 的CNN网络，可以根据需求进行更改。

切换目录到 projects\python\keras_cnn\scripts
如果需要修改网络配置，请根据《python端代码指南.pdf》，配置《网络描述文件.txt》

网络描述文件.txt
I: 32, 32, 1
L0: C, 5, 5, 6, tanh
L1: S, 2, 2
L2: C, 5, 5, 16, tanh
L3: S, 2, 2
L4: STRIP, 400
L5: FC, 400, 120, tanh, dropout
L6: FC, 120, 84, tanh, dropout
L7: FC, 84, 10, sigmoid

3.依次双击运行下列脚本：

0.创建运行环境文件夹.bat
1.运行CNN训练.bat
2.保存CNN模型的参数到csv文件.bat
3.根据csv文件产生NPU指令CNN参数.bat
4.测试CNN & 生成仿真样本.bat
9.评估模型硬件化后的开销.bat

4.切换目录到 projects\python\keras_cnn\isa-npu，观察 time_consuming.txt 文件，里面会评估整个CNN模型运算的时间、指令数量、外存读写次数。

运算时间 ≈ DDR读写次数 / DDR带宽
[estimated in 50MBps DDR bandwidth]
DDR-READ = 122416, DDR_WRITE=37540,
TOTAL-TIME=12.796480 ms,
TOTAL-PARA-SPACE=61706 (float number)
TOTAL inst number=274

5.切换目录到 projects\aFPGA\05_modelsim
6.修改 run.do 文件中的 #3 行，修改Quartus的安装目录

set QUARTUS_INSTALL_DIR "E:/intelFPGA/16.1/quartus"

7.修改 sim_module.bat 脚本 #2 和 #4 行，配置Altera仿真库和Modelsim的路径

set ALTERA_SIM_DIR=E:\modeltech64_10.4\altera16.1
set MTI_HOME=E:\modeltech64_10.4

8.双击 sim_module.bat 脚本，运行仿真
9.等待仿真结束，在spyder中运行 aFPGA\10_python\cnn\check_cnn.py 脚本
10.观察使用 NPU 运算 CNN的误差

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
QR		QR
documents		documents
projects		projects
LICENSE		LICENSE
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NPU设计项目

projects

· aFPGA

· python

快速上手步骤

About

Releases

Packages

Languages

License

YqGe585/NPU_on_FPGA

Folders and files

Latest commit

History

Repository files navigation

NPU设计项目

projects

· aFPGA

· python

快速上手步骤

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages