作者姓名:

RISC-V指令集模拟器的设计与实现

专业硕士学位论文

(专业学位类型)

专业领域:软件工程

导师姓名:

完成时间:二〇二二年四月七日

Author:

Design and implementation of

University of Science and Technology of China   
A dissertation for master’s degree

(Professional degree type)

RISC-V instruction set simulator

Speciality: Software Engineering

Supervisor:

Finished time: April 7,2022

中国科学技术大学学位论文授权使用声明

中国科学技术大学学位论文原创性声明

本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。

作者签名:签字日期:

作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。

控阅的学位论文在解密后也遵守此规定。

□✓公开□控阅(年)

作者签名:导师签名:

签字日期:签字日期:

摘要

众所周知,芯片产业是投入极高、回报极慢的领域,而 RISC-V提供了免费开源、开发周期较短的解决方案。面对国外芯片的生态和专利壁垒,RISC-V有望成为我国自主研制处理器芯片的极好的选择。而在集成度越来越高的今天,面对数千万乃至上亿晶体管的规模,那种"设计硬件原型-实现-评估-改进-再实现"的模式已经无法满足现代设计应用的需求,因此在芯片开发项目中实现一款体系结构模拟器有着重要的现实意义。

本文设计并实现了一款 RISC-V指令集模拟器,能够完成对 RISC-V架构处理器的功能模拟,包括指令集功能模拟,CPU和总线模拟,平台级中断控制器模拟等,并且提供了 UI调试窗口,可以直接对 RISC-V架构目标程序进行可视化的调试。本模拟器采用了基于解释型的指令集模拟策略,能够提供指令级别的仿真,并且采用了信号与槽机制进行对象间通信,能够以接近宿主机的速度进行跨平台程序开发和测试。该模拟器的主要功能是脱离硬件平台进行系统软件的移植开发工作,能够极大地缩短芯片开发后期的软件适配过程,另外也能够辅助进行处理器验证。

测试表明,在本模拟器上的软件开发,测试,迭代周期,相较于在 RISC-V硬件仿真平台上,缩短了90%以上,并且还能够提供丰富的调试手段,极大地降低了调试难度。本模拟器已在实际的芯片开发过程中承担了系统软件的前期移植工作,在流片之前完成了 Linux内核的适配移植,并辅助进行了部分外设的驱动程序开发工作。

关键词:RISC-V;模拟器;指令集;平台级中断控制器;调试

ABSTRACT

As we all know, the chip industry is an area with extremely high investment andextremely slow returns, and RISC-V provides a solution that is free and open source,with a short development cycle. In the face of the ecological and patent barriers of for-eign chips, RISC-V is expected to become an excellent choice for China’s independentdevelopment of processor chips. In today’s increasingly integrated, in the face of tensof millions or even hundreds of millions of transistors, the "design hardware prototype- implementation - evaluation - improvement - re-implementation" model can no longermeet the needs of modern design applications, so it is of great practical significance toimplement an architecture simulator in chip development projects.

This paper designs and implements a RISC-V instruction set simulator, which cancomplete the functional simulation of the RISC-V architecture processor, including in-struction set function simulation, CPU and bus simulation, platform-level interrupt con-troller simulation, etc., and provides a UI debugging window, which can directly visual-ize the debugging of the RISC-V architecture target program. This simulator adopts aninterpreted instruction set simulation strategy, which can provide instruction-level sim-ulation, and adopts signal and slot mechanism for inter-object communication, whichcan develop and test cross-platform programs at a speed close to the host machine. Themain function of the simulator is to carry out the porting and development of systemsoftware from the hardware platform, which can greatly shorten the software adaptationprocess in the later stage of chip development, and can also assist in processor verifica-tion.

The test shows that the software development, testing, and iteration cycle on thissimulator is more than 90% shorter than that developed on the RISC-V hardware sim-ulation platform, and it can also provide a wealth of debugging methods, which greatlyreduces the debugging difficulty. This simulator has undertaken the pre-migration of thesystem software in the actual chip development process, completed the adaptation andporting of the Linux kernel before the tape-out, and assisted in the driver developmentof some peripherals.

Key Words: RISC-V; Simulator; ISA; PLIC; Debug

目 录

第 1章 绪论 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 1

1.1 系统开发背景 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 1

1.2 国内外发展现状 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 2

1.3 本文主要工作 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 3

1.4 论文的组织结构 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 3

第 2章 相关技术分析ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 5

2.1 指令集架构概述 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 5

2.2 RISC-V架构 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 5

2.3 体系结构模拟器 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 7

2.3.1 解释型指令集模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 9

2.3.2 编译型指令集模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 9

2.3.3 模拟器技术选型 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 10

2.4 本章小结 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 11

第 3章 系统需求分析ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 12

3.1 需求导出 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 12

3.2 分析建模 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 13

3.3 非功能性需求 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 16

3.4 本章小结 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 16

第 4章 系统概要设计ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 17

4.1 系统概述 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 17

4.2 系统静态结构 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 17

4.3 系统动态结构 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 20

4.3.1 解码器与指令集功能函数 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 21

4.3.2 指令流程控制 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 21

4.3.3 中断控制器 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 23

4.3.4 交互调试模块 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 25

4.4 本章小结 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 25

第 5章 系统详细设计与实现 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 26

5.1 预加载模块的实现 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 26

5.2 CPU和总线的实现 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 28

5.2.1 寄存器模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 28

5.2.2 MMU和缓存模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 30

5.2.3 总线和 I/O模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 32

5.3 中断系统的实现 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 35

5.3.1 PLIC模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 37

5.3.2 RTC模拟 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 38

5.4 调试模块和 UI实现 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 38

5.5 本章小结 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 40

第 6章 系统测试ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 41

6.1 测试概要 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 41

6.1.1 测试环境 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 41

6.1.2 概述 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 41

6.2 测试分析 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 41

6.2.1 模块测试需求获取 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 42

6.2.2 配置项测试需求获取 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 42

6.2.3 系统测试需求获取 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 42

6.3 测试用例设计 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 43

6.3.1 模块测试用例设计 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 43

6.3.2 配置项测试用例设计 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 44

6.3.3 系统测试用例设计 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 45

6.4 测试结果及分析 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 45

6.5 测试结论 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 47

第 7章 结论与展望 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 48

参考文献 ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ ꞏ 49

1.1系统开发背景

半个世纪以来,集成电路产业伴随着摩尔定律一路高歌猛进,为人类进入信息化时代提供了强大的算力支撑,芯片俨然已经成为信息时代的原油。在如今逆全球化的浪潮中,芯片行业首当其冲,成为了大国博弈的前沿战场。我国的集成电路产业经过了几十年的发展,在某些应用领域也取得了不错的成绩,但在高性能处理器以及芯片设计的关键技术中,仍然面临着巨大的挑战[1-2]。不管是2018

年中美贸易战中"中兴事件"和"华为事件"的发生,还是其他国家对我国实行的禁运政策,都让我国在市场竞争中处于下风,除了光刻机等硬件生产设备,在工业软件乃至指令集架构等领域,都存在"卡脖子"的现象。

作为软硬件之间至关重要的接口,指令集架构(Instruction Set Architecture,ISA)是处理器的灵魂。长期以来,主流的指令级架构作为少数大公司的知识产权,几乎垄断了全球的芯片设计与制造行业,成为绕不开的技术壁垒。不过近年来随着部分开源的指令级架构的诞生,这一局面有望被打破。RISC-V作为一款完全开源的指令集架构,在众多开源指令集架构中脱颖而出,不仅是因为其设计理念先进,采用模块化设计的方案,而且因为它开放,包容,提供了高度灵活的配置空间,在积极拥抱开源软件的今天,RISC-V已经成为未来的主流架构,随着 RISC-V开源社区的日益壮大,更多的芯片设计厂商选择 RISC-V作为其指令  
集架构,指导芯片的设计生产[3]。

随着摩尔定律的减缓,在如今的集成度面前,传统的"设计硬件原型-实现-评

估-改进-再实现"的芯片开发模式已然落伍[4]。有研究表明,在实际的芯片开发

项目中,如果在前期方案论证阶段没有体系结构模拟器的支持,将很难及时发现

设计的缺陷和性能瓶颈,导致后期的工作变得异常困难,且会伴随高昂的代价[5]。除此之外,在芯片开发后期,软硬件适配工作作为测试的重点[6],往往也需要模

拟器环境的支持[7],厂商可以根据自身产品特性,设计相应的性能或功能模拟器,并在此基础之上进行软件移植工作和前期软硬件设配工作,以此来提高芯片验证与测试工作的效率。从经济成本和时间成本的角度来看,体系结构模拟器都可以为芯片设计与验证工作提供极大的便利。相较于一些主流指令集架构,当前 RISC-V的软件生态尚不完善,各种软件的 RISC-V移植工作正在开源社区如火如荼地进行中,对于芯片设计和开发厂商,系统软件的开发移植更是重中之重。因此开发一款符合自身产品特性的 RISC-V 模拟器将成为贯穿芯片开发周期的一项重要的软件工程。

图1.1 IBM体系结构模拟器框架

1.2国内外发展现状

龙芯中科技术有限公司[8-9]在龙芯2号处理器研发过程中,开发了模拟器

ICT-Godson,对硬件进行了细粒度的模拟,能够精确地模拟芯片开发过程中的所有硬件信号和行为,但是由于模拟精度过高,导致模拟器执行速度太慢,难以高效地进行辅助工作。因此,基于开源模拟器 Simple-Scalar [10],龙芯中科公司重新实现了 Sim-Godson模拟器[8],该模拟器摒弃了细粒度地硬件仿真,采用执行驱动的

组织方式,以及模块化的设计,可以支持时序模拟和功能模拟[8],相较于前一版的模拟器性能得到了极大的提升。使用该模拟器可以直接加载目标程序的二进制可执行文件,通过功能模拟对目标机器进行微结构性能探索[11]。

Gem5是一款开源的系统级体系结构模拟器,它结合了 CPU 模拟框架 M5和内存时序模拟器 GEMS 的特点,是一款具有多种执行模式

的事件驱动模拟器[12],Gem5能够模拟多种不同架构的处理器,包括 Al-

pha,ARM,X86,SPARC,MIPS,近年来也支持了 RISC-V 架构,借助于其开源的强大合作能力,Gem5不断完善自身,在工业界和学术界都极受欢迎。Gem5的灵活性依赖于其面向对象的设计,85%的 Gem5源码由 C++编写,并且提供了两种领域特定语言(DSL)的支持,一个为了指令指令集,另一个为了指令缓存一致性协议。在 Gem5中可以选择不同的指令集架构,CPU模型和一致性协议。对于部分指令集架构,Gem5支持全系统模式(Full System, FS)运行,在 FS模式下,Gem5可以运行操作系统,这样也就可以支持中断,异常,特权级别,I/O等的模拟。

IBM在处理器开发的不同时期,使用不同类型的体系结构模拟器进行辅助。

在前期设计与规划时期,使用Mambo [13]模拟器的时钟精确模式进行微结构探索和粗粒度微结构定义,该阶段体系结构模拟器采用踪迹驱动方式,主要运行和研究用户态应用,对处理器的产品竞争力进行横向比较研究[14]。在微结构设计实

现期间,IBM使用基于公司内部专用"T"语言[15-16]编写的时钟精准模拟器M1

进行详细模拟处理器微结构[14],如图1.1所示。M1是以Mambo模拟器或者硬件

上抓取的踪迹作为输入,并且可以收集非常详细的微结构数据进行性能评估[17]。

目前 RISC-V开源社区的体系结构模拟器有 Spike, Gem5, Qemu [18]等,这一类模拟器能够对部分 RISC-V开源架构如 BOOM进行模拟,对于新手熟悉 RISC-V 有很大的帮助。Spike 是一款基于解释型的 RISC-V 指令集模拟器,能够提供指令级别的仿真,跟开源社区 riscv-tools 里的 pk(proxy kernel)和 fesrv(front-endserver)结合能够完成系统的模拟,并且能够提供命令行的单步调试。Qemu是一款基于编译型的模拟器,直接对 RISC-V 二进制流进行翻译,模拟速度接近宿主机。在此类 RISC-V模拟器上也能够进行软件移植工作,主要是基于 Linux内核的应用软件移植。

1.3本文主要工作

为了加快芯片开发项目中的系统软件开发过程,以及辅助进行处理器验

证[15-16],本文从 RISC-V 芯片开发项目工作流程入手,设计并实现了一款针对

RISC-V体系结构的指令集功能模拟器,可以使得芯片开发团队脱离硬件平台并

行地进行系统软件移植,开发和测试工作[19-20],本模拟器提供对真实硬件的功能

模拟,以及丰富的调试手段,缩短软件开发周期,辅助处理器验证。主要完成的工  
作如下:

(1)参照 RISC-V 用户手册,特权级架构手册,以及实际的硬件设计方案,对RISC-V标准拓展指令集共196条汇编指令进行 C++功能函数模拟,其中大部分指令功能可以直接由 RISC-V 指令集手册获取,少部分指令(主要是特权架构指令)参照硬件设计团队具体的 Chisel代码进行翻译,对硬件设计的功能框架进行建模,确定模拟器的实现方案,规划具体功能模块的边界。

(2)实现 RISC-V指令集模拟器前后端模块,添加丰富的调试手段,设计并实现平台级中断控制器 PLIC和部分外设模拟,可以直接在模拟器进行外设驱动的开发,结合实际项目需求,添加 UI可视化界面,进一步加强模拟器的易用性。在实际的芯片开发项目中帮助团队进行系统软件开发工作,并对处理器进行辅助验证。

本人负责的主要工作有模拟器前后端整体框架的搭建,平台级中断控制器的功能建模与实现,调试交互模块的可视化界面设计,以及测试模拟器是否符合设计需要。

1.4论文的组织结构

本论文总共分为7章,各章节内容安排如下:

第一章:绪论。本章首先简要介绍了 RISC-V指令集架构和体系结构模拟器的背景,然后对国内外主要体系结构模拟器进行举例分析,进而确定了本模拟器的设计思路,最后阐述了本文的主要工作以及论文的组织结构。

第二章:相关技术分析。本章对体系结构模拟器的各种技术知识进行分析,包括体系结构各类别和作用,以及指令集模拟策略等相关技术,然后针对 RISC-V指令集架构特性,确定了基于解释型的模拟策略作为本模拟器的设计方案。

第三章:系统需求分析。本章主要是采用面向对象分析的方法对模拟器用户的需求进行分析与建模,确定模拟器的主要功能模块和非功能性需求,生成系统需求规格说明书。

第四章:系统概要设计。本章主要是对 RISC-V指令集模拟器的总体框架进行设计与描述,包括系统的静态软件结构、动态运行流程,确立了模拟器的四个功能模块:预加载模块,CPU和总线模块,中断控制器模块以及调试和 UI模块。

第五章:系统详细设计与实现。本章主要是对 RISC-V指令集模拟器的各个功能模块的具体实现进行阐述,确定每个模块的功能边界、数据结构和接口细节,并进行具体实现。

第六章:系统测试与结果分析。本章主要是对 RISC-V指令集模拟器进行单元测试、配置项测试和系统测试。并通过测试结果分析模拟器功能和性能的实现情况。

第七章:结论与期望。本章对 RISC-V指令集模拟器的设计与实现过程进行总结,对模拟器的实际使用情况进行介绍,最后分析了模拟器设计存在的缺陷,以及实际使用过程中存在的瓶颈,提出了后续可以改进的方向。

第2章相关技术分析

从第一章的分析可以看出,当前体系结构模拟器的研究主要是基于主流的指令集架构,依托于具体的硬件实现,从处理器功能和性能两个不同的角度对模拟器进行设计。所以本章首先分析主流指令集架构和 RISC-V架构的特点,然后介绍体系结构模拟器的相关技术,最后结合本系统的设计目标-为 RISC-V架构的系统软件提供移植环境并辅助进行处理器验证,提出了基于解释型的指令集模拟策略,对 RISC-V架构处理器进行功能模拟。

2.1指令集架构概述

指令集架构(Instruction Set Architecture, ISA)是计算机体系结构中定义的

软硬件接口规范,是信息技术生态的原始起点[21]。根据同一指令集架构,不同的

厂商可以设计出性能各异的处理器,虽然生产的芯片会有成本,功耗,性能上的区别,但是它们都可以运行基于同一指令集架构开发的软件。指令集架构主要分为复杂指令集(Complex Instruction Set Computer, CSIC)和精简指令集(ReducedInstruction Set Computer,RSIC),前者使用不定长的指令设计方案,单条指令的功能实现有相当大的空间,但是由于保留了许多复杂指令,使得 CPU设计变得

异常繁杂,大大增加了硬件设计的时间成本和面积开销[22];而后者采用定长的指令设计方案,只保留处理器常用指令,因此指令结构较为精简,相应的硬件设计也会比较简洁。这两种指令集架构的代表分别是 X86架构和 ARM架构。其中

X86架构因为其向下兼容的特点在 PC领域占有巨大的市场份额,而 ARM架构因为低功耗的特点被广泛用于嵌入式领域。这两种指令集架构的共同特点是闭源,并且授权费高昂。

2.2 RISC-V架构

第五代精简指令集(RISC-V, Reduced Instruction Set Computer - Five)于2011年诞生于加州大学伯克利分校[23],由 David.Paterson教授团队设计,由于其开放性和包容性,以及充分发挥的后发优势,如今的 RISC-V已经成为行业实施的的标准开源指令集架构。RISC-V的指令集使用模块化的方式进行组织,包含标准拓展的 RISC-V指令集组成如表2.1所示。

表2.1 RISC-V指令集模块

指令集类型类型简写指令数说明

RV32I 47基本整数指令集,包含算数指令、访存指令、环境调

RV32E 47 RV32I指令集简化版本,专为嵌入式设计

RV64I 59整数指令

RV128I 71整数指令

扩展指令集

M 8乘除扩展

A 11原子扩展

F 26单精度浮点扩展

D 26双精度浮点扩展

C 46压缩指令扩展

其中,RV32和 RV64表示寄存器的位宽,决定了处理器寻址范围的大小。基本整数指令集是所有 RISC-V架构设计方案都必须实现的最小子集,其余的统称为拓展指令集,是可选的。

RISC-V指令集架构所使用的定点通用寄存器如表2.2所示,浮点通用寄存器如表2.3所示。

表2.2 RISC-V定点通用寄存器

寄存器助记符描述调用与被调用

x0 zero 硬编码为0-

x1 ra 返回地址寄存器调用者

x2 sp 堆栈指针寄存器被调用者

x3 gp 全局指针寄存器-

x4 tp 线程指针寄存器-

x5 t0临时/备用链接寄存器调用者

x6-7 t1-2临时寄存器调用者

x8 s0/fp 保存的寄存器/帧指针被调用者

x9 s1保存的寄存器被调用者

x10-11 a0-1函数参数/返回值寄存器调用者

x12-17 a2-7函数参数寄存器调用者

x18-27 s2-11保存的寄存器被调用者

x28-31 t3-6临时寄存器调用者

表2.3 RISC-V浮点通用寄存器

寄存器助记符描述调用与被调用

f0-7 ft0-7浮点临时寄存器调用者

f8-9 fs0-1浮点保存寄存器被调用者

f10-11 fa0-1浮点参数/返回值寄存器调用者

f12-17 fa2-7浮点参数寄存器调用者

f18-27 fs2-11浮点保存寄存器被调用者

f28-31 ft8-11浮点临时寄存器调用者

RISC-V指令集有以下特点:

(1)完全开源,使用 RISC-V架构无需获取授权;

图2.1体系结构模拟器在 CPU开发流程中的作用

(2)模块化的指令集设计,针对不同的应用场景,可以选择支持不同组合的指令集模块,有很好的灵活性。

(3)提供可配置的通用寄存器组。

(4)提供规整的指令编码格式,在指令格式中寄存器索引位置对齐,方便译码器硬件实现。

(5)极简的设计哲学,摒弃了分支延迟槽,条件码执行等特性,极大地简化了硬件电路的布局。

(6)方便用户自定义,用户可以对中断系统进行定制,并且还可以实现自定义的拓展指令。

RISC-V架构为软件开发人员提供了开源的指令集规范,也为硬件设计人员提供的便利的指令集模块支持,厂家可以根据自身产品特性选择适合自己的组合模块。这样的指令级架构演化模式充分调动了软硬件开发者的热情,也吸引了众多商业芯片厂商的目光,同时极大地降低了处理器的设计门槛,能够方便研究者进行零成本的创新实践。按照如今 RISC-V开源社区的发展态势,有望在新兴

的 AI与 IoT领域中对 ARM的统治地位形成挑战[24],这同时也是我国能在芯片设计领域打破技术壁垒的良好契机。

2.3体系结构模拟器

模拟器是体系结构量化分析的重要手段,对架构设计、芯片开发有重要的指导作用。基于模拟器辅助进行集成电路设计可以追溯到1980年代[25],自此模拟器便一直是处理器设计过程中不可或缺的工具。在芯片开发项目中,体系结构模  
拟器的具体作用如图2.1所示:

1)在芯片开发早期,基于体系结构模拟器可以进行微结构探索和粗粒度微结构定义,此时模拟器的开发抽象层次较高。

2)随着处理器设计的不断推进和模拟器的不断完善,基于模拟器可以持续对芯片微结构进行评估、修改和取舍。

3)当模拟器趋于成熟,可以对微结构、多核互联系统、一致性协议等进行详细性能分析,基于分析结果对微结构进行微调。

图2.2体系结构模拟器开发流程图

4)在对处理器逻辑设计进行验证的阶段,模拟器可以作为参考模型辅助进行验证,可以快速定位逻辑设计错误。

5)在未流片之前基于模拟器就可以开展系统软件开发和适配工作,在芯片流片结束后以最快速度启动系统软件。

6)流片结束后,基于模拟器可以辅助进行芯片硅后验证环境的搭建以及测

试用例编写工作[26]。为了保证模拟器可以顺利辅助进行处理器设计,在整个芯片开发过程中,需要持续对模拟器进行校准,通过持续对比模拟器和寄存器传输层(Register-Transfer Level, RTL)之间的差别,可以互相校准并发现模拟器或者  
RTL的设计错误[27]。

使用体系结构模拟器进行辅助开发的基本流程如图2.2所示。首先,需要对模拟的粗细粒度进行定义,是功能模拟还是性能模拟,然后需要对实际的硬件设计进行建模,将无需模拟的部分进行抽象,使用软件手段封装成黑箱,这部分不必过分关心硬件的实现细节,只需对输入输出作明确的定义。为了达到所需的模拟精度,需要对模拟器和真实硬件进行行为比对,此外,建模过程中所选的具体算法需要达到对模拟器的性能要求。确定好的模拟方案,完成建模,选定合适的实现算法后,进行程序设计。等确定了程序的正确性后,就可以使用该模拟器进行后续的工作,如对处理器系统软件的预开发移植,或者是对模型本身进行评价或研究,也可以是对模拟的目标系统性能作出评价。

图2.3解释型 ISS工作流程

根据模拟粒度可以将体系结构模拟器分为两类,功能模拟器(指令集模拟器Instruction Set Simulator, ISS)和性能模拟器(时钟周期精确模拟器)[28]。ISS只模拟目标系统的指令集体系结构,比如寄存器状态、指令语义、存储器状态等功能特性;性能模拟器除了模拟功能特性外,还模拟目标系统的微体系结构,比如流水线、分支预测等[29]。

对于指令集模拟器 ISS,在设计过程中,需要充分考虑指令集模拟策略以及模拟器驱动方式。指令集模拟策略是 ISS设计的基础,它决定了模拟器的性能,同时也会影响模拟器调试模块的功能实现。指令集模拟策略分为两种:基于解释型和基于编译型。下面将详细介绍这两种模拟策略。

2.3.1解释型指令集模拟

解释型指令集模拟器的最大的特点在于直接将硬件行为映射到软件,从而模拟出真实的硬件环境,由于其对指令进行逐条翻译,使得指令流程控制很容易

实现[30-31]。ISS的指令控制流程通常是取指-译码-执行的循环,如图2.3所示。

1)取指:模拟器取出目标程序的单条指令;

2)译码:模拟器对目标指令进行翻译,得到指令对应的功能函数;

3)执行:模拟器执行目标指令所对应的功能函数,完成功能函数中定义的软硬件行为。

解释型指令集模拟器的工作流程使得模拟器设计比较简单,易于建模和实现,且灵活性较好,模拟精度高。但是由于模拟器通过软件行为对指令进行逐条译码,相较于真实硬件电路效率太低[32],所以解释型 ISS的模拟速度一般不是很高。

2.3.2编译型指令集模拟

基于编译型的 ISS 通过对译码过程的改进,大幅度提升了模拟的效率,编

译型 ISS采用二进制翻译技术[33]将目标指令翻译成宿主机可识别的指令来完成  
图2.5动态编译型 ISS工作流程

图2.4静态编译型 ISS工作流程

第2章相关技术分析

对目标机状态的模拟。根据译码过程处于编译还是运行时,又可分为静态编译型指令集模拟器(Static Compiled ISS)和动态编译型指令集模拟器(Dynamic

Compiled ISS)[34]。由 Zhu and Gajski [35]给出的静态编译型指令集模拟器将本处

于运行时的指令译码过程转移至编译时,如图2.4所示。首先使用交叉编译器将目标程序编译成目标机架构的二进制文件,接着使用代码生成器进行优化,最终翻译为宿主机二进制文件,由宿主机直接运行。这种基于二进制翻译的指令集模拟策略拥有很高的执行效率,运行速度接近宿主机。

动态编译型 ISS的典型代表为 Embra [36]及 Shade [37],其工作流程如图2.5所  
示:

2.3.3模拟器技术选型

本模拟器的开发目标是对 RISC-V架构处理器进行功能模拟,模拟的粒度是单条 RISC-V汇编指令,属于指令集功能模拟器,用于系统软件的移植开发和测试工作。为了兼顾开发和执行效率,本模拟器采用面向对象的设计方法,使用 C++实现前后端代码框架,采用解释型的指令集模拟策略,最终完成了 RISC-V指令集功能模拟器的开发。

第2章相关技术分析

2.4本章小结

本章节主要介绍了 RISC-V 指令集架构的特点以及体系结构模拟器的相关技术。对体系结构模拟器的功能和开发流程做了介绍,并对几种常见的模拟器类型作了分析对比,其中详细介绍了指令集模拟器 ISS,对指令集模拟器的模拟流程以及两种指令集模拟策略的优缺点进行了分析,最终结合实际芯片开发项目需求,以及 RISC-V指令集架构的特点,拟定了本次模拟器的设计方案:采用基于解释性的指令集模拟策略,方便进行调试功能的实现,并且结合了动态编译型ISS的译码优化策略,提高模拟器执行效率。

第3章系统需求分析

需求分析是软件生产周期中的一个重要环节,本章将采用面向对象分析的方法对体系结构模拟器的需求进行具体分析与建模。明确模拟器所需实现的功能性需求和非功能性需求。

3.1需求导出

在芯片设计及验证的流程中,对于基础系统软件尤其是操作系统,底层驱动等的适配和验证往往是反馈硬件设计缺陷最频繁的部分,这部分的工作不仅是对于前期硬件设计的重要测试,也是后续用户态程序开发的基础。对于系统软件的移植和适配工作,有两种主流方式,一种是在模拟芯片硬件特性的可编程逻辑门阵列(Field Programmable Gate Array, FPGA)平台上仿真,另一种是通过软件模拟。两种方法各有利弊,FPGA开发板更加接近真实硬件环境,能够获取精确的仿真信号,但是能够提供的调试手段有限,并且软件迭代过程将花费大量的时间用于存储器烧写和刻录。而模拟器环境下的软件开发,其运行速度接近宿主机,并且调试手段丰富,虽然信号精度与真实硬件有差异,但是能够在软件移植的前期反馈大部分的缺陷并及时进行迭代。所以真实的开发和测试流程一般是先使用模拟器验证,再上 FPGA平台仿真,这样既能够提高开发效率,又不失精度。

随着 RISC-V开源社区的日益壮大,更多的芯片设计厂商选择 RISC-V作为其指令集架构,但是由于 RISC-V架构的软件生态尚不成熟,有大量的系统软件还未得到 RISC-V支持,因此芯片厂商将花费更多的时间在软硬件设配工作上,而这部分工作更多地依赖模拟器环境进行软件移植工作。当前 RISC-V开源社区提供的模拟器作为教学工具可以帮助初学者快速上手,但在实际的芯片开发流程中很难发挥作用,一方面是因为开源模拟器的模拟对象与实际的处理器架构设计有很大差异,另一方面是因为开源模拟器不提供或是只提供少数的调试手段,而在实际的 RISC-V软件移植开发过程中非常依赖调试功能。所以对于 RISC-V芯片开发团队来说,设计一款符合自身硬件架构的模拟器,同时提供强大的调试工具,具有非常重要的现实意义。

通过在实际的 RISC-V芯片开发项目中总结的经验,以及对系统软件移植工作过程的痛点分析,最终明确了 RISC-V指令集模拟器的业务需求和工作流程,并在此基础上建立了系统需求模型。

RISC-V指令集模拟器的核心业务流程如图3.1所示。

图3.1模拟器运行流程图

第3章系统需求分析

3.2分析建模

指令集模拟器的主要参与者是进行系统软件开发和移植的程序员,本模拟器主要用于芯片开发项目后期的验证工作和系统软件移植工作,对于一些具体的硬件细节,如流水线,分支预测等不进行模拟,只对处理器功能进行模拟,提供指令级别的仿真。

用户首先使用 RISC-V 交叉编译工具链将目标程序编译为 RISC-V 架构的ELF文件,然后模拟器解析该 ELF文件,将对应的指令流搬运到 Bootrom,模拟器在配置启动后为处理器注册指令集,绑定解码器,逐条进行译码,执行。指令译码器完成包括操作数在内的指令信息提取,找到该条指令注册时对应的功能函数,执行该功能函数,然后将更新后的寄存器状态信息,内存状态信息同步到前端 UI显示模块。在模拟器运行的过程中,用户还可以通过前端交互调试窗口来切换模拟器运行模式,设置断点触发条件,进行单步调试,状态查询等操作。通过对实际芯片开发验证过程的分析和归纳,得出模拟器所需要的主要功能有:

1)设置模拟器启动配置,包括 ELF文件路径添加,指令集模块注册,运行模式选择等。

图3.2系统软件开发/移植人员用例图

第3章系统需求分析

2)模拟器执行流程控制。包括正常运行模式下的 uart串口交互,暂停执行进入调试模式,模拟器重启等。

3)调试功能。在调试模式下,进行断点设置,内存查询,历史指令查询,单步执行等。

4)模拟外部中断信号发送。

综上所述,用户需求描述表如表3.1所示。

表3.1用户需求描述表

名称参与者说明

模拟器配置并启动系统软件开发人员设置模拟器启动参数并运行

运行模式切换系统软件开发人员

模拟器由运行模式切换为调试模

式/由调试模式切换为运行模式

重启模拟器系统软件开发人员重新加载当前配置项并运行断点设置系统软件开发人员调试模式下进行断点添加/移除  
内存查询系统软件开发人员

调试模式下对虚拟地址/物理地址内

容查询

中断信号发送系统软件开发人员

点击外部中断源按钮,发送对应的外

部中断到平台及中断控制器

根据用例描述表可以得出系统软件开发人员的用例图如图3.2所示。

下面分别对系统软件开发人员的五个主要用例进行详细描述。模拟器配置启动的用例描述如表3.2所示。

表3.2模拟器配置启动用例描述

用例名称模拟器配置启动

用例描述设置模拟器启动参数并运行

触发条件勾选模拟器配置选项,输入 ELF文件路径

后置条件模拟器解析配置参数,启动程序

(1)输入 ELF文件路径

基本事件流(2)选择启动模式是否为调试模式

(3)其他参数勾选,包括核心数,模拟外设路径等

异常事件流配置参数错误,启动失败

模拟器切换调试模式用例描述如表3.3所示。

表3.3切换调试模式用例描述

用例名称切换调试模式

用例描述模拟器从运行模式切换为调试模式

触发条件点击 run/stop按键

后置条件模拟器暂停指令流程,进入调试模式

基本事件流在运行模式下点击 run/stop按键异常事件流运行模式下点击"单步执行"按键  
模拟器断点设置的用例描述如表3.4所示。

表3.4断点设置用例描述

用例名称断点设置

用例描述调试模式下进行断点添加/移除

触发条件在调试窗口勾选断点类型,输入断点条件,点击"应用"

后置条件

点击 run/stop 进入运行模式,模拟器运行至断点条件触

发调试中断,进入调试模式

(1)调试窗口添加/移除断点

基本事件流(2)程序运行,触发断点

(3)进入调试模式,打印断点信息

异常事件流断点信息填写错误导致无效断点条件

模拟器内存查询的用例描述如表3.5所示。

表3.5内存查询用例描述

用例名称内存查询

用例描述调试模式下对虚拟地址/物理地址内容查询

触发条件查询窗口输入内存地址,点击查询

后置条件输出内存对应地址内容

(1)选择地址类型为虚拟地址/物理地址

基本事件流(2)虚拟地址需要指定核心 ID

(3)输入16进制地址,点击查询

异常事件流输入无效地址导致访存失败

模拟器 UART中断信号发送的用例描述如表3.6所示。

表3.6 UART中断信号发送用例描述

用例名称 UART中断信号发送

用例描述在交互窗口键入,发送 UART外部中断到平台级中断控

触发条件在交互窗口键入

后置条件触发 UART 外部中断,处理器读取 UART 的 FIFO 队列,

输出相应的键入信息

(1)交互窗口键入

基本事件流(2)发起 UART外部中断信号到平台级中断控制器

(3)系统接受外部中断,执行 UART串口驱动程序,显示

键入信息

异常事件流 UART外部中断优先级低于门限,无法发起外部中断

3.3非功能性需求

该指令集模拟器的非功能性需求有:

(1)准确性:体系结构模拟器的首要需求就是准确性,只有准确模拟出真实硬件的行为,才能在模拟器上进行后续的软件开发和移植工作。由于本模拟器的模拟精度在指令级别,不涉及到流水线,乱序执行,分支预测等更细粒度的模拟,因此要求模拟器要和真实硬件在寄存器级别完全一致。

(2)可靠性:可靠性要求模拟器要能够在使用过程中持续稳定运行,不会因为宿主机上程序的设计缺陷导致模拟过程发生崩溃。如果遇到异常情况,模拟器需要能够在不修改启动配置的情况下重启成功,且模拟过程是可复现的。

(3)实时性:作为一个基于指令集翻译的体系结构模拟器,虽然本身的设计初衷不是为了测试 CPU性能,但是模拟器运行速度至少需要达到10MIPS。

(4)友好性:模拟器需要提供一个结构清晰的可视化界面,调试模式下需要能够及时更新处理器状态,包括寄存器值,历史汇编指令列表等。需要提供便捷的内存查询功能,外部中断模拟发送等。

3.4本章小结

本章主要是采用面向对象分析的方法,在实际的芯片开发项目过程中,对系统软件移植、开发、测试流程进行剖析,给出了模拟器应满足的功能需求和非功能需求,确定了指令集模拟器的主要业务流程,最终形成了系统的需求规格说明书。

图4.1系统功能模块图

第4章系统概要设计

4.1系统概述

本章在需求分析的基础上,对 RISC-V指令集模拟器的整体架构设计进行阐述,并对各功能模块进行分析建模,在本章节的基础上,可以从整体上了解 RISC-V指令集模拟器的设计思路,为后续的具体实现提供指导。

4.2系统静态结构

本系统是针对 RISC-V 芯片开发团队在系统软件开发和移植过程中使用的体系结构模拟器。用户将编译好的 RISC-V 架构可执行程序加载到模拟器上运行,控制执行流程,观察执行结果,能够脱离实际硬件平台进行系统软件的调试。该 RISC-V指令集模拟器的整体功能模块如图4.1所示,主要包含四个功能模块:预加载模块,CPU和总线模块,中断控制器模块,以及调试和 UI模块。其中,预加载模块包括模拟器参数配置,指令集注册,加载 ELF文件功能;CPU和总线模块包括了核心的处理器模拟,内存模拟,总线模拟等功能,是模拟器的主体功能模块;中断控制器模块包括 PLIC模拟和部分外设模拟;调试模块包含了断点设置,内存查询,模拟中断信号发送功能,和 UI显示模块结合在一起,提供目标程序执行窗口,调试窗口等的可视化界面和模拟器状态查询功能。

根据模拟器各个功能模块的特点和业务需求,确定了 RISC-V指令集模拟器的整体层次架构如图4.2所示,共分为5层。硬件层主要是 X86架构的宿主机环境。数据层主要包括 RISC-V目标程序二进制文件,和注册过相应指令集模块的  
图4.2系统整体架构图

译码器。在模拟器运行时还包括动态的缓存及主存模拟数据。逻辑层包含了模拟器的业务处理逻辑,由预加载模块从数据层提取可执行代码,通过译码器进行翻译,CPU 和总线模块执行相应的功能函数,最后将目标程序执行结果以及硬件状态变更同步到表现层。表现层主要由调试窗口,查询窗口和目标程序交互窗口组成。用于展示 RISC-V目标程序执行结果,查询模拟器状态信息,以及提供交互调试界面。最终在用户层向用户提供完整的 RISC-V指令集功能模拟器。

CPU和总线模块是模拟器的主体功能模块,该模块模拟了单条指令执行过程中的主要硬件行为,包括寄存器,MMU,高速缓存,主存,总线等。每个处理器都有独立的寄存器组,内存管理单元,所有处理器共享同一个 iCache,dCache,紧随其后的是 L2Cache和主存。模拟出的 RISC-V CPU整体逻辑架构图如图4.3所示,从图中可以看出,模拟器以单个处理器(在 RISC-V架构中称为硬件线程Hart)为核心模拟对象,核内的数据通信不经过总线,直接在处理器复合类对象内部进行通信,具体的类图见下一章。所有内存映射 I/O(Memory-Mapped I/O, MMIO)都需要经过总线,包括时钟,Bootrom,平台级中断控制器以及调试模块。

图4.4 PLIC外部中断

图4.3处理器逻辑架构图

第4章系统概要设计

中断系统以平台级中断控制器(Platform-Level Interrupt Controller, PLIC)为核心,PLIC对外部中断源进行优先级裁决,对内表现为黑盒,处理器不需要关心具体的外部中断源情况,在接受外部中断信号时才会读取相应的外部中断 ID,执行对应的中断处理程序。PLIC与处理器核的关系如图4.4所示。在实际的硬件设计中,PLIC与每个处理器核都有两条硬连线,分别对应机器模式外部中断信号和监管模式外部中断信号。

调试和 UI 模块的设计主要包含前端窗口设计,以及前后端对象间通信设计。前端窗口对象包含交互窗口,调试窗口和状态查询窗口,其中交互窗口需要  
图4.5模拟器执行单条指令活动图

第4章系统概要设计

模拟 UART串口控制器,将交互窗口的键入复制到 UART的 FIFO队列,然后发起 UART外部中断,通过 PLIC和总线与处理器进行通信。该部分的设计使用了QWidget提供的"信号槽"机制,处理对象间的通信。只需要绑定自定义的信号函数和槽函数,就能方便地实现对象间的异步通信。详细的实现将在下一章进行阐述。

4.3系统动态结构

本模拟器是提供指令级别仿真的功能模拟器,模拟器单条指令运行的活动图如图4.5所示。

首先使用 RISC-V交叉编译工具链将目标程序编译为 RISC-V架构的 ELF文

件,然后模拟器解析该二进制文件,将对应的指令流搬运到 BootROM,模拟器在配置启动后为处理器注册指令集,绑定解码器,逐条进行译码,执行。指令译码器完成包括操作数在内的指令信息提取,找到该条指令注册时对应的功能函数,执行该功能函数,然后将更新后的寄存器状态信息,内存状态信息同步到前端 UI显示模块。在模拟器运行的过程中,用户还可以通过前端交互调试窗口来切换模拟器运行模式,设置断点触发条件,进行单步调试,状态查询等操作。

4.3.1解码器与指令集功能函数

本模拟器实现了 RISC-V特权指令集 V1.9版本,和用户指令集 V2.1版本的标准拓展指令集共196条指令的模拟。该部分模拟的核心是 RISC-V汇编指令对应的功能函数,所有功能函数的实现都需要参照硬件设计团队的 HDL代码,本项目使用了 Chisel高级硬件设计语言进行芯片设计,无须对冗长复杂的 Verilog代码进行抽象,能够方便地进行指令功能函数的编写。

模拟器启动后首先根据配置参数解析需要加载的指令集模块,然后遍历各个模块的指令列表,将指令操作码格式和对应的功能函数注册到译码器当中,作为模拟目标机器的完备指令集,后续的目标函数执行过程均不超过当前注册的指令集范围,否则将会产生非法指令的异常导致模拟目标程序崩溃。

4.3.2指令流程控制

在 CPU运行过程中,存在两种指令流程,一种是常规的逻辑控制流,包括顺序的指令流和分支跳转;另一种称为异常控制流,用来响应处理器状态的某些变化,表现为中断或异常。CPU 指令控制流程的模拟包括了响应中断的逻辑,CPU在取值之前检查当前是否有中断信号,根据状态寄存器判断是否响应中断,进入异常控制流逻辑。本节只讨论逻辑控制流的设计,异常控制流程设计将在下一节的中断控制中详细说明。

指令的执行,分为取指、译码、执行三个步骤。对于单条指令,在逻辑上这三个步骤是顺序的,同步的。所以对于功能模拟器,仍然可以把实际的流水线设计看作是单周期的 CPU。处理器核的功能模拟主要包括存储管理单元MMU,高速缓存,以及寄存器组,这部分硬件功能模块都作为处理器核对象的私有成员;模拟器对象管理公有的内存部分,译码器,以及总线和外设。

MMU的功能模拟主要体现在处理器各个运行状态下的地址翻译功能。在真实的芯片设计中,缓存和MMU是两个独立的硬件模块,但是在功能模拟器中,为了实现的方便,可以将高速缓存模块放到 MMU功能模块中,在逻辑上仍然属于两个独立的功能模块,这样做对于处理器行为的模拟没有影响。由于模拟器对于缓存的模拟只能记录缓存的命中率等信息,并不能够真正起到硬件加速的效果,

图4.6 MMU和缓存工作流程图

第4章系统概要设计

此外本次设计的模拟器作为功能模拟器并不需要对处理器性能指标进行模拟,所以直接舍弃 L2Cache的模拟,只在MMU模块中设置 iCache和 dCache,并且使用哈希的方式进行优化。MMU和缓存的工作流程如图4.6所示。

寄存器组的模拟需要参照汇编指令具体功能进行设计。单从数据层面上讲,寄存器组只是处理器内部的一组可随机存取的数据单元,实现上使用数组就可以模拟,但是对寄存器的操作是和汇编指令功能密切相关的,RISC-V指令级架构的设计充分发挥了后发优势,将寄存器 id映射到指令操作码的固定位置,从硬件设计上来讲能够极大地简化电路设计,从软件模拟的角度讲,也更加方便于接口设计,使得后续的指令集功能函数实现能够逻辑清晰,实现起来代码逻辑也更加简洁。

对于总线的模拟,可以将其抽象成统一的通信中转信箱,由全局的模拟器对象维护,可以忽略实际总线的电气特性细节,对处理器核表现为统一的外设控制器,处理包括中断控制器,RTC,BootRom固件等的以内存映射方式寻址的外部设备的通信。

图4.7 SiFive公司的 PLIC框架

4.3.3中断控制器

上一小节介绍了 CPU指令流程控制的设计,主要是取值/译码/执行的逻辑控制流程,而异常控制流,也就是中断逻辑,需要对中断控制器进行模拟,下面将介绍中断控制器模块的整体设计。本模拟器参照了 SiFive 公司的 PLIC 规范文档进行设计,通过设备树挂载 PLIC设备,通过对内存映射的寄存器进行读写来配置PLIC。图4.7是 SiFive公司给出的 PLIC规范框架图。

中断源(interrupt sources)是挂载在 PLIC上的设备的统称,一般是 I/O设备。

PLIC理论上支持任意多个中断源,每个中断源分配有如下的信息:

1)闸口(Gateway)和 IP(interrupt pending)。闸口控制中断源发送中断请求。IP标识当前中断源是否有请求。IP拉高时,闸口不再接受该中断源的请求。

2)设备编号 ID。PLIC为每个中断源分配的唯一编号 ID。该 ID也作为在多个中断源具有相同优先级时的选择条件,数值较小优先级更高。

3)优先级(Priority)。每个中断源都有一个内存映射的 Priority寄存器,表示该中断源的优先级,软件可以通过配置(设备树)将其设置成不同的优先级。优先级的数字越大,表示优先级越高。

4)中断使能(Interrupt Enabled, IE)。每个中断源均分配了一个内存映射的中断使能寄存器,和优先级一样也可以通过设备树进行配置。IE寄存器配置为0表示该中断源被中断目标屏蔽,反之则是使能。

中断目标(interrupt targets)对应为 RISC-V 处理器核心的各个特权级模式。

图4.8 PLIC中断处理流程

PLIC 产生的外部中断请求会分别标示在处理器的 mip 寄存器的 meip/seip 位,对应于机器模式和监管模式。每个中断目标都有对应的内存映射的优先级门限(priority threshold)寄存器,只有中断源优先级高于该门限,PLIC才会将中断源 ID发送给对应中断目标。

PLIC Core负责所有中断请求的仲裁和分发。图4.8展示了 PLIC处理外部中断的流程。

首先,对于中断模块的被动响应方,处理器核对于中断信号的响应需要在单个指令执行周期内完成,所以模拟器在单条汇编指令的取值动作之前将对处理器核的状态寄存器进行检查,判断当前是否有待处理的中断信号,然后完成相应的硬件动作;其次,对于外部中断的主动发起方,PLIC需要进行多个外部中断源的优先级裁决,控制中断源的使能情况,并对所有处理器核的优先级门限进行筛查,对符合条件的所有中断目标发起外部中断请求。PLIC连接到模拟器的所有处理器核心,对内表现为黑盒,处理器不关心中断控制器的内部逻辑,只针对相应的外部中断信号,以及最高优先级中断源 ID,进行对应的中断响应。本模拟器按照 SiFive公司给出的 PLIC规范文档进行设计,具体的实现将在下一章介绍。该硬件模块对处理器核表现为黑盒,只提供固定功能的接口,整体作为外部设备通过总线与处理器进行通信。

图4.9模拟器整体工作流程图

4.3.4交互调试模块

本模拟器的主要功能就是进行目标程序的调试工作,包括 Bootloader,Linux内核,驱动程序等。因此本模拟器的设计不仅需要提供丰富的调试手段,还要能够提供友好的可视化界面,方便进行目标程序调试,缩短系统软件的开发,测试,迭代周期。调试模块的功能集成在上述的处理器指令流程控制模块以及前端 UI模块之中。其中,UI模块的可视化界面提供调试信息的设置,查询功能,后端模拟器指令执行流程中将对设置的调试信息进行匹配,将断点匹配结果,调试查询结果反馈到前端 UI模块,与开发人员进行调试交互。该模块需要提供断点设置,单步执行,寄存器/内存查询等功能。UI显示界面主要包含了断点设置窗口,查询窗口和执行交互窗口。模拟器前后端整体的工作流程如图4.9所示。

4.4本章小结

本章主要是根据系统的需求规格说明书,对 RISC-V指令集模拟器进行概要设计,确定了本模拟器的四个主要功能模块:指令集模块,CPU和总线模块,中断模块,以及交互调试模块。描述了模拟器整体运行流程,并对各模块的功能逻辑进行设计,明确了 RISC-V指令集模拟器的总体框架,动态流程以及各模块设计方案。

图5.1 RISC-V32I指令格式

第5章系统详细设计与实现

本章节基于系统概要设计部分,分别对模拟器四个主要功能模块的具体设计和实现细节进行阐述和说明。

5.1预加载模块的实现

预加载模块主要实现了两个功能,指令集功能函数的翻译,以及解码器对指令列表的解析和注册。

对应单条汇编指令的取值,译码,执行过程,模拟器从 PC地址读取一条32位的汇编指令,通过解码器进行解码,找到对应的功能函数,然后执行该功能函数。核心的数据结构就是指令类 insn\_t,除了包含32位的 uint数据成员来保存指令内容,还定义了一系列的接口,方便读取 RISC-V指令格式所定义的指令码,寄存器,立即数等的位域信息。下面详细介绍模拟器对于指令类数据结构的定义和实现。

由前面的章节可以知道,RISC-V 汇编指令的格式是非常明晰的,图5.1展示了 RISC-V32I所包含的全部六种指令类型的格式。在实际编码过程中,编码位置的安排都是有意义的。例如3个寄存器索引号在不同指令格式中的编码位置是永远不变的,Rd在7-11bit位,Rs1在15-19bit位,Rs2在20-24bit位。即使有些指令中可能没有用到部分寄存器,比如第二个指令类型 I-type中没有 Rs2,但是 Rs1和 Rd的索引号也在对应的位置上。又例如在 S-type里 funct3在12-14bit位,与在 R-type中的位置一致。操作码是所有指令格式都有的,而且位置不变,永远都是0-6bit位。得益于 RISC-V指令类型的优秀设计理念,很容易抽象出指令类 insn\_t,该类包含一个32位无符号数作为指令数据,另外定义统一的接口来获取 RISC-V指令中的位域信息。结合读写寄存器的宏定义,可以方便地编写指  
图5.2指令集模块注册流程图

令功能函数。该部分的实现较为简单,针对不同的位域信息,通过位运算获取相应的内容,主要为功能函数的实现提供接口。

区别于其他指令集架构的设计,RISC-V的译码过程是比对操作码和 func位域信息,通过 RISCV-OPCODES 工具生成的头文件包含了所有标准指令集模块的指令格式信息,每条汇编指令都包含一对掩码(MASK)和匹配(MATCH)信息,译码过程是将指令内容与 MASK 取位与运算,得到的结果和 MATCH 一致表示是该条汇编指令。在模拟器实现过程中只需要为解码器开辟一块内存空间,存放(MATCH,MASK,insn\_t)的三元组即可,为了加快译码速度,在模拟器设计中,采用了哈希表的数据结构进行存储。综合上述接口定义,译码器取值,翻译,执行逻辑  
可以用伪代码表示为:

match = insn −>GET\_MATCH();//获取指令 MATCH,与掩码位与

func = d i s a s s emb l e r −>GET\_FUNC( match );//译码器指令翻译  
func ( i n s n );//功能函数执行

预加载模块注册指令集,以及初始化解码器的流程如图5.2所示。

定义了指令数据结构和解码器之后,取指,译码的过程就完成了,接下来介绍执行步骤的核心内容,指令集功能函数的实现。

指令集功能函数是整个指令集模拟的核心部分,理论上说,汇编指令的功能

图5.3寄存器类图

函数需要和实际的硬件设计一一对应,由于硬件设计所参考的指令集架构版本已经定义了各个汇编指令的功能和具体行为,所以对于指令集的功能模拟只需要参照相应的指令集手册。本模拟器的设计过程依托于具体的芯片项目,由于大多数的硬件设计团队针对不同的性能指标往往会进行一些取舍,尤其是对于 RISC-V这样的开源架构,实际的设计肯定会和官方版本有所出入,所以在模拟器的设计上还是需要参照硬件设计团队的代码。本次设计依托的芯片开发项目使用 Chisel进行硬件设计,通过其生成的 scala代码,可以指导模拟器指令功能函数的翻译。

5.2 CPU和总线的实现

上一节介绍了指令集模块的实现,从一个较高的抽象层次对模拟器的功能进行了定义,本节将详细介绍硬件的模拟细节,主要包含 CPU内部的各个功能部件,以及 CPU与片外通信的桥梁-总线的设计与实现。

5.2.1寄存器模拟

寄存器是 CPU 内部用来存储数据的预定义单元,汇编指令的执行过程主要就是对寄存器和其他存储器的读写过程,因此对于寄存器的模拟需要做到精确且高效,为功能函数的编写提供良好的接口。

RISC-V体系结构中,定义了两类寄存器,整数和浮点寄存器 XPR/FPR;控制与状态寄存器 CSR(control and status register, CSR)。寄存器组的类图如图5.3所示。

XPR/FPR均属于通用数据寄存器,在用户模式和机器模式下的访问方式一致,因此只需要将其定义为处理器类内部的公有成员,可以直接由处理器对象获取并修改。CSR寄存器主要由特权集指令进行位操作,表示 CPU状态的改变,后续的调试模块也需要重点关注 CSR 的状态,因此在模拟实现上需要提供统一的接口,一方面为了简化指令集功能函数的实现,另一方面也可以节省参数传递等  
图5.4状态寄存器位域信息

过程带来的性能损失。对于寄存器组的模拟,除了保存当前的运行时数据,还需要为后续的调试模块保存部分历史状态信息,比如程序计数器 PC,状态寄存器MSTATUS等。总体设计上,寄存器组均封装在 processor\_t类内部,其中通用寄存器组可以被处理器类对象直接调用,进行读写操作;CSR 寄存器组被声明为类私有成员,对外提供 get\_csr(),set\_csr()统一接口。将 CSR寄存器访问权限,状态寄存器位域信息获取等操作封装在接口内部,这样就可以使指令集功能函数的实现不必关心具体的寄存器实现细节。根据 RISC-V特权级架构文档,CSR寄存器接  
口的实现主要需要考虑三个因素:

1)检查寄存器组所需的指令集模块支持。

2)处理器当前权限模式检查。

3) CSR寄存器写入格式的检查。

以状态寄存器 CSR\_MSTATUS为例。该寄存器格式如图5.4所示。状态寄存器持续跟踪和控制硬件线程的当前操作状态。在读写状态寄存器的过程中,需要检查 VM,MPP,MPRV,PUM,MXR 位是否有变化,如果上述的位域发生改变,表示处理器状态发生改变,需要在寄存器读写之前判断当前特权等级。

机器模式异常返回指令 mret,用于从机器模式异常处理程序返回,是 RISC-V架构中断流程的最后一条机器模式指令。该指令功能包含了上述的全部三种检查条件。下面以该指令为例,用伪代码详细说明寄存器模拟实现和指令功能函数的具体实现方式。mret的功能包括将 PC还原为中断前的下一条指令(保存在mepc),将特权级设置成 MPP位保存的值,将中断使能位 MIE还原为 MPIE位保存的值,最后将MPIE设置为1,完成从机器模式到用户模式的跳转。

r e q u i r e \_ p r i v i l e g e (PRV\_M);//宏定义,用于检查当前状态寄存器特权模式

s e t \_ p c ( p−> g e t \_ s t a t e (). mepc );//通过 set\_pc()接口设置 PC值

r e g \_ t s = STATE . ms t a t u s ;

r e g \_ t p r ev\_p rv = g e t \_ f i e l d ( s ,MSTATUS\_MPP);

s = s e t \_ f i e l d ( s ,MSTATUS\_UIE<<prev\_prv , g e t \_ f i e l d ( s ,MSTATUS\_MPIE));

s = s e t \_ f i e l d ( s ,MSTATUS\_MPIE ,1);

s = s e t \_ f i e l d ( s ,MSTATUS\_MPP, PRV\_U);//寄存器类 set\_fields()接口置位

p−> s e t \_ p r i v i l e g e ( p r ev\_p rv );

p−> s e t \_ c s r (CSR\_MSTATUS, s );//处理器类 set\_csr()接口写 CSR寄存器  
图5.5 RISC-V虚拟化方案

在 set\_csr()接口的实现中,需要对于 CSR的读写进行检查,一方面是为了确保读写时所处的特权级模式是否支持读写,另一方面需要针对状态寄存器的改变做出相应的动作,比如 tlb的清除等。

除了上述的寄存器,每个处理器对象都维护私有的 PC程序计数器,初始化过程中 PC被初始化为 Bootrom地址。

5.2.2 MMU和缓存模拟

内存管理单元(Memory Management Unit, MMU)是一种负责处理 CPU内存访问请求的计算机硬件。它的主要功能是进行虚拟地址到物理地址的转换(即虚拟内存管理)。

在 RISC-V体系结构中,与MMU有关的 CSR寄存器主要有控制与状态寄存器MSTATUS和页表基址寄存器 SPTBR。MSTATUS的VM位域记录了当前的虚拟化方案,图5.5给出了 RISC-V架构定义的所有虚拟化方案。对于一个 RISC-V硬件实现,只有Mbare模式是强制要求的,该模式下地址是直接映射,理论上不需要经过 MMU进行地址翻译,Sv39和 Sv48分别表示39位和48位的虚拟地址空间,本模拟器支持上述三种虚拟化方案,但是为了实现方便,所有的主存访问请求都需要经过 MMU,通过 MMU模块的统一接口进行访存,当 mstatus寄存器 VM位为0时,无需进行地址翻译。以 Linux内核加载过程中从物理地址向虚拟地址过渡的逻辑可以看出,当内核支持MMU时,会进入到 relocate代码段进行页表基地址寄存器的初始化,内核通过 setup\_vm()函数进行了首级页表的加载,然后在relocate段计算了首级页表基地址,写入 sptbr寄存器,然后通过一条 mret指令跳出机器模式,以后首级页表会常驻内存,接下来就全是加载虚拟地址了,MMU开始工作。以下列出了 Linux V5.10版本的 relocate代码段,由于 Linux内核对于RISC-V架构的支持依据的是 RISC-V官方给出的最新指令集版本,所以对于芯片设计厂商的具体硬件通常不能够直接适配,经常需要对软件进行微调,以适应

硬件架构设计。

# i f d e f CONFIG\_MMU

r e l o c a t e :

l i a1, PAGE\_OFFSET

l a a2,\_ s t a r t

sub a1, a1, a2

add ra , ra , a1

l a a2,1 f

add a2, a2, a1

csrw CSR\_TVEC, a2

s r l a2, a0, PAGE\_SHIFT

l i a1, SATP\_MODE

or a2, a2, a1

l a a0, t r ampo l i n e \_ p g \_ d i r   
s r l a0, a0, PAGE\_SHIFT

or a0, a0, a1

s f e n c e . vma

csrw sp t b r , a0

. a l i g n 2

1:

/\* S e t t r a p v e c t o r t o s p i n f o r e v e r t o h e l p debug \*/

l a a0,. L seconda ry\_pa rk

csrw CSR\_TVEC, a0

/\* Reload t h e g l o b a l p o i n t e r \*/

. o p t i o n push

. o p t i o n n o r e l a x

l a gp ,\_\_ g l o b a l \_ p o i n t e r $

. o p t i o n pop

csrw sp t b r , a2

s f e n c e . vma

r e t

# e n d i f /\* CONFIG\_MMU \*/

在本模拟器的实现中,MMU模块包含了快表 TLB,加速地址翻译,本质上就是开辟了一片内存用来存放翻译过的地址内容,为了方便起见,只实现了直接映射的 TLB。另外,将 iCache,dCache的功能也一并放到MMU模块中,不再实现单独的缓存硬件模块,缓存采用直写的方式。这样的设计和真实硬件的差异很大,会导致缓存模拟的不准确。考虑到本模拟器并不进行缓存相关的性能模拟,所以可以忽略这部分的差别,在功能模拟上没有影响。MMU模块对取值做特殊处理,取值首先会查找 iCache,当 iCache未命中时,退化为其余类型的访存。访存请求通过模板函数提供的统一的接口 load/store进行请求,通过模板可以忽略具体的数据类型,在功能函数的实现中也可以更加方便的使用,直接调用 MMU的接口对存储单元进行操作。

MMU 接收到访存请求后,首先会检查地址对齐,然后通过页大小计算出虚拟页号,TLB的具体实现是一个哈希表,采用直接映射,如果 TLB未命中,则进入load\_slow\_path()逻辑,需要查找页表,这部分的地址翻译过程封装在MMU类中,在翻译之前首先确认地址范围是否是 MMIO地址范围,如果是,就将访存任务转  
图5.6访存请求活动图

第5章系统详细设计与实现

移给总线处理,后续将详细说明 MMIO的流程。综上,整个 MMU和缓存模块的功能实现都封装到MMU类内部,访存请求的活动图如图5.6所示。

5.2.3总线和 I/O模拟

总线是 CPU 与外部设备进行数据交换的桥梁,按照功能有不同的总线类型划分,本模拟器对总线设备进行了功能抽象,将总线设计为某一块物理地址区间内的 IO控制器,提供统一接口,处理 CPU和内存映射的 IO设备之间的通信。

总线在模拟器初始化的过程中会根据配置挂载设备,在总线类 bus\_t中维护一个物理地址和设备类对象的 map,模拟器在接收到访存请求时,首先检查物理地址是否是主存地址范围,不在主存地址区间内的 I/O请求都是内存映射的 I/O请求(Memory-Mapped I/O, MMIO),模拟器将调用总线设备的 IO接口,对内存映  
图5.8总线设备类图

图5.7 SiFive公司的内存映射方案

第5章系统详细设计与实现

射的外设进行读写操作。

模拟器根据物理地址划分为主存,和内存映射的 IO 设备,图5.7是 SiFive公司提供的内存映射参考。本模拟器的总线设备需要处理的内存映射空间就是

0x00000000-0x80000000,提供这块内存区间上的 IO模拟。总线设备可以挂载多种通过内存映射的 IO设备,某些具有特殊用途的寄存器也能够挂载在总线,比如timecmp寄存器,ipi寄存器。

总线设备的类图如图5.8所示。所有设备都继承自抽象基类 abstract\_device\_t,在总线类 bus\_t中维护一个设备数组,统一管理挂载到总线的 MMIO设备,比如图中的 RTC设备,此类设备的 IO均需要通过总线对象的 MMIO接口与处理器进行通信。

图5.9 MMIO请求流程

所有支持安全启动的 CPU都会有一个 Bootrom固件。CPU在通电之后执行的第一条指令就在 Bootrom的入口,因此 Bootrom拥有最高的执行权限,也就是机器模式M-mode。它将初始化 Secure Boot安全机制,加载 Secure Boot Key等密钥、从存储器加载并验证第一阶段加载程序(First Stage Bootloader, FSBL),最后跳转进 FSBL中。本次芯片设计项目也包含了该部分的设计,但是由于安全启动过程涉及到部分保密信息,本文将不涉及 FSBL的加载和验证过程,Bootrom固件程序仅仅用来跳转置目标程序入口。具体的实现方式包括以下的步骤,首先在配置中读取 Bootrom的地址,默认0x1000,然后初始化 Bootrom设备,填写 Bootrom固件内容,总线对象使用 add\_device()接口将物理地址0x1000和 Bootrom设备对象的映射保存在字典中。本模拟器的 Bootrom程序内容如图所示,包含两条汇编  
指令:

au i p c t0,0 x 7 f f f f

j r t 0

模拟器启动后,PC初始化位 Bootrom固件地址,即0x1000,MMU检测到该地址在MMIO区间内,将访存请求转移给总线,总线对象使用MMIO接口找到对应的设备对象 Bootrom,读取到 Bootrom 的两条指令,处理器在机器模式执行上述两条指令,跳转到主存起始位置0x80000000,即目标程序的入口地址。接下来的一系列指令执行由目标程序决定,主要包括 Bootloader的 reset vector以及加载 Linux内核的过程。

mmio的通信流程如图5.9所示。

5.3中断系统的实现

在 CPU运行过程中,存在两种指令流程,一种是常规的逻辑控制流,包括顺序的指令流和分支跳转;另一种称为异常控制流,用来响应处理器状态的某些变化,表现为中断或异常。之前的章节已将介绍了 CPU指令控制流程的模拟,其中包括了响应中断的逻辑,CPU 在取值之前检查当前是否有中断信号,根据状态寄存器判断是否响应中断,进入异常控制流逻辑。本节将详细阐述模拟器中断系统的实现。包括平台级中断控制器 PLIC以及部分中断源的模拟。

RISC-V一共有两大类的中断类型:局部中断(Local Interrupts)以及全局中断(Global Inerrupts)。局部中断是指直接与硬件线程相连的中断,可以直接通过CSRs当中的 xcause(mcause、scause、ucause)中的值获取中断的类型。在局部中断当中,只有两种标准的中断类型:计时中断(timer)以及软件中断(software)。全局中断实际上就是外部中断(External Interrupts)。它与平台级中断控制器 PLIC相连。实际上全局中断在多个硬件线程的情况下最为常用,PLIC用于对外部中断进行仲裁,然后再将仲裁的结果送入核内的中断控制器。RISC-V架构中规定了一些硬件行为来实现异常事件的响应和处理,这些行为通过控制状态寄存器来反应异常事件信息。涉及到如下几个寄存器,见表5.1。

表5.1中断相关的寄存器

寄存器功能

mstatus 状态寄存器,保存全局中断使能等信息。

mie 外部中断使能寄存器

mtvec 异常入口基地址寄存器

mscratch 上下文切换时用于保存当前的指针信息mepc 异常 PC寄存器,现场保护时保存 PC值  
mcause 异常原因寄存器

mip 中断悬挂寄存器,标识中断信号 pending

mbadaddr 异常原因辅助信息寄存器

本模拟器实现了这部分的硬件行为,包括中断源的产生,和中断响应,下面进行详细的介绍。在处理器类内定义了两个 uint64型数据,分别用来表示时钟中断和外部中断的 pending,总线上挂载的设备可以直接对这两个 pending数据进行设置,用来模拟外设"异步"的中断请求发起。处理器在下一个取值周期之前,使用 try-catch语句来处理可能的中断响应,如果处理器决定响应中断,就会抛出一

个 trap\_t类型的异常,进入到响应中断的异步逻辑。trap\_t的定义如下:

图5.10处理器响应中断流程

c l a s s t r a p \_ t

t r a p \_ t (){}

t r a p \_ t ( r e g \_ t t yp e ): c au se ( t yp e ), a d d r \_ v a l i d ( f a l s e ){}

t r a p \_ t ( r e g \_ t type , q u i n t 64 add r ): c au se ( t ype ), a d d r \_ v a l i d (

t rue ), add r ( add r ){}

r e g \_ t c au se ;

bool a d d r \_ v a l i d ;

q u i n t 64 add r ;

s t a t i c QMap< r eg\_ t , QSt r ing > names ;

s t a t i c qu i n t 64 d e l e g a b l e \_ e x c e p t i o n s ;

QS t r i ng &name (){ re turn names [ cau se ];}

};

抛出异常后,处理器将根据状态寄存器以及异常信息决定是否响应中断,CPU异常处理的流程如图5.10所示。

模拟器抛出异常后,根据捕获到的 trap\_t,进入中断处理流程。RISC-V特权架构对这部分的处理器行为做了一定规范,本模拟器的实现也参照了特权架构定义。

1)根据处理的中断类型将信号源编号记录到 mcause寄存器中;

2)地址不对齐或者发生访问异常,将导致错误的指令部分保存到 mbadaddr;

图5.11 PLIC设备类图

3)更新状态寄存器 mstatus,记录中断处理前的状态;

4)保存当前 PC到 mepc寄存器中,以便于处理完中断后返回;

5)停止当前执行程序流,设置 PC为 mtvec中断向量表入口地址并开始执行。以上就是中断产生和响应过程对应的处理器硬件行为模拟,接下来将着重阐述平台级中断控制器 PLIC的实现。

5.3.1 PLIC模拟

PLIC的功能是接受外部中断源发出的中断信号,对中断请求进行裁决,将裁决结果和外部中断信号发送给处理器。本模拟器参照了 SiFive 公司的 PLIC 规范文档进行设计,通过设备树挂载 PLIC 设备,通过对内存映射的寄存器进行读写来配置 PLIC。根据上一章的 PLIC概要设计,将中断源和中断目标分别抽象成plic\_dev\_info\_t 类和 plic\_core\_info\_t 类,整体的 PLIC 中断控制器的设备类图如图5.11所示。

以串口控制器类 uart\_t为例,在外设的模拟实现中,通过 connect\_plic()接口初始化设备类中的 plic\_dev\_info\_t对象,并将自身挂载到 PLIC设备上,后续设备的IO请求可以通过 plic\_dev\_info\_t::raise()接口发送到 PLIC设备,模拟了闸口的功能。PLIC设备类型 plic\_t中定义了 accept\_interrupt()接口用来拉高对应设备的 IP寄存器,plic\_t::raise()接口实现了中断信号裁决,将裁决后的中断 ID写入 mclaim和 sclaim寄存器,并且向处理器发送外部中断信号,当处理器响应中断时,会读取这两个寄存器的值,然后进入中断向量表,查找对应的中断处理函数,通常会调用

定义在内核 drives 目录下的驱动程序。中断处理结束后,处理器会给 PLIC core发送中断完成信息,具体的动作就是对 PLIC 中断源指定位置 claim寄存器发送一条 store指令,根据 SiFive公司给出的规范,中断源 ID为 n的的 claim/complete寄存器内存映射位置等于(PLIC基地址+0x200004+0x1000\*n),因此该位置进行store请求时直接调用处理器对应 plic\_core\_info\_t对象的 gate\_open()接口来打开闸口。此时 PLIC完成一次外部中断请求周期,可以发起下一次的中断请求。

5.3.2 RTC模拟

RISC-V架构还定义了硬件线程内的局部中断,局部中断控制器(Core-LocalInterruptor, CLINT)是一个存储器地址映射模块,CLINT只负责处理软件中断和时钟中断,因为这两个中断是 RISC-V架构中定义的,经过 CLINT不需要进行任何的仲裁,直接将中断信号写入对应的寄存器内即可。软件中断只需要向 CLINT的MSIP0或者 SSIP0寄存器的最高位写1即可,处理完中断后,将其置为0,这样就能够清除掉软件中断的标志位。计时器中断作为 RISC-V内核特有的中断,其用法就是往MTIMECMP或者 STIMECMP中写特定的值,当 mtime达到该值时产生中断,此时继续填写特定的 tick就可以继续产生下个中断,反复如此,便可产生周期性的时钟中断。想要模拟时钟中断,需要宿主机产生时钟源,这部分的实现使用了 Qt类库中的 QTimer类对象,周期性地调用 RTC类的 increment()接口来模拟时钟的发生,当到达时钟中断条件是,通过MMIO接口更新 RTC设备的 TIMECMP 寄存器,并调用 raise\_interrupt()接口抛出异常,拉高时钟中断pending位,模拟时钟中断的发生。在下一指令周期,处理器接收时钟中断信号,进入中断处理流程。

5.4调试模块和 UI实现

调试模块能够提供断点设置,单步执行,寄存器/内存查询等功能。UI 显示界面主要包含了断点设置窗口,查询窗口和执行交互窗口。本模块使用 Qt的 UIDesigner 工具进行开发,通过拖拽摆放各种窗口控件并进行属性设置,观察界面整体效果,可以方便地进行可视化界面的设计。另外 QtWidget 库还提供了信号(Signals)和槽(Slots)机制,用于对象间通信,只需要在对应窗口子类化 widgets来添加自定义信号,然后实现自定义的槽函数,连接到该信号即可。在本模拟器的实现中,主要的对象间通信就是前端窗口对象和后端模拟器对象间的通信,因此只需要定义一组双向的信号和槽就能够满足通信需求。

前端 UI窗口和后端模拟器之间的信号定义如下:

enum sim\_cmd

图5.12模拟器前端整体界面

sim\_cmd\_pause\_sim ,

sim\_cmd\_run\_sim ,

s im\_cmd\_ run\_ s im\_s i l e n t l y ,

s im\_cmd\_step\_sim ,

s im\_cmd\_rese t\_s im ,

sim\_cmd\_access\_memory ,

s im\_cmd\_se t\_b reaks ,

s im\_cmd\_key\_input ,

s im\_cmd\_mai lbox\_ inpu t

};

enum window\_cmd

{

window\_cmd\_update\_reg ,window\_cmd\_update\_mem ,window\_cmd\_sim\_output ,window\_cmd\_gst\_output ,

window\_cmd\_pause\_sim ,

window\_cmd\_update\_mailbox

};

其中 sim\_cmd\_key\_input和 sim\_cmd\_mailbox\_input信号分别用来模拟 UART和mailbox外部中断源信号。其余信号用于断点和查询信息的交互,以及模拟器单步运行等流程的控制。

通过 UI Designer设计的模拟器前端整体界面如图5.12所示。

断点设置窗口如图所示,可以添加任意多个断点,断点匹配类型分为如下几种:PC,寄存器,内存,中断类型。当模拟器包含多核时需要指定相应的核心ID 号。当模拟器处于调试模式时,中断指令流程,此时可以进行断点设置,内存查询等操作,点击运行按键,模拟器恢复至正常运行模式,在每一次指令执  
图5.13调试模式下单步执行流程

第5章系统详细设计与实现

行周期完成后模拟器将对当前断点信息进行检查,一旦匹配上任意断点,将发送 window\_cmd\_sim\_output 信号用于告知触发断点信息,并接着发送 win-dow\_cmd\_pause\_sim 信号,中断指令流程,模拟器进入调试模式。每发送一次单步执行信号,模拟器都需要将寄存器更新信号发送给 UI前端,刷新寄存器窗口。模拟器单步执行的流程如图5.13所示。

5.5本章小结

本章主要在概要设计的基础上对 RISC-V 指令集模拟器四个功能模块的详细设计和实现细节进行了阐述,并根据实际工程项目中使用的设备和具体型号 IP文档,进行了部分外设的功能模拟,验证了模拟器的可用性,最后完成了前后端所有功能模块的代码实现,并给出了相应的演示效果图.

6.1测试概要

系统测试是系统开发过程中必不可少的重要阶段,是确保系统开发质量的关键,它贯穿于系统开发的整个过程,尽可能地发掘系统中存在的问题和错误,可以及时地进行纠错,促进系统开发工作高效有质量地进行。

6.1.1测试环境

RISC-V指令集模拟器的测试环境分为软件模拟环境和硬件对照环境,软件模拟环境是系统设计使用到的第三方库和模拟器的宿主机环境,硬件对照环境主要是芯片开发过程中的 FPGA开发板 S2C Single U440平台以及流片后的真实芯片环境。具体的模拟器环境如表6.1所示。

表6.1系统测试环境

名称说明

Ubuntu20.04模拟器的宿主机环境

Qt5 Qt5的 UI类库

BBL(berkele-bootloader) RISC-V官方的 bootloader   
linux-v5.10目标程序 linux内核版本

busybox-1.32.1 linux命令集合

6.1.2概述

本模拟器的测试采用测试驱动开发方式进行,主要过程如下:

(1)根据需求分析中确定的芯片开发团队成员需求和系统概要设计中划分的四个功能模块,采用黑盒法设计对应的测试用例,当各个功能模块代码实现后立刻开始测试。

(2)根据需求分析中的需求规格说明,使用场景法对模拟器进行配置项测试,测试模拟器的业务功能是否满足需求。

(3)最后进行系统测试,重点测试 linux内核移植过程中的 MMU启动,挂载PLIC外设,以及调试功能是否满足后续的系统软件移植开发需求。

6.2测试分析

测试分析主要对模拟器的测试需求进行分析,包含可以直接获取的显式功能性需求和系统中隐含的隐性需求比如模拟器运行速度。在系统开发的不同阶段,测试的需求也有所不同,本节所分析的测试需求有:模块测试需求,配置项测试需求和系统测试需求。下面对主要的测试需求展开分析。

6.2.1模块测试需求获取

根据系统概要设计,本模拟器分为四个功能模块,下面对各个功能模块的测

试需求进行分析:

(1)预加载模块:该模块解析模拟器启动参数,获取指令集配置,对相应的指令集模块进行注册,为后续的指令译码,以及功能函数调用提供所需的数据,依据概要设计的要求,主要测试该模块能否将所需指令集全部注册进解码器,并且在后续译码执行过程中调用正确的功能函数。

(2) CPU和总线模块:该模块用于模拟处理器执行过程中的硬件行为,依据概要设计的要求,主要测试该模块的寄存器读写过程;访存请求涉及到的 MMU行为,包括快表查询,iCache查询,通过页表的地址翻译过程;经过总线的 MMIO请求过程。主要测试其正确性。

(3)中断控制器模块:该模块用于模拟中断控制器的软硬件行为,依据概要设计的要求,主要测试通过 PLIC挂载设备的中断请求过程能够被处理器响应,中断控制器能够做到规范文档的功能要求。

(3)调试和 UI模块:该模块提供前端窗口交互功能和相应的调试功能,是本系统的重点测试部分,依据概要设计的要求,主要测试窗口对象和后端模拟器对象间的通信情况,包括断点信息的设置,处理器状态查询,调试模式下的 UI更新情况等,既要测试其正确性,也要测试调试模式下的性能是否满足规范文档的要求。

6.2.2配置项测试需求获取

根据 RISC-V指令集模拟器的需求规格说明书,对于系统软件开发测试人员的需求进行配置项测试,主要是对模拟器加载目标程序的流程测试,以及后续目标程序的流程控制测试,包括设置断点,单步调试,寄存器/内存查询,外部中断信号发送。系统软件开发测试人员通过对目标程序的流程控制,可以方便地进行软件移植工作,加快系统软件的开发迭代。

6.2.3系统测试需求获取

根据需求规格说明书,本模拟器需要进行系统软件的移植测试。包括了 Boot-load和 Linux内核,在此移植过程中,对模拟器的整体功能部件进行测试,主要有Linux加载过程中的MMU启动,PLIC挂载外设,并将中断源通过设备注册到操作系统。

6.3测试用例设计

针对系统开发的各个阶段,测试用例的设计和采用的设计方法都有所不同,下面对各个阶段的测试用例进行设计。

6.3.1模块测试用例设计

依据模块测试的需求,对 RISC-V指令集模拟器的四个功能模块进行测试,各  
个模块的测试用例设计如下:

(1)预加载模块:根据测试需求,该模块的功能是根据模拟器启动参数加载对应的指令集模块,对指令列表进行注册,将指令格式和对应的功能函数绑定起来,完成解码器的初始化工作,该模块检测到未定义指令模块,会发出告警信息,提示未定义行为。具体的测试用例设计如表6.2所示。

表6.2指令集模块测试用例表

序号输入预期输出说明

1指令集标准拓展

rv64imafdc

模拟器注册指令列表

的全部内容,解码器保

存指令格式和功能函

数的映射

验证功能模块的有效

性

2未定义指令集拓展

rv64jkl

提示未定义的指令集

拓展

验证功能模块的健壮

性

3未定义功能函数的自

定义指令

解码器提示功能函数

未定义

验证功能模块的健壮

性

(2) CPU和总线模块:根据测试需求,该模块的功能是模拟指令执行过程中的硬件行为,包括寄存器,MMU,缓存,内存,IO控制器等,测试目的是验证该模块的硬件行为模拟和真实硬件行为一致。该模块的输入总是已注册的指令,不会有其他未定义输入,主要检测是否达到预期输出,具体的测试用例设计如表6.3所示。

表6.3 CPU和总线测试用例表

序号输入预期输出说明

4汇编指令 ld t01000通用数据寄存器 t0内

容0x1000

验证功能模块的有效

性

5汇编指令 csrw mtevc,

t0

CSR 寄存器 mtevc 被

写入 t0寄存器的值

验证功能模块的有效

性

6机器模式下的内存查

询请求

MMU 显示 Mbare 模

式,不进行地址翻译

验证功能模块的有效

性

7监管模式下的 sv39内

MMU 查询页表,输出

验证功能模块的有效

和序号7同一地址的

监管模式下的 sv39内

MMU 查询快表,TLB

命中,输出查询内容

验证功能模块的有效

(3)中断控制器模块:根据测试需求,该模块的功能是将内存映射的 I/O设备挂载到中断控制器,和处理器进行通信。测试目的为了验证中断控制器能够对外部中断信号源进行有效裁决,并配合处理器完成外部中断的流程,以及测试当外部中断源优先级低于处理器门限寄存器时能否屏蔽该中断源。具体的测试用例设计如表6.4所示。

表6.4中断控制器测试用例表

序号输入预期输出说明

9对 UART 的 mmio 请

求

前端窗口输出请求回

复内容

验证功能模块的有效

性

UART 以优先级2挂

载到 PLIC,处理器机

器模式和监管模式的

门限优先级设置为3

处理器不再响应

UART 中断源的外部

中断请求

验证功能模块的健壮

性

(4)调试模块和 UI:根据测试需求,该模块的功能是对目标程序运行流程进行控制,切换至调试模式进行断点设置,寄存器/内存查询,单步调试等功能,测试目的是验证该模块通过 UI将调试信号发送给后端模拟器,并进行断点匹配的过程,还有验证寄存器/内存查询的正确性,以及查询无效内存地址给出告警信息的过程。具体测试用例设计如表6.5所示。

表6.5调试模块和 UI测试用例表

序号输入预期输出说明

11调试模式下单步执

行信号

模拟器执行完一条指令

后发出更新信号,前端 UI

刷新寄存器状态

验证功能模块的有效

性

12断点信息 pc core0

0x80000000

核0在 PC=0x80000000

处匹配断点,进入调试模

式,输出断点信息

验证功能模块的有效

性

内存地址

0x80000000查

询信号

0xif80006f

对应汇编指令 j pc+504

表示跳转到 reset\_vector

验证功能模块的有效

性

14内存地址0xffffffff

查询信号

发出警告信息,无效内存

地址

验证功能模块的健壮

性

6.3.2配置项测试用例设计

依据配置项测试需求,采用基于实际业务的场景设计法对 RISC-V指令集模拟器的 RISC-V架构目标程序调试功能进行测试用例设计。该功能设计的基本流有:1.设置断点信息,点击应用后,调试窗口发送断点信号到模拟器后端,添加新的断点信息到处理器断点检测列表;2.删除处理器断点检测列表中的某一项;3.点击单步执行,模拟器进行一次取值,译码,执行周期,更新寄存器状态窗口,输出当前指令到指令历史窗口;4.输入待查询内存地址,点击查询,模拟器进入 MMU访存逻辑,查询当前地址内容;5.点击运行,模拟器进入运行模式,将交互信息输出到交互窗口;该功能的备选流有:1.设置断点信息错误,导致处理器断点检测列表添加失败;2.输入无效地址导致内存查询失败,发出告警信息。基本流和备选流可以组合成各个场景,进而对每个场景设计测试用例,具体的测试用例设计如表6.6所示。

表6.6配置型测试用例表

序号操作预期输出说明

15设置断点信息,点击应

用

处理器断点检测列表

添加成功

基本流1,备选流1

16删除某一断断点信息删除成功基本流2

17点击单步执行

寄存器状态更新,指令

历史窗口更新

基本流3

18输入内存地址,点击查

询

对应内存地址的内容基本流4,备选流2

19调试模式下点击运行

更新目标程序的交互

信息

基本流5

6.3.3系统测试用例设计

依据系统测试需求,主要对 RISC-V指令集模拟器进行稳定性测试,容错性测  
试和性能测试,下面分别对各个测试进行测试用例设计:

(1)稳定性测试:依据系统测试需求,模拟器需要在加载给定的目标程序后不间断地稳定运行。因此稳定性测试设计为模拟器加载 linux内核运行 top程序三天,预期结果是模拟器可以一直持续运行,并且实时检测模拟 CPU的进程状态。

(2)容错性测试:依据系统测试需求,从一下两个方面进行测试用例设计:加载含有未定义指令的程序,检测程序能否陷入对应的异常(illegal instruction);设置错误的断点信息,检测模拟器在端点检测逻辑是否会发生因设计错误导致的程序崩溃。

(3)性能测试:依据系统测试需求,记录模拟器在断点检测列表为空的状态下,和含有断点检测列表的状态下的 MIPS(Million instruction per-second),和实际的硬件 MIPS做对比,测试模拟器模拟速度。另外从模拟器进行系统软件调试的功能考虑,记录了在模拟器和真在实硬件平台上的调试周期,进行对照测试,分析模拟器在软件移植/开发/测试流程中的性能。

6.4测试结果及分析

使用各个测试阶段所设计的测试用例,对 RISC-V指令集模拟器展开了单元  
测试,配置项测试和系统测试,具体测试结果如下:

(1)在单元测试中对模拟器的四个功能模块都进行了测试,经过五次回归实验后,各个功能模块实际输出与预期输出达成一致,各个模块的功能和健壮性都  
图6.1模拟器正常运行 UI界面

得到了验证,达到了需求规格说明书中的需求。

(2)在配置项测试中对模拟器的目标程序调试功能进行测试,各个测试用例的实际输出与预期输出一致,所测业务功能满足设计需求。

(3)在系统测试中对模拟器进行稳定性测试、容错性测试和性能测试。通过对模拟器程序计数器的统计,以宿主机时钟为基准,测得本模拟器在无断点设置的运行模式下的运行速度为37.9MIPS,在不同的断点调试模式下速度略有不同,平均值为31.7MIPS,达到了模拟器设计需求。稳定性测试时系统正常运行情况如图6.1所示,容错性测试达到了预测的结果。从测试结果可以看出吸烟检测系统的可靠性满足需求规格说明书中的需求;通过和真实硬件平台的对照,在系统软件移植开发流程中,模拟器的软件迭代周期要明显比硬件平台效率更高,性能要求也达到了预期的结果。

通过比对模拟器和 FPGA硬件平台的软件开发周期,可以看出 RISC-V指令集模拟器带来的明显效率提升。如表6.7。

表6.7模拟器和硬件平台对照表

软件调试流程模拟器平台 FPGA平台流片的 S2C平台

目标程序交叉编译<1min <1min <1min

粘贴 fsbl --5min

vivado平台烧录-10min -flash烧录--10min   
启动程序<1min 5min 5min

调试手段断点/单步/查询 Jtag单步硬件波形

6.5测试结论

经过一系列的测试,RISC-V指令集模拟器能够长时间稳定运行,进行目标程序的跨平台模拟执行。对于可能的异常行为,模拟器提供了丰富的调试手段,方便芯片开发团队进行问题排查,针对发现的硬件缺陷或者软件错误,及时进行修正,进行下一轮的测试迭代。一方面可以对硅后处理器验证起到辅助验证的作用,一方面也能够加快系统软件的开发速度,脱离硬件进行并行的移植开发工作,大大缩短了系统软件的开发周期。

但是在实际的使用过程中,本模拟器对于后续的驱动程序开发,需要经常对各种外设进行模拟,这部分的模拟主要参照各个设备厂商 IP,对于模拟过程可能产生的错误较难及时发现。此外在芯片开发过程中,需要及时对模拟器进行迭代,修正与真实芯片的功能差异,这就需要软件开发人员和硬件设计人员及时有效地沟通,无法做到职责分离。因此本模拟器还是存在较大的改进空间。

随着 RISC-V指令集架构的不断完善,RISC-V软件生态的不断蓬勃发展,未来的芯片设计与开发行业将越来越多地看到 RISC-V 的身影。本文依托实际的RISC-V芯片设计与开发项目,实现了 RISC-V指令集模拟器,用于 RISC-V架构软件的移植工作,以及针对具体微结构设计的验证工作完成了既定的功能需求,使得芯片开发团队可以脱离硬件平台进行系统软件移植/开发/测试工作,提供对真实硬件的功能模拟,以及丰富的调试手段,缩短软件开发周期。主要完成的工  
作如下:

(1)参照 RISC-V 用户手册,特权级架构手册,以及实际的硬件设计方案,对RISC-V标准拓展指令集共196条汇编指令进行 C++功能函数模拟,其中大部分指令功能可以直接由 RISC-V 指令集手册获取,少部分指令(主要是特权架构指令)参照硬件设计团队具体的 chisel代码进行翻译,对硬件设计的功能框架进行建模,确定模拟器的实现方案,规划具体功能模块的边界。

(2)实现 RISC-V指令集模拟器前后端模块,添加丰富的调试手段,设计并实现平台级中断控制器 PLIC和部分外设模拟,可以直接在模拟器进行外设驱动的开发,结合实际项目需求,添加 UI可视化界面,进一步加强模拟器的易用性。在实际的芯片开发项目中帮助团队进行系统软件开发工作,并对处理器进行辅助验证。

本文开发的 RISC-V指令集模拟器基本能够满足芯片开发团队的需求,但是后续的测试以及日常的使用过程中,发现本模拟器还是存在一些不足,需要在未  
来不断地进行改进和优化,主要包括以下两点:

(1)本模拟器没有提供保存快照的功能,有时调试过程中出现了异常的状态,因为随机的因素较难复现,所以保存快照的功能还是比较重要。

(2)本文设计的 RISC-V指令集模拟器是依托具体的芯片开发项目,针对不同的微架构,需要进行微调才能够正常使用,可拓展性方面还有待提高,这方面的缺陷也是体系结构模拟器的通病,过分依托单一硬件。作为 RISC-V架构的体系结构模拟器,在后续可以对功能模块进一步抽象,针对具体硬件相关的部分可以因地制宜具体实现,比如寄存器实现策略,中断控制器实现策略等。

参 考 文 献

[1] 胡振波. 手把手教你设计 CPU——RISC-V处理器篇[M]. 1版. 北京: 人民邮电出版社,

[2] 胡振波. RISC-V架构与嵌入式开发快速入门[M]. 1版. 北京: 人民邮电出版社, 2019.

[3] 包云岗, 孙凝晖. 开源芯片生态技术体系构建面临的机遇与挑战[J]. 中国科学院院刊,2022(1): 24-29.

[4] 金立忠,窦勇. 微处理器体系结构模拟器 SimpleScalar分析与优化[J]. 计算机应用研究,2006(8): 197-198.

[5] 何锐. GPGPU多核流体系结构与功耗模拟研究[D]. 国防科学技术大学, 2010.

[6] 黄聪会, 陈靖, 张黎, 等. 软件移植理论与技术研究[J]. 计算机应用研究, 2012, 29(6):2024-2027.

[7] BUTKO A, GARIBOTTI R, OST L, et al. Accuracy evaluation of gem5 simulator system

[C]//7th International workshop on reconfigurable and communication-centric systems-on-chip (ReCoSoC). IEEE, 2012: 1-7.

[8] ZHANG F X, ZHANG L B, HU W W. Sim-godson: A godson processor simulator based on

simplescalar[J]. CHINESE JOURNAL OF COMPUTERS-CHINESE EDITION-, 2007, 30

(1): 68.

[9] GAOX, ZHANG FX, TANGY, et al. Simos-goodson: A goodson-processor based multi-corefull-system simulator.[J]. Ruan Jian Xue Bao(Journal of Software), 2007, 18(4): 1047-1055.[10] AUSTIN T, LARSON E, ERNST D. Simplescalar: An infrastructure for computer systemmodeling[J]. Computer, 2002, 35(2): 59-67.

[11] DESIKAN R, BURGER D, KECKLER S W, et al. Sim-alpha: a validated execution driven

alpha 21264 simulator[R]. Technical Report TR-01-23, Department of Computer Sciences,University of , 2001.

[12] 许鹏. 一种应用于嵌入式系统中断控制 IP核的研究[J]. 信息技术, 2006, 30(11): 121-123.[13] BOHRER P, PETERSON J, ELNOZAHY M. Mambo: a full system simulator for the powerpcarchitecture[J]. ACM SIGMETRICS Performance Evaluation Review, 2004, 4(31): 8-12.[14] KISTLER M. Experiences in simulation at ibm[Z].

[15] ASAAD S, BELLOFATTO R, BREZZO B, et al. A cycle-accurate, cycle-reproducible

multi-fpga system for accelerating multi-core processor simulation[C]//Proceedings of theACM/SIGDA international symposium on Field Programmable Gate Arrays. 2012: 153-162.[16] CHAIX F, IOANNOU A, KOSSIFIDIS N, et al. Implementation and impact of an ultra-

compact multi-fpga board for large system prototyping[C]//2019 IEEE/ACM InternationalWorkshop on Heterogeneous High-performance Reconfigurable Computing (H2RC). IEEE,2019: 34-41.

[17] MAGNUSSON P S, CHRISTENSSON M, ESKILSON J, et al. Simics: A full system simu-lation platform[J]. Computer, 2002, 35(2): 50-58.

[18] BELLARD F. Qemu, a fast and portable dynamic translator.[C]//USENIX annual technicalconference, FREENIX Track: volume 41. Califor-nia, USA, 2005: 10-5555.

[19] CEZE L, STRAUSS K, ALMASI G, et al. Full circle: Simulating linux clusters on linux

clusters[C]//Proceedings of the Fourth LCI International Conference on Linux Clusters: TheHPC Revolution 2003. 2003.

[20] VARGAA. Omnet++[M]//Modeling and tools for network simulation. Springer, 2010: 35-59.

[21] 刘畅, 武延军, 吴敬征, 等. RISC-V 指令集架构研究综述[J]. 软件学报, 2021, 32(12):3992-4024.

[22] 王雅婕. 用于能量计量的 RISC-V处理器设计及MCU实现[D]. 浙江大学, 2020.

[23] 余振波. 基于 SystemC的粗粒度可重构通用浮点处理器设计[D]. 合肥工业大学, 2020.

[24] 邓紫珊. 基于 RISC-V的 SoC设计及其 RTOS移植[D]. 电子科技大学, 2020.

[25] MUKHERJEE S S, ADVE S V, AUSTIN T, et al. Performance simulation tools[J]. Computer,2002, 35(02): 38-39.

[26] BROOKS D, TIWARI V, MARTONOSI M. Wattch: A framework for architectural-level

power analysis and optimizations[J]. ACM SIGARCH Computer Architecture News, 2000,

28(2): 83-94.

[27] 张乾龙,侯锐,杨思博,等. 体系结构模拟器在处理器设计过程中的作用[J]. 计算机研究与发展, 2019, 56(12): 2702.

[28] 单磊. 大规模并行片上系统的分布式并行模拟关键技术研究[D]. 国防科学技术大学,2012.

[29] 喻之斌,金海,邹南海. 计算机体系结构软件模拟技术[J]. 软件学报, 2008(4): 1051-1067.[30] S.DWARKADAS, J.R.JUMP. Execution-driven simulation of mu1tiprocessors:address and

timing analysis[J]. ACM Transactions on Modeling and Computer Simulation, 1994, 4(4):314-338.

[31] 蔡启先, 郭森, 裴锋, 等. MIPS64 指令集模拟器的细化动态翻译技术[J]. 广西工学院学报, 2010, 21(4): 1-4.

[32] GUTIERREZ A, PUSDESRIS J, DRESLINSKI R G, et al. Sources of error in full-system

simulation[C]//2014 IEEE International Symposium on Performance Analysis of Systems andSoftware (ISPASS). IEEE, 2014: 13-22.

[33] 李剑慧,马湘宁,朱传琪. 动态二进制翻译与优化技术研究[J]. 计算机研究与发展, 2007,

44(1): 161.

[34] 刘晓燕. 一种 RISC处理器指令集模拟器的设计与实现[D]. 国防科学技术大学, 2014.

[35] ZHU J, GAJSKI D D. A retargetable, ultra-fast instruction set simulator[C]//Proceedings ofthe conference on Design, automation and test in Europe. 1999: 62-es.

[36] WITCHEL E, ROSENBLUM M. Embra: Fast and flexible machine simulation[C]//

Proceedings of the 1996 ACM SIGMETRICS international conference on Measurement andmodeling of computer systems. 1996: 68-79.

[37] CMELIK B, KEPPEL D. Shade: A fast instruction-set simulator for execution profiling[M]//Fast simulation of computer architectures. Springer, 1995: 5-46.