1. 绪论
2. 软件仿真器架构
3. 模块间能量信息交互
4. 能量管理模块
5. 外设行为建模
6. 测试与仿真
7. 附录：软件使用

第一章：绪论

1.1 物联网（IoT）发展情况

物联网的是近几天提出的一个新兴概念，其定义如名称所说，是将世界上各种各样的物品通过一定方式接入网络。这些物品可以包含我们日常个人生活中涉及的物品，比如说起搏器、运动鞋、体温计等等，也可以包含社会生活中涉及到的物品，比如说自动贩卖机、售货机、物流车辆等等，物联网甚至可以将一些自然界的事物通过某种方式接入网络，比如说江河中的水流。物联网可以使这些物品分享自身数据，互相协助，以便更好完成某些目标[survey]。

物联网的诞生为人们提供了新的可能性。比如说在医疗健康领域，各式各样的医疗传感器使得人们能够在自己的家中获得完整准确的身体情况信息，网络上的有关医疗健康的服务商可以根据这些身体情况对可能的问题做出预警，对于病人来说，他们能够提早发现自身的病情并尽早就医，对于健康的人，他们能够根据自身的预警信息对疾病做出预防，维持在健康状态。在物流领域，物联网使得追踪任意一辆货运车辆、任意一个包裹成为可能，物流公司能够根据这些信息获知每一个物流节点是否顺畅、哪些方向的请求更加密集等信息，这使得物流公司能够进行合理的统筹规划，提高运送效率。在自然中设置的节点也有很大的意义，比如说，山体的内部压力数据可以通过传感器联网，异常的数据可能意味着即将出现山体滑坡等灾害，通过物联网的手段，灾害预防组织能够更早获得这些信息，进行预防并减少灾害。

物联网还给人们提供新的挑战，这些挑战包含网络地址不足、安全和隐私保护、标准化问题等[survey]，但其中最为重要的是能量采集问题，这也是本文最为关注的问题。物联网中的节点有体积小、数量多、分布广泛的特点，然而常规电池并不能支持这些设备长时间工作，如果使用电池为这些设备供电，定期维护的成本将会变得十分巨大，因此很多物联网中的节点摒弃了传统电池，采用了在环境中收集所需能量的方式。这些节点收集能量的方式多种多样，有的收集太阳能，有的能够收集动能[Energy harvesting vibration sources for microsystems applications]，更多的则是收集环境中的电磁波的能量[platform]。

由于环境能量稳定度不高，随时间变化较大，这些收集环境能量的设备在工作中将频繁面临掉电，因此这些节点中应该使用有别于基于传统供能系统的能量处理技术。

1.2 非易失处理器

1.2.1 非易失处理器简介

如上文所述，收集环境中能量的系统将频繁面临断电，传统处理器在频繁开关机时是无法推进任务的，这是因为在频繁掉电时，处理器寄存器与内存中储存的数据将会完全丢失，导致处理器丢失当前状态，这种传统的处理器是不适合工作在物联网中收集环境能量的节点的。为了能够在频繁断电时还能够进行连续计算，一种新的处理器结构，非易失处理器（Non-Volatile Processors, NVPs）被提出[makaisheng]，这些处理器与传统处理器相比有如下区别：

1. 这些处理器有能量采集系统

首先，NVP是从环境中采集能量的，因此NVP中存在能量采集器，这些能量采集器是随着采集能量类型变化的，一般来说，采集装置的最外侧是将外界能量转换成能够使用的电能的器件，接下来一般接入一些整流、负载转换使得电流、电压参数能够被处理器所使用。此外，为了保证足够的时间来使得在断电时系统能够保存当前状态，NVP中往往有能量收集装置（一般是电容）来收集多余的采集到的能量，当系统面临断电时，处理器将会使用这些临时储存的能量来进行备份操作。

1. 这些处理器有状态机来控制系统状态

和传统处理器不同，NVP需要自行自动控制当前处理器的状态。一个最简单的例子是，当电量充足的时候，NVP处于工作状态，当电量不足时，NVP先进入备份状态，再进入休眠状态，当电量足够开机时，NVP进入恢复状态，接下来进入正常工作状态。当然，这个例子是理想化的，最简单的状态机模型，实际的系统中可能有更加复杂的状态转换模型。

1. 这些处理器有备份-恢复装置与策略

当发生断电时，NVP需要将当前状态备份到非易失储存器中。Flash和磁碟由于速度慢、功耗大等原因不适合作为这种低功耗、快速断电的系统的非易失存储装置。近年来有一些新兴器件，如RRAM[]，nvFF[]，能够以接近SRAM的延时存放数据，且数据不会随断电而丢失。NVP中往往有这样的非易失储存阵列，当发生断电时，系统将易失的寄存器和内存中的全部或部分数据储存在这些非易失储存器中，保证系统状态不丢失。

图【】中介绍了一个典型的非易失处理器的结构。非易失处理器有着广泛的研究空间，无论是备份方式、系统状态机设计还是能量管理模块都有很多细节值得研究，下文将会分别介绍非易失处理器的这些研究方向。

1.2.2 非易失处理器备份策略研究

尽管非易失处理器是最近几年提出的概念，但可中断计算一直是一个被研究的话题。在没有非易失处理器的时代，人们需要在传统CPU的基础上进行一些软件-硬件上的开发，以便系统能够在断电时不丢失全部工作状态，一个典型的手段是设定记录点（checkpoint）。在记录点中，CPU将会把需要备份的数据从内存和寄存器搬运到硬盘中。由于传统的处理器并不能够像非易失处理器一样能够保证在断电时有足够的时间和能量备份全部需要备份的数据，设定记录点的方式是值得研究的。[momentus]论文提出了一种设定记录点的方式，这种方式是纯软件的，[momentus]修改了LLVM编译器，使得普通程序在被编译时会被插入一些函数来决定是否进行备份，这些函数在运行时会根据现有的能量情况估算短时间内是否会发生断电，如果估计的结果为会发生断电，这些函数会触发记录点备份，这样一来，断电重启时系统将会从记录点而不是程序的最开始被启动。

[momentus]中提出的算法的不足是，运行这种算法需要特殊的编译器，需要在软件端编译时修改程序，这给软件开发带来了复杂度，而且，使用事先插入的记录点触发位置并不能保证程序的运行效率，如果触发点位置不佳可能会导致系统在重启后有较大回退，增加程序运行时间。基于这一点，文章[hibernus]提出了另外一种备份策略，这种备份策略是软件-硬件协同的，这种备份策略为系统引入了能量不足中断，当系统能量低于一定阈值时，会触发中断，这时中断处理函数将会进行备份，将系统状态保存到硬盘中，可以看出这种方式已经极为接近当今非易失处理器的备份方式了。

虽然当前非易失处理器的备份方式都是类似的，但仍然有一些细节值得被研究。在非易失处理器中，备份过程的能量消耗和时间消耗仍然是系统性能的瓶颈，如果备份过程的能量消耗过大，则系统需要有更高的掉电能量阈值，这会导致系统更经常发生开关机，降低在特定能量环境下的运行效率。非易失储存器，无论是nvSRAM，RRAM，还是nvFF备份都需要一定能量和一定延时，一种简单直观的想法就是在发生掉电时不备份全部内存，而是只备份最近被使用过的内存块（Lest Recently Used, LRU），降低备份所需能量和时间，然而，测试表明这种方式与全备份相比带来的性能提升不大[NVPsim]。在一些研究工作中描述了一种新的备份时内存块选择策略，一种死亡块预测算法（SBDP）被提出，测试表明这种算法能够有效提高备份的能量需求和时间需求[backup\_scheme]。

1.2.3 非易失处理器能量管理模块研究

1.2.4 非易失处理器与外设的交互

尽管非易失处理器能够保证在掉电发生时保存当前状态，但一旦涉及到非易失处理器与外设协同工作，情况将变得复杂，这是因为绝大部分外设是易失的，也就是说一旦在外设工作时发生断电，则需要命令外设重复工作。这种复杂性使得非易失处理器与外设的交互过程需要被研究，这方面的研究存在两个方向，第一个就是研究外设硬件的设计，使得外设硬件成为非易失的，当发生断电、掉电时不需要处理器的干涉就能自行恢复并且继续完成任务，另一个方向是研究处理器调用外设的调度方式，使得处理器能够在特定的外界能量情况下尽可能不让外设任务被断电所打断。

[hehe2015dac]是一个典型的处理NVP本身与外设协同的工作，在文章中作者将上电/掉电带来的额外时间计算在内，提出了一种调度外设工作的策略，当同一时间有很多外设任务需要完成时，合适的调度外设的策略使得系统能够在某一特定的外界能量环境下用最短的时间完成所有外设的工作。

[long-term-DAC]同样针对外设的调度问题基于一个太阳能收集节点进行了研究，然而在此文章中调度的优化目标并不是在最短时间内完成所有外设工作，而是使得更大比例的外设工作能够在断电之前完成工作，也就是优化长期的DMR（deadline miss rate）。

1.3 非易失处理器验证方式

以上所有有关非易失处理器的研究方向均有很大的研究空间，当有关非易失处理器的新技术被提出时，应该有准确、合理的手段对这些新技术的性能进行验证。比方说，在涉及非易失处理器备份策略的研究时，研究者可能会关心如下问题：当系统的备份方式从内存、寄存器全备份变为部分备份内存、寄存器时，备份所需能量会发生什么变化，备份时间占用程序运行整体时间发生怎样的变化，部分备份造成的数据缺失会产生程序运行多大的时间增加？事实上部分备份减少了备份所需要的时间，但是能量恢复后的数据缺失可能会要求处理器耗费更多时间来恢复这些数据。这是一个极为复杂的问题，涉及处理器运行的很多方面，外界能量收集情况、处理器运行程序种类可能均会对最终的结果产生影响，这些影响很难通过一个特定的公式来定量描述。因此，仿真是验证新技术性能的主要手段。

由于非易失处理器诞生较晚，非易失处理器的仿真是一个崭新的研究方向，非易失处理器的仿真往往比较原始，即设计好电路再在电路的基础上进行验证。此外，近年来诞生了少许非易失处理器的仿真软件，比如说基于gem5实现的非易失处理器仿真软件NVPsim[1]。下文会分别介绍电路级仿真以及NVPsim仿真器。

1.3.1 电路级仿真

顾名思义，电路级仿真就是用一些硬件描述语言设计好电路，并使用一些特定的数字电路仿真软件对设计出的数字电路进行仿真。这是一种通用的办法，适用于一切数字电路，非易失处理器也不例外。目前多数有关于非易失处理器的研究基于这种仿真方法，研究者已有一个非易失处理器原型（多数为实验室开发的示例平台），实现其提出功能的硬件电路设计，集成到已有的实验平台上，并使用硬件仿真工具（如Modelsim[2]）进行仿真。

1.3.2 NVPsim

Gem5提供了一个高自由度、配置方便的处理器体系架构仿真平台[3]，在此基础上，Gu et. al.拓展了Gem5的功能，为Gem5提供了仿真处理器、内存在外界能量变化时行为的功能[1]。NVPsim的作者使用NVPsim对使用不同种类非易失储存器、不同备份策略的非易失处理器进行了仿真，并得出了非易失储存器和备份策略对处理器效率影响的一些结论。

NVPsim基于Gem5的TimingSimpleCPU模型，加入了电压检测模块、系统状态机、备份/恢复模块，并对Gem5事件队列的管理模块进行了一些修改。这些对Gem5的增补使得NVPsim能够仿真非易失处理器在特定外界能量条件下的性能。

NVPsim在系统运行过程中，通过Power Trace文件获取外部能量收集情况，并随时追踪系统的各个模块耗电情况，当能量不足时，系统状态机告知事件队列暂停当前的工作，并通过备份/恢复模块对需要备份的数据进行备份。当关机系统收集够充足能量时，系统状态机告知事件队列继续运行，并通过备份/恢复模块对内存、寄存器中得到备份的数据进行恢复。NVPsim在仿真过程中主要的关注点在于备份、恢复所需的能量和时间，在备份、恢复模块对能量和所需时间进行集中计算，而系统在上电、掉电时的行为主要是由事件队列管理模块完成的。NVPsim相比电路级仿真能够大大降低仿真的难度。

1.4 当前验证方式的不足

无论是电路级仿真还是使用NVPsim仿真软件进行仿真均存在不足之处，本部分会分别分析二者的不足。

1.4.1 电路级仿真的缺陷

虽然电路级仿真有着仿真结果准确、与实际系统误差几乎可以忽略不计等优点，但是这种仿真方式过于通用，并没有对非易失处理器进行专门的设计，因此，这种仿真方式给使用者造成了巨大的不便，极大增加了仿真的工作量。以下为电路级仿真的缺陷：

**高门槛**

首先，电路级仿真需要有完整的非易失处理器电路设计才能够完成。研究者为了研究非易失处理器中某一些特定部分的行为，往往需要拥有整个非易失处理器的电路设计。当前非易失处理器问题的研究者通常需要研究小组前期对电路设计有所准备。为了探索NVP的特定部分，研究过程为：

非易失处理器原始平台设计（prototype）-原始平台仿真、流片-修改原始平台需要研究的部分-测试、仿真

这使得世界上只有少数拥有NVP原始平台（prototype）的研究小组有能力对非易失处理器技术进行研究，大大增大了非易失处理器研究的入门门槛。

我们可以将其与传统处理器体系架构的研究进行对比，传统处理器有一些通用、公开的设计，并有着大量方便的仿真工具，在对体系架构进行研究时，研究者实际上并不需要拥有完整的处理器电路设计。

**配置不方便**

在使用电路级仿真时，任何微小的修改往往都会对电路设计产生巨大的影响，研究者为了探索新技术时往往需要深入硬件描述代码并进行大量修改。仍以掉电时内存备份策略研究为例，为了将系统在掉电时的备份方式从全备份改为部分备份，通常来说硬件描述语言中整个备份模块都需要被重写，备份方式的改变还会对电路的其他部分造成影响，比如说备份/恢复需要的线路宽度可能会发生变化。

在探索非易失系统中的新技术时，研究者并不希望微小的修改牵涉出复杂、混乱的系统变化，而是希望仅仅修改一些参数就能够对新技术的性能进行仿真，显然电路级仿真并不能做到这一点。

**仿真时间过长**

在使用电路级仿真时，仿真软件需要模拟出系统的每一个引脚在每一时刻的信号值，这会使仿真的时间开销变得巨大。而非易失处理器是非常复杂的电路，有着大规模集成芯片的等级，此外，为了能够获得准确的仿真结果，仿真使用的测试程序（benchmark）所需周期数往往不低。

非易失处理器仿真的这些特点会进一步增加仿真所需的时间，使得每一次电路级仿真的时间变得难以忍受。而电路级仿真的优点——对电路细节描述的全面与准确往往并不是被关注的对象，研究者关注的可能仅仅是运行测试程序（benchmark）所需要的时间和能量效率。

**软硬件接口复杂**

使用电路级仿真时，被仿真的对象是硬件本身，缺少一个简单、易用的软硬件接口，因此，使电路级仿真运行研究者关心的测试程序（benchmark）往往会消耗额外的时间。当前已有的非易失处理器使用的并不是大规模商业化的架构（如x86、ARM），比如说THU1010n非易失处理器芯片使用的是8051架构[4]，这些架构可能存在一些编译器，但并没有针对非易失平台特殊编写的编译器，因此研究者在电路仿真中运行特定程序往往需要手动或者用一些工具将程序翻译成机器语言并以硬件的形式写入硬件描述语言中，这显然是十分复杂的。

在理想情况下，使用高级语言（如C）编写的程序就能够运行在仿真平台上，这会大大降低仿真非易失处理器行为的难度，然而电路级仿真并不能够支持这一点。

1.4.2 NVPsim的缺陷

NVPsim继承了gem5仿真平台的一些特点，因此避免了上述电路级仿真带来的不足。比如说NVPsim像gem5一样支持运行ARM、x86等流行的程序，这使得用户能够使用高级语言编写测试程序（benchmark）并使其运行在仿真平台上。NVPsim也忽略了电路中过于细节的部分，只描述系统模块的行为，这大大增加了NVPsim的仿真速度。NVPsim还使得用户能够通过修改少量仿真参数直接改变目标非易失处理器的行为，降低了仿真的配置难度。

然而，NVPsim仍然存在着一些不足，使得其并不能成为一个广泛使用的非易失处理器仿真平台。NVPsim存在着如下不足：

**对硬件的能量行为描述不自由**

NVPsim对系统的行为采用了“集中式”管理办法，并没有对每一个模块分别编写在系统状态发生变化（上电、掉电）时的行为。NVPsim在系统状态发生改变时改变模块行为方式的唯一渠道是事件队列管理模块，当系统发生掉电时，事件队列管理模块读取gem5的事件队列，将所有事件暂停，这样一来系统就停止了运行，而当系统发生上电时事件队列管理模块再将所有事件重新调度使得系统恢复运行。

这种对掉电、上电的建模方式虽然有效，但是缺少对硬件在系统状态改变时行为描述的自由度。NVPsim将系统中所有的掉电、上电时的行为描述都集中在了一起，在上/掉电时只对系统整体的事件队列进行操作，而不对每个模块分别进行操作，这样一来所有的模块在系统状态变化时都表现出了相同特性：暂停运行。

事实上，每一个模块在系统状态改变时的行为是不同的，易失的模块应该丢弃当前内部的所有状态，非易失模块应该保持内部状态不变，而另一些模块比如说电压检测模块、系统状态机模块应该继续工作，不受掉电、上电的影响，显然NVPsim对这样行为的描述是不足的。

**对正确性验证的先天不足**

上文描述了NVPsim的工作流程和对掉电、上电的建模方式，这种建模方式仅仅暂停了硬件触发的所有事件，实际上默认了所有模块都是“非易失”的，也就是说，掉电时所有模块的内部状态都没有发生改变，仅仅是暂停运行而已。NVPsim并没有提供对硬件易失性的描述，也没有为编写者提供描述硬件易失性的接口。

实际上非易失系统中还是存在某些易失模块的，比如说CPU内的寄存器或者传统的内存模块再掉电时应该丢失储存的全部数据。这一点不足使得NVPsim只能描述非易失系统的运行时间、消耗能量等信息，而并不能描述非易失系统在掉电-上电过程中运行结果是否正确。

**对外设缺少描述**

一般来说，非易失系统都是从环境中获取电能，会经常面临电力不足，而且获取的电能十分有限，因此非易失系统一般并不适合做大量计算（只涉及处理器、内存），相反，非易失系统的工作任务常常是作为终端节点收集环境中的数据并发送给服务端（这种工作任务设计处理器，内存， 以及传感器与网卡等外设）。因此，对于非易失处理器和外设的交互行为的仿真往往是仿真器功能的重中之重。遗憾的是，NVPsim并没有对外设进行合理有效的仿真。

NVPsim基于gem5的Syscall Emulation（SE）模式，在这样一种模式下gem5并不提供任何外设功能，而是将程序运行中产生的对外设的请求（一般包含在系统调用，system call中）直接发送给仿真器运行所在的系统（linux）。这样一来，在使用NVPsim的过程中，用户只能够仿真处理器和内存的行为而不能触及外设，在某种程度上这使得NVPsim有着巨大的局限性，应用场景不足。

**扩展性较弱**

从工程的角度来说，NVPsim并不像gem5本身一样有着良好的可扩展性，这是由于NVPsim并没有对所有模块在掉/上电的行为进行通用的建模并进行合理的分层抽象，而是将整个系统掉、上电行为直接通过修改底层事件队列管理代码来进行描述。当用户需要和NVPsim不同的系统建模时，NVPsim并不能提供有效的接口让用户方便地修改、扩展系统的行为，用户在这种情况下需要大量阅读了解底层代码，十分不便。在这个意义上NVPsim更像是一种特定的非易失处理器的“专用仿真器”，而不是一个通用的仿真平台。

1.5 毕业设计内容

本次毕业设计的任务是基于gem5设计一种非易失系统的仿真框架（或仿真平台）：gem5-NVP，从而解决上文提到的当前仿真方式的不足。此仿真框架设计有如下目标：

1. 对所有模块在系统状态改变时的行为有通用的接口

这需要每一个模块都能够通过重定义相同的接口函数来完成对这个模块掉/上电行为的建模，且用户可以像添加gem5模块一样简便地添加gem5-NVP的模块，仅仅需要定义模块在系统状态发生变化时的行为。这个目标主要针对的是仿真框架中模块行为描述的自由性和仿真框架的可扩展性。

1. 支持外设的仿真，且易于从代码中调用

这个目标要求仿真平台中存在可以在gem5仿真器SE模式下使用的外设模块，且这个模块要能够方便地被用户编写的测试程序（benchmark）调用，不牺牲编写benchmark的简易度。

1. 易于配置，使用户远离复杂的底层代码

这个目标要求仿真框架中的一些参数、模块能够像gem5中的参数、模块一样通过简单的python配置文件进行配置。

为了完成以上目标，本次毕业设计的主要工作任务有：

1. 对gem5的所有模块的底层通用类进行重写，使得所有模块都获取描述有关能量行为的接口。
2. 为gem5添加模块间的有关能量的“连线”，即Energy Port，这使得能量本身和有关能量的系统状态控制流（上电、断电请求）能够在模块间传递。此外，用户应该能够在python配置文件中方便地连接这些连线（类似gem5的内存系统中的Port）。
3. 添加能量管理模块，这是一个非易失仿真器所必须的，这个能量管理模块要负责能量采集、系统状态管理、能量检测。
4. 添加仿真器的外设模块，这个外设模块需要能够在SE模式下运行，且可以使用高级语言非常方便地调用。
5. 基于此仿真平台对各种非易失系统进行建模、测试（比如不涉及外设的计算系统、涉及外设的信息采集系统、涉及外设的信息发送系统）。

第二章：软件仿真器架构

2.1 软件采取的NVP整体架构

2.2 Gem5类继承关系

2.3 为Gem5的仿真模块引入能量相关功能

2.4 能量事件

2.5 Python控制端

第三章：模块间能量信息交互

3.1 “能量接口”

3.2 能量信息

3.3 接口连接方式

第四章：能量管理模块

第五章：外设行为建模

第六章：测试与仿真

参考文献

[1] Gu, Yizi, et al. "NVPsim: A simulator for architecture explorations of nonvolatile processors." *Design Automation Conference (ASP-DAC), 2016 21st Asia and South Pacific*. IEEE, 2016.

[2] Graphics, Mentor. "ModelSim." (2007).

[3] Binkert, Nathan, et al. "The gem5 simulator." *ACM SIGARCH Computer Architecture News* 39.2 (2011): 1-7.

[4] Wang, Yiqun, et al. "A 3us wake-up time nonvolatile processor based on ferroelectric flip-flops." *ESSCIRC (ESSCIRC), 2012 Proceedings of the*. IEEE, 2012.