# 存储器架构

### 存储系统

- 对许多应用来说,存储系统对整个系统性能的影响比对数据流水线的影响更大
- 复杂:
  - 在同一个嵌入式系统中,通常需要组合各种存储技术
    - 至少需要一些非易失性存储和一些易失性存储
    - 多种选择
  - 层次结构往往是必须的
  - 处理器架构的地址空间被分解成若干子空间来提供不同类型的存储器访问

#### 易失性存储器

- 断电时内容消失的存储器
- 随机存取存储器(RAM)
  - SRAM
    - 静态RAM, SRAM
      - 速度快,面积大
    - 动态RAM, DRAM
      - 保持数据的时间很短,需要定期刷新
      - 比SRAM更不稳定

#### 在嵌入式系统中的应用

- 大多数嵌入式系统都包括一个SRAM,许多ES也会包括 DRAM
  - 因为只利用SRAM不能提供足够大的存储容量
- 影响程序执行时间
  - 被访问的存储器地址是映射到SRAM还是DRAM
  - DRAM可能在忙于刷新时被请求访问,因此DRAM刷新周 期会引起访问时间的变化
  - 访问历史也可以影响存取时间

#### 非易失性存储器

- 不需要持续供电来保留存储在计算设备中的数据或程序代码。
  - 只读存储器(ROM),或掩模ROM(Mash ROM):内容在芯片工厂就已经固定
  - 电可擦除可编程ROM(EEPROM)
  - 快闪存储器(Flash)
  - 磁盘存储器

## 固件(Firmware)

- 固件(firmware)一般存储于设备中的电可擦除只读存储器 EEPROM(Electrically Erasable Programmable ROM)或FLASH 芯片中,一般可由用户通过特定的刷新程序进行升级的程序。
- 可固化(ROMable):可被编程到ROM芯片中的机器语言。作为 "只读"芯片不能更新,可固化程序必须使用RAM或磁盘来保存变 化的数据。
  - 代码将从ROM正确执行
    - 不需要复制到RAM,但是RAM可能更快
  - 代码和数据不能混用
    - 除了常量数据

#### Flash

- 有比较快的读取时间,但比SRAM和DRAM慢
  - 频繁访问的数据在程序使用之前从flash转移到RAM中
- 写入时间大大超过读取时间,而且写入的次数是有限的
  - SLC: 速度快寿命长,存储密度低稳定性好,成本高,约10万次擦写寿命,多数应用高端企业级产品
  - MLC:速度一般寿命一般,成本一般,约3000—10000次擦写寿命,应用民用中高端SSD上
  - TLC,速度慢,成本最低,使用寿命也最短,约1000次擦写寿命

#### 类型

- NOR
  - 按块擦除
  - 擦除和写入时间较长,但能够像RAM那样访问
- NAND
  - 以块为单位,一个数据块是数百或数干比特
  - 擦除和写入速度比较快
  - 按页读取(512-4K字节)

### NOR与NAND flash的对比

|                        | NAND | NOR  |
|------------------------|------|------|
| 主要应用                   | 文件存储 | 代码执行 |
| 存储容量                   | 高    | 低    |
| 每比特成本                  | 低    |      |
| 动态功耗                   | 低    |      |
| 待机功耗                   |      | 低    |
| 写入速度                   | 快    |      |
| 读取速度                   |      | 快    |
| eXecute In Place (XIP) | 不支持  | 支持   |
| 可靠性                    |      | 高    |

https://en.wikipedia.org/wiki/Flash memory#Distinction between NOR and NAND flash



#### 存储器层次结构

- 精确的分层机构取决于技术参数,也取决于应用领域
  - 处理器寄存器
  - 工作存储器(或主存储器、主存):实现了处理器存储地址所涵盖的存储器。通常,其容量在几MB到几GB之间,并且是易失的
  - 缓冲存储器:高速缓存、地址转换高速缓存(TLB,也称快表)以及暂存存储器(SPM)。
  - flash、磁盘等非易失性存储,也可基于互联网的存储器解决方案 (如云)

#### cache

- 高速缓存的架构对应用程序的执行时间具有很大影响
- 高速缓存潜在地提高了存储系统的能效。
- 在设计时预测缓存是否命中是很困难的,并且这对实时性能的精确预测而言也是一个负担。



## 多级cache



- $\bullet$  h<sub>1</sub> = cache hit rate.
- $\bullet$  h<sub>2</sub> = hit rate on L2.
- Average memory access time:
  - $t_{av} = h_1 t_{L1} + h_2 t_{L2} + (1 h_2 h_1) t_{main}$

## 暂存存储器

- SPM,也叫紧耦合内存TCM
- SPM和主存统一编址,每当某个简单的地址解码器给出一个 SPM地址范围内的地址时,SPM就被访问
- SPM通常和处理器集成在一个芯片上
- 功耗低、速度快

### 存储器访问时间难以预测

- 虚拟存储器(Virtual Memory): 使各种存储技术看起来是一个连续的地址空间
- 地址转换: 把地址空间的逻辑地址转换成一种存储技术上的物理地址,转换通常是由一个专门硬件协助完成,称为转换后备缓冲器(Translation Lookaside Buffer, TLB),加速地址转换
- 因此,很难预测或理解访问存储器的时间需要多久,因而嵌入式系统设计人员通常比一般程序员需要更深入地理解存储器系统