# 玄铁 E902 集成手册 (opene902)

2021年10月18日

#### Copyright 2021 T-Head Semiconductor Co., Ltd.

Licensed under the Apache License, Version 2.0 (the "License"); you may not use this file except in compliance with the License. You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreed to in writing, software distributed under the License is distributed on an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the License for the specific language governing permissions and limitations under the License.

# 版本历史

| 版本 | 描述              | 日期         |
|----|-----------------|------------|
| 01 | opene902 第一版发布。 | 2021.10.18 |

# 文档编号

平头哥半导体技术文档类编号采用如下所示规则: 产品名称-产品型号-产品版本号-文档类型。

# 目录

| 第一章 | 概述                        | 1  |
|-----|---------------------------|----|
| 1.1 | 适用范围                      | 1  |
| 1.2 | 处理器简介                     | 1  |
| 1.3 | opene902 的当前配置            | 2  |
| 1.4 | 处理器集成总览                   | 2  |
| 1.5 | 玄铁 E902 IP 数据包介绍          | 3  |
|     | 1.5.1 玄铁 E902 IP 包的环境要求   | 3  |
|     | 1.5.2 E902 RTL 代码的文件结构    | 4  |
| 第二章 | 端口信号总览                    | 5  |
| 2.1 | 命名规则                      | 6  |
| 2.2 | 端口信号列表                    | 6  |
| 第三章 | 时钟复位集成                    | 14 |
| 3.1 | 端口列表                      | 14 |
| 3.2 | 时钟信号                      | 16 |
|     | 3.2.1 E902 时钟域            | 16 |
|     | 3.2.2 调频操作                | 16 |
| 3.3 | 多时钟域信号同步                  | 17 |
|     | 3.3.1 CPU 内核时钟域与系统总线时钟域   | 17 |
|     | 3.3.2 CPU 内核时钟域与 JTAG 时钟域 | 17 |
| 3.4 | 复位信号                      | 17 |
|     | 3.4.1 复位后进调试              | 18 |
| 第四章 | 总线系统集成                    | 20 |
| 4.1 | 总线简介及配置信息                 | 20 |
| 4.2 | 系统总线接口                    | 21 |
| 4.3 | 指令总线接口                    | 24 |
| 第五章 | 中断系统集成                    | 27 |
| 5.1 | 中断处理过程简述                  | 27 |
| 5.2 | 端口列表                      | 27 |
| 5.3 | 中断握手时序图                   | 28 |

| 5.4 | 中断嵌套         | 29 |
|-----|--------------|----|
| 5.5 | 计时器中断        | 29 |
| 第六章 | 调试系统集成       | 30 |
| 6.1 | 端口列表         | 31 |
| 6.2 | JATG 接口      | 32 |
| 第七章 | 低功耗系统集成      | 33 |
| 7.1 | 端口列表         | 33 |
| 7.2 | 工作模式及其转换     | 33 |
| 7.3 | 进入低功耗模式握手    | 33 |
| 7.4 | 退出低功耗模式握手    | 35 |
| 7.5 | 浅睡眠          | 35 |
| 7.6 | 深睡眠          | 35 |
| 第八章 | CPU 运行观测信号集成 | 37 |
| 8.1 | 简介           | 37 |
| 8.2 | 通用观测信号       | 38 |
| 8.3 | 观测信号示例波形     | 38 |
| 第九章 | 地址空间属性设置     | 4( |

## 第一章 概述

### 1.1 适用范围

本文档适用于平头哥半导体有限公司的玄铁系列 CPU E902。

## 1.2 处理器简介

玄铁 E902 是平头哥半导体有限公司自主研发的极低功耗、极低成本嵌入式 CPU 核,以 8 位 CPU 的成本获得 32 位嵌入式 CPU 的运行效率与性能。E902 兼容 RISC-V 指令架构,采用 16/32 位混合编码系统,指令系统与流水线硬件结构精简高效,具备极低成本、极低功耗和高代码密度等优点。E902 主要针对智能卡、智能电网、低成本微控制器、无线传感网络等嵌入式应用。



图 1.1: E902 系统框图

E902 处理器体系结构的主要特点如下:

- 32 位 RISC 处理器;
- 支持 RISC-V RV32E[M]C 指令集;
- 支持 RISC-V 32/16 位混编指令集;
- 16 个 32 位通用寄存器;



- 两级顺序执行流水线;
- 支持 RISC-V 机器模式和用户模式;
- 多周期硬件除法器;
- 兼容 RISC-V CLIC 中断标准, 支持中断嵌套;
- 支持 AHB-Lite 总线协议,支持指令总线,系统总线;
- 支持平头哥扩展编程模型;
- 支持复位启动地址硬件集成时可配置;
- 支持软复位操作。

## 1.3 opene902 的当前配置

E902 的当前固定配置如表 1.1 所示。

表 1.1: E902 的当前配置

| 可配置单元    | 配置选项              | opene902 的配置 |
|----------|-------------------|--------------|
| 指令集      | RV32EC/RV32EMC    | RV32EMC      |
| 指令 cache | 无 /2KiB/4KiB/8KiB | 无            |
| 硬件乘法器    | No/Fast/Small     | Small        |
| 内存保护单元   | 0/2/4/8/16        | 8            |
| CLIC     | 中断源: 1-240 任意可配   | 64/3         |
|          | 中断优先级有效位: 2-5     |              |
|          | 位任意可配             |              |
| 硬件断点数量   | 4/8               | 4            |

## 1.4 处理器集成总览

E902 的集成按照功能可以分为以下六大系统,可以按照功能逐个系统进行集成:

#### 1. 时钟复位集成

时钟复位集成介绍了 E902 处理器中 CPU 核与调试单元(HAD)的输入时钟以及复位信号;同时介绍了 CPU 核与 HAD 以及总线系统之间信号同步逻辑。

#### 2. 总线系统集成

总线系统集成介绍 2 条总线接口,包括:系统总线接口和指令总线接口。

#### 3. 中断系统集成

中断系统集成介绍与 E902 处理器中断处理相关的信号以及信号握手机制。



#### 4. 调试系统集成

调试系统集成介绍调试相关的 JTAG 接口信号和其它调试辅助信号接口。

#### 5. 低功耗系统集成

低功耗系统集成介绍 E902 低功耗相关的接口信号以及 E902 低功耗模式与正常工作模式之间的 转换关系,具体包括了: CPU 进入和退出低功耗模式时的状态转换,进入和退出低功耗模式相关信号的握手时序以及处理器处于低功耗模式被唤醒的流程。

#### 6.CPU 运行观测信号集成

CPU 运行观测信号集成介绍 SoC 仿真阶段所需的 CPU 运行状态的观测信号。

#### 7. 地址空间属性配置

系统设计人员需要通过设置 sysmap.h 文件完成对不同地址空间属性的设定。

### 1.5 玄铁 E902 IP 数据包介绍

玄铁 E902 IP 包由以下两部分组成: 1) E902 固定功能配置的 RTL 代码。2) E902 Smart 平台,提供了 E902 的参考集成设计、仿真环境和测试用例等,帮助熟悉 E902 的功能和使用方法,并辅助 E902 的集成工作。功能包括:

- E902 的参考集成设计;
- 丰富的测试用例: 1) 与 E902 相关的 firmware 参考代码,包括 E902 的最佳性能设置、中断/异常处理,低功耗处理流程等; 2) 帮助客户对 E902 的集成的正确性做检查;
- 基础的软硬件仿真环境;
- E902 RTL 代码 lint 流程及 waive 文件;
- 后端综合实现的参考 SDC 约束文件;

#### 1.5.1 玄铁 E902 IP 包的环境要求

在使用玄铁 E902 IP 包之前,请检查并确保运行环境备以下条件:

- 玄铁 E902 IP 中的 perl 脚本依赖 perl 5.10.1 或以上版本;
- Make 版本为 3.8.1;
- EDA 仿真工具: Icarus Verilog (iverilog) 10.2, Synopsys VCS 2019.09 及以上版本,或者 Cadence irun 18.03 及以上版本;
- Smart 平台编译测试用例依赖的平头哥玄铁处理器 RISC-V 工具链 2.0.3 及以上版本;



#### 1.5.2 E902 RTL 代码的文件结构

#### E902 RTL 代码的文件结构说明

E902 RTL 代码都在 gen\_rtl 目录下,内容如下:

cpu 文件夹: E902 顶层 RTL 模块等,如 openE902.v。

filelist 文件夹: E902 RTL 文件列表。

E902 各子模块 RTL: 包含了包括 E902 绝大多数模块的 RTL 文件。

## 第二章 端口信号总览

E902 处理器支持 AHB\_Lite 总线接口协议。在平头哥的多款玄铁处理器中,均保持了稳定的延续性,以方便 E902 的升级换代。根据 E902 顶层端口信号的特点,划分为时钟复位信号,总线系统信号,中断系统信号,调试系统信号,低功耗系统信号,DFT 系统信号,CPU 运行观测信号等几大类。



图 2.1: E902 CPU 系统接口总体描述



## 2.1 命名规则

表 2.1: 信号命名规则

| 信号名前缀       | 描述       |
|-------------|----------|
| pad_biu_*   | 输入信号。    |
| pad_bmu_*   |          |
| pad_clic_*  |          |
| pad_cpu_*   |          |
| pad_had_*   |          |
| pad_iahbl_* |          |
| pad_sysio_* |          |
| pad_yy_*    |          |
| biu_pad_*   | 输出信号。    |
| cp0_pad_*   |          |
| had_pad_*   |          |
| iahbl_pad_* |          |
| iu_pad_*    |          |
| sysio_pad_* |          |
| *_b         | 低电平有效信号。 |

一般来说,没有特殊规定,E902 的输入输出信号均为高电平有效,但是注意,如果是以"\_b"结尾的信号,则是低电平有效。

## 2.2 端口信号列表

表 2.2: 端口信号列表

| 信号名       | I/O | Reset | 时钟域 | 内部门级<br>数 | 功能描述          |
|-----------|-----|-------|-----|-----------|---------------|
| 时钟复位信号集成: |     |       |     |           |               |
| 状态和时钟信号:  |     |       |     |           |               |
| pll_cor   | I   | -     | -   | < 5       | CPU 工作时钟信号:   |
|           |     |       |     |           | 提供 CPU 工作的时钟。 |

下页继续



表 2.2 - 续上页

| D 17 6                 |     |       | 2.2 - |      | A CICILIAN            |
|------------------------|-----|-------|-------|------|-----------------------|
| 信号名                    | I/O | Reset | 时钟域   | 内部门级 | 功能描述                  |
|                        |     |       |       | 数    |                       |
| pad_had_jtg_tclk       | I   | -     | -     | <5   | JTAG 测试时钟信号:          |
|                        |     |       |       |      | JTAG 和 HAD 内部相关寄      |
|                        |     |       |       |      | 存器的时钟信号,正常工作时         |
|                        |     |       |       |      | 要求该时钟的工作频率小于          |
|                        |     |       |       |      | CPU 时钟频率的二分之一。        |
|                        |     |       |       |      | 注:该信号在测试模式            |
|                        |     |       |       |      | (pad_yy_test_mode) 下作 |
|                        |     |       |       |      | 为 E902 内所有逻辑的输入时      |
|                        |     |       |       |      | 钟。                    |
| 复位控制信号:                |     |       |       |      |                       |
| pad_cpu_rst_b          | I   | -     | CPU   | 7    | 处理器复位信号:              |
|                        |     |       |       |      | 低电平时,复位 CPU; CPU      |
|                        |     |       |       |      | 采用异步复位、同步释放的方         |
|                        |     |       |       |      | 式。                    |
|                        |     |       |       |      | 注意:要求系统将 CPU 复        |
|                        |     |       |       |      | 位信号同步到 CPU 时钟域,       |
|                        |     |       |       |      | CPU 内部不进行同步操作。        |
| pad_had_rst_b          | I   | -     | CPU   | <5   | 调试模块复位信号:             |
|                        |     |       |       |      | 低电平时,复位调试模块,调         |
|                        |     |       |       |      | 试模块采用异步复位、同步释         |
|                        |     |       |       |      | 放的方式。                 |
|                        |     |       |       |      | 注意: 要求系统将 HAD 复       |
|                        |     |       |       |      | 位信号同步到 CPU 时钟域,       |
|                        |     |       |       |      | CPU 内部不进行同步操作。        |
| pad_had_jtg_trst_b     | I   | -     | JTAG  | <5   | JTAG 测试复位信号:          |
|                        |     |       |       |      | 两线 JTAG 接口逻辑复         |
|                        |     |       |       |      | 位信号、低电平有效。该           |
|                        |     |       |       |      | 信号还用做测试模式下            |
|                        |     |       |       |      | (pad_yy_test_mode=1)  |
|                        |     |       |       |      | E902 内所有逻辑的复位。        |
| pad_cpu_rst_addr[31:0] | I   | -     | CPU   | -    | 32 位复位启动地址, bit[1:0]  |
|                        |     |       |       |      | 需为 0                  |
|                        | 1   | 1     |       |      |                       |



表 2.2 - 续上页

|                       |     |        | : 2.2 - 绥上リ |           | T .                                              |
|-----------------------|-----|--------|-------------|-----------|--------------------------------------------------|
| 信号名                   | 1/0 | Reset  | 时钟域         | 内部门级<br>数 | 功能描述                                             |
| cpu_pad_soft_rst[1:0] | 0   | 2 'b00 | CPU         | 30        | <br>  软复位指示信号,模式如下:                              |
| cpu_pau_sort_rst[1.0] |     | 2 500  |             | _         | <del>1                                    </del> |
|                       |     |        |             |           | 2'b00.                                           |
|                       |     |        |             |           | 2' b10: 复位系统                                     |
|                       |     |        |             |           | 2   b10. 复位示机                                    |
|                       |     |        |             |           | 2   511.                                         |
|                       |     |        |             |           | 实现复位操作,需要 SoC 设                                  |
|                       |     |        |             |           | 计人员依据相关信号复位相                                     |
|                       |     |        |             |           | 关逻辑,该信号保持一个 cpu                                  |
|                       |     |        |             |           | 时钟周期有效                                           |
| 动态调频信号:               |     |        |             |           | F1 11 / F1 / Y1 F1 / X                           |
| pad_cpu_dfs_req       | I   | -      | CPU         |           | 系统向 CPU 发起的动态调频                                  |
|                       |     |        |             |           | 请求信号                                             |
| cpu_pad_dfs_ack       | О   | -      | SYS         |           | CPU 因应系统的动态调频请                                   |
|                       |     |        |             |           | 求,发出的调频准备操作完成                                    |
|                       |     |        |             |           | 信号。系统设计人员在看到该                                    |
|                       |     |        |             |           | 信号为高时可以开始 CPU 的                                  |
|                       |     |        |             |           | 调频操作。                                            |
| 总线系统集成:               |     |        | •           |           |                                                  |
| pad_bmu_iahbl_base    | I   | -      | -           | <5        | 指令总线地址空间基地址                                      |
| pad_bmu_iahbl_mask    | I   | -      | -           | <5        | 指令总线地址空间掩码                                       |
| 系统总线接口信号:             | ·   |        | •           | •         |                                                  |
| pad_biu_hrdata[31:0]  | I   | -      | CPU         | 26        | 读取数据信号                                           |
| pad_biu_hresp         | I   | -      | CPU         | 30        | 传输应答信号                                           |
| pad_biu_hready        | I   | -      | CPU         | 30        | 外部空闲信号                                           |
| biu_pad_haddr[31:0]   | О   | -      | CPU         | 25        | 地址信号                                             |
| biu_pad_htrans[1:0]   | О   | -      | CPU         | 35        | 传输类型信号                                           |
| biu_pad_hsize[2:0]    | О   | -      | CPU         | 22        | 传输尺寸指示信号                                         |
| biu_pad_hburst[2:0]   | О   | -      | CPU         | <5        | 突发传输指示信号                                         |
| biu_pad_hwdata[31:0]  | О   | -      | CPU         | 7         | 写传输数据信号                                          |
| biu_pad_hwrite        | О   | -      | CPU         | 18        | 读写传输指示信号                                         |



表 2.2 - 续上页

| 信号名                    | I/O | Reset | 时钟域 | 内部门级 | 功能描述                  |
|------------------------|-----|-------|-----|------|-----------------------|
|                        |     |       |     | 数    |                       |
| biu_pad_hprot[3:0]     | О   | -     | CPU | 28   | 保护控制信号:               |
|                        |     |       |     |      | 指示当前总线周期进行的数          |
|                        |     |       |     |      | 据传输的特性:               |
|                        |     |       |     |      | ***0: 取指令;            |
|                        |     |       |     |      | ***1:数据访问;            |
|                        |     |       |     |      | **0*: 用户模式访问;         |
|                        |     |       |     |      | **1*: 机器模式访问;         |
|                        |     |       |     |      | *0**: Non bufferable; |
|                        |     |       |     |      | *1**: bufferable;     |
|                        |     |       |     |      | 0***: Non cacheable;  |
|                        |     |       |     |      | 1***: cacheable.      |
| 指令总线接口信号:              |     |       |     |      |                       |
| pad_iahbl_hrdata[31:0] | I   | -     | CPU | 26   | 读取数据信号                |
| pad_iahbl_hresp        | I   | -     | CPU | 30   | 传输应答信号                |
| pad_iahbl_hready       | I   | -     | CPU | 30   | 外部空闲信号                |
| iahbl_pad_haddr[31:0]  | О   | -     | CPU | 25   | 地址信号                  |
| iahbl_pad_htrans[1:0]  | О   | -     | CPU | 35   | 传输类型信号                |
| iabhl_pad_hsize[2:0]   | О   | -     | CPU | 22   | 传输尺寸指示信号              |
| iabhl_pad_hburst[2:0]  | О   | -     | CPU | <5   | 突发传输指示信号              |
| iahbl_pad_hwdata[31:0] | О   | -     | CPU | 7    | 回写数据信号                |
| iahbl_pad_hwrite       | О   | -     | CPU | 18   | 写传输信号                 |
| iahbl_pad_hprot[3:0]   | О   | -     | CPU | 28   | 保护控制信号:               |
|                        |     |       |     |      | 指示当前总线周期进行的数          |
|                        |     |       |     |      | 据传输的特性:               |
|                        |     |       |     |      | ***0: 取指令;            |
|                        |     |       |     |      | ***1:数据访问;            |
|                        |     |       |     |      | **0*: 用户模式访问;         |
|                        |     |       |     |      | **1*: 机器模式访问;         |
|                        |     |       |     |      | *0**: Non bufferable; |
|                        |     |       |     |      | *1**: bufferable;     |
|                        |     |       |     |      | 0***: Non cacheable;  |
|                        |     |       |     |      | 1***: cacheable.      |
| 中断系统集成:                |     |       |     |      |                       |



表 2.2 - 续上页

| 表 2.2 - 续上页                      |     |       |     |        |                                                                                                                            |  |
|----------------------------------|-----|-------|-----|--------|----------------------------------------------------------------------------------------------------------------------------|--|
| 信号名                              | I/O | Reset | 时钟域 | 内部门级 数 | 功能描述                                                                                                                       |  |
| pad_clic_int_vld[i-1:0] i: 1~240 | I   | -     | CPU | 9      | CLIC 中断控制器中断源请求信号:高电平时表示该中断源发起中断申请。注意:1、要求系统将该信号同步到 CPU 时钟域,CLIC 内部不进行同步操作。2、E902                                          |  |
| pad_cpu_ext_int_b                | I   | -     | SYS | <5     | 最多支持 240 个外部中断。<br>CPU 中断请求信号:<br>低电平时表示外部中断控制<br>器发起中断申请。<br>注:该中断为 CLINT 下外部<br>11 号中断。                                  |  |
| pad_cpu_sys_cnt[63:0]            | I   | -     | -   | <5     | 定时器输入信号: 外部 SoC 在始终不掉电的模块设计实现该计数器,该信号作为该计数器实时计数值被传入 E902 的定时器模块。CPU 将其与定时器设定的初始值比较,判断是否触发定时器中断。 注:该信号需要由 CPU 外部同步到 CPU 时钟域 |  |
| pad_cpu_nmi                      | I   | -     | CPU | -      | 不可屏蔽中断,输入脉冲信号,<br>上升沿有效,cpu 时钟域信号。                                                                                         |  |
| 调试系统集成:                          |     |       |     |        |                                                                                                                            |  |
| JTAG 支持信号:                       |     |       |     |        |                                                                                                                            |  |
| pad_had_jtg_tclk                 | I   | -     | -   | <5     | JTAG 测试时钟信号:<br>JTAG 和 HAD 内部相关寄存器的时钟信号,正常工作时要求该时钟的工作频率小于CPU 时钟频率的二分之一。                                                    |  |



表 2.2 - 续上页

| pad_had_jtg_tms_i            | I | _     |      | 数  |                                                                                                                                                     |
|------------------------------|---|-------|------|----|-----------------------------------------------------------------------------------------------------------------------------------------------------|
| pad_had_jtg_tms_i            | I | -     |      |    |                                                                                                                                                     |
|                              |   |       | JTAG | <5 | JTAG-2 串行数据输入信号:<br>HAD 端在 JTAG 时钟信号<br>(tclk) 的上升沿对其采样,而<br>外部调试器在 tclk 的下降沿<br>设置该信号。<br>JTAG 接口没有通信时,必须<br>将该信号保持为高电平,同时<br>停止 tclk。如果 tclk 信号一直 |
|                              |   |       |      |    | 有效,用户只需保持该信号为<br>高电平状态并维持 80 个时钟<br>周期即可同步复位 JTAG 接<br>口逻辑,包括 TAP 状态机等。                                                                             |
| had_pad_jtg_tms_o            | O | -     | JTAG | <5 | JTAG-2 串行数据输出信号:<br>HAD 端在 tclk 的下降沿对其<br>设置,而外部调试器在 tclk 的<br>上升沿对其采样。                                                                             |
| had_pad_jtg_tms_oe           | O | 1' b0 | JTAG | <5 | JTAG-2 串行数据输出有效指示信号: 要求 CPU 外部利用该信号通过一个三态门将pad_had_jtg_tms_i 和had_pad_jtg_tms_o信号合为一个双向端口信号。                                                        |
| 调试支持信号:                      | ' |       |      |    |                                                                                                                                                     |
| pad_sysio_dbgrq_b            | О | -     | SYS  | <5 | 同步调试请求信号:<br>可用于使 CPU 进入调试模式<br>或使 CPU 从仅关闭时钟的低<br>功耗状态唤醒。                                                                                          |
| had_pad_jdb_pm[1:0] 低功耗系统集成: | O | 2' b0 | SYS  | <5 | 处理器工作模式指示信号:<br>表明处理器的工作模式。<br>00: 普通模式;<br>01: 低功耗模式 (WFI 模式);<br>10: 调试模式;<br>11: 保留。                                                             |



表 2.2 - 续上页

| 信号名                    | I/O  | Reset  | 2.2 = 绥工贝<br><b>时钟域</b> | 内部门级 | 功能描述                     |
|------------------------|------|--------|-------------------------|------|--------------------------|
| III 3.11               | ., 0 | Reset  | 阿伊威                     | 数    | 97 HC1012C               |
| sysio_pad_lpmd_b[1:0]  | О    | 2' b11 | SYS                     | <5   | 低功耗模式状态信号:               |
|                        |      |        |                         |      | 当处理器执行 wfi 指令时,          |
|                        |      |        |                         |      | sysio_pad_lpmd_b[1:0] 被相 |
|                        |      |        |                         |      | 应的改变:                    |
|                        |      |        |                         |      | 00: 深度睡眠;                |
|                        |      |        |                         |      | 01: 浅度睡眠;                |
|                        |      |        |                         |      | 10: 保留;                  |
|                        |      |        |                         |      | 11: 普通模式。                |
| pad_cpu_wakeup_event   | I    | -      | CPU                     | <5   | 事件唤醒请求,输入脉冲信             |
|                        |      |        |                         |      | 号,上升沿有效;对于同一外            |
|                        |      |        |                         |      | 设 IP ,集成时可选择连接在          |
|                        |      |        |                         |      | pad_clic_int_vld 信号上利    |
|                        |      |        |                         |      | 用中断唤醒 cpu,或者连接在          |
|                        |      |        |                         |      | pad_cpu_wakeup_event 信   |
|                        |      |        |                         |      | 号上利用事件信号唤醒 cpu,          |
|                        |      |        |                         |      | 二者不可同时选择。                |
| DFT 系统集成:              | '    | 1      |                         |      |                          |
| pad_yy_test_mode       | I    | -      | -                       | <5   | 测试模式信号:                  |
|                        |      |        |                         |      | E902 的测试模式输入信号,          |
|                        |      |        |                         |      | 该信号仅在 E902 内用于选择         |
|                        |      |        |                         |      | 测试模式下的时钟和复位信             |
|                        |      |        |                         |      | 号。                       |
| pad_yy_gate_clk_en_b   | I    | -      | CPU                     | <5   | 门控时钟使能信号:                |
|                        |      |        |                         |      | 当在 scan 模式下可将该信号         |
|                        |      |        |                         |      | 接为 scan_enable, 其他时刻     |
|                        |      |        |                         |      | 可接 0。                    |
| CPU 运行观测信号集成:          |      |        |                         |      |                          |
| iu_pad_inst_retire     | О    | -      | CPU                     | -    | 指令退休有效信号。                |
| iu_pad_inst_split      | О    | -      | CPU                     | -    | 当前指令为拆分指令。               |
| iu_pad_retire_pc[31:0] | О    | -      | CPU                     | -    | 当前退休指令程序计数器的             |
|                        |      |        |                         |      | 值。                       |
| iu_pad_gpr_data[31:0]  | О    | -      | CPU                     | -    | 当前指令退休时 GPR 回写数          |
|                        |      |        |                         |      | 据。                       |
| iu_pad_gpr_index[4:0]  | О    | -      | CPU                     | -    | 当前退休指令时 GPR 回写寄          |
|                        |      |        |                         |      | 存器选择信号。                  |
| iu_pad_gpr_we          | О    | -      | CPU                     | -    | 当前指令退休时 GPR 回写有          |
|                        |      |        |                         |      | 效信号。                     |
|                        | 1    | 1      | 1                       | 1    |                          |



表 2.2 - 续上页

| 信号名                      | I/O | Reset | 时钟域 | 内部门级 | 功能描述              |
|--------------------------|-----|-------|-----|------|-------------------|
|                          |     |       |     | 数    |                   |
| cp0_pad_mstatus[31:0]    | О   | -     | CPU | -    | 当前 MSTATUS 寄存器的值。 |
| cp0_pad_mintstatus[31:0] | О   | -     | CPU | -    | 当前 MINTSTATUS 寄存器 |
|                          |     |       |     |      | 的值。               |
| $cp0\_pad\_mcause[31:0]$ | О   | -     | CPU | -    | 当前 MCAUSE 寄存器的值。  |
| cpu_pad_lockup           | О   | 0     | CPU | -    | 当 CPU 处于锁定状态时会将   |
|                          |     |       |     |      | 该信号置为高电平, 一旦触发    |
|                          |     |       |     |      | CPU 锁定状态,该信号一直    |
|                          |     |       |     |      | 为 1 ,直到复位请求将 CPU  |
|                          |     |       |     |      | 复位                |

#### 注解:

- 1. 内部门级数是为了描述信号端口时序:如果端口是 input,该数值表示了这根信号进入处理器内部后还需要通过几级门才能到寄存器;如果端口是 output,则该数值表示该信号从 CPU 内部寄存器出来还通过了几级门才到达端口。集成人员可通过这个数字结合 SoC 连接端口的延时,预判连接后时序是否能满足设计需求。
- 2. 总线信号内部门级数均参照 NON FLOP\_OUT 输出形式。
- 3. 因为总线为 NON FLOP\_OUT,接口信号均为 CPU 时钟域。
- 4. CPU 内部 flip-flop 的门级数最坏情况大约为 53 (有些特殊抗物理攻击配置配上后时序会更差一点)。
- 5. 内部门级数参照标准库为 scc55nll\_hd\_hvt,仅供参考,其它工艺库可能会存在一定误差。

# 第三章 时钟复位集成

## 3.1 端口列表

#### 时钟信号:

表 3.1: 时钟信号列表

| 信号名              | 方向 | 复位 | 时钟 | 功能描述                         |
|------------------|----|----|----|------------------------------|
| pll_core_cpuclk  | I  | -  | -  | CPU 工作时钟信号:                  |
|                  |    |    |    | 提供 CPU 工作的时钟。                |
| pad_had_jtg_tclk | I  | -  | -  | JTAG 测试时钟信号:                 |
|                  |    |    |    | JTAG 和 HAD 内部相关寄存器的时钟        |
|                  |    |    |    | 信号,正常工作时要求该时钟的工作频            |
|                  |    |    |    | 率小于 CPU 时钟频率的二分之一。           |
|                  |    |    |    | 注: 该信号在测试模式                  |
|                  |    |    |    | (pad_yy_test_mode) 下亦作为 E902 |
|                  |    |    |    | 内所有逻辑的输入时钟。                  |

#### 复位控制信号:



表 3.2: 复位控制信号列表

| 信号名                | 方向 | 复位 | 时钟   | 功能描述                          |
|--------------------|----|----|------|-------------------------------|
| pad_cpu_rst_b      | I  | -  | CPU  | 处理器复位信号:                      |
|                    |    |    |      | 低电平时, 复位 CPU; CPU 采用异步复       |
|                    |    |    |      | 位、同步释放的方式。                    |
|                    |    |    |      | 注意: 要求系统将 CPU 复位信号同步到         |
|                    |    |    |      | CPU 时钟域,CPU 内部不进行同步操          |
|                    |    |    |      | 作。                            |
| pad_had_rst_b      | I  | -  | CPU  | 调试模块复位信号:                     |
|                    |    |    |      | 低电平时,复位调试模块,调试模块采用            |
|                    |    |    |      | 异步复位、同步释放的方式。                 |
|                    |    |    |      | 注意: 要求系统将 HAD 复位信号同步          |
|                    |    |    |      | 到 CPU 时钟域,CPU 内部不进行同步         |
|                    |    |    |      | 操作。                           |
| pad_had_jtg_trst_b | I  | -  | TCLK | JTA G 测试复位信号:                 |
|                    |    |    |      | 两线 JTAG 接口逻辑复位信号, 低           |
|                    |    |    |      | 电平有效。该信号还用做测试模式下              |
|                    |    |    |      | (pad_yy_test_mode=1)E902 内所有逻 |
|                    |    |    |      | 辑的复位。                         |
| cpu_pad_soft_rst   | О  | 0  | SYS  | 软复位指示信号,模式如下:                 |
|                    |    |    |      | 2'b00: 无复位请求 2'b01: 仅复位内核     |
|                    |    |    |      | 2'b10: 复位系统 2'b11: 保留上述所有     |
|                    |    |    |      | 操作 CPU 内部均不实现复位操作, 需要         |
|                    |    |    |      | SoC 设计人员依据相关信号复位相关逻           |
|                    |    |    |      | 辑,该信号保持一个 cpu 时钟周期有效。         |
| pad_cpu_rst_addr   | I  | -  | CPU  | CPU 复位启动地址指示信号                |

#### 动态调频信号:

表 3.3: 动态调频信号列表

| 信号名             | 方向 | 复位 | 时钟  | 功能描述                |
|-----------------|----|----|-----|---------------------|
| pad_cpu_dfs_req | I  | 0  | CPU | 系统向 CPU 发起的动态调频请求信号 |
| cpu_pad_dfs_ack | О  | 0  | SYS | CPU 因应系统的动态调频请求,发出的 |
|                 |    |    |     | 调频准备操作完成信号。系统设计人员   |
|                 |    |    |     | 在看到该信号为高时可以开始 CPU 的 |
|                 |    |    |     | 调频操作。               |



### 3.2 时钟信号

#### 3.2.1 E902 时钟域

E902 CPU 有两个外部输入时钟,分别为: pll\_core\_cpuclk 和 pad\_had\_jtg\_tclk。

pll\_core\_cpuclk 为 CPU 域时钟,用于 CPU 内部所有寄存器的时钟,包括 CPU Core、中断控制器 (CLIC)、调试辅助单元 (HAD) 和总线接口模块 (BIU)。CPU 内部设计细粒度的门控时钟单元用来降低 CPU 的动态功耗。通过处理器的执行状态控制门控时钟单元的开启和关闭。在 CPU 进入低功耗模式时,同步关闭门控时钟单元。

pad\_had\_jtg\_clk 为 JTAG 接口逻辑时钟,用于 CPU 内部调试辅助单元 (HAD) 中 JTAG 状态机的运行。另外其还作为测试模式下 E902 内部所有逻辑单元的工作时钟,E902 内部会将测试时钟 (pad had jtg tclk)与 pll core cpuclk 进行选择后产生 forever cpuclk,作为 CPU 的工作时钟。

注解: E902 外部系统时钟与 CPUCLK 需为同频同相。



图 3.1: E902 的时钟管理方式

图 3.1 是 E902 的时钟管理示意图。pad\_had\_jtag\_tclk 是 JTAG 时钟,与 CPU 时钟异步,该时钟信号属于 SoC 系统的顶层信号,需要从芯片引脚接入。时钟产生逻辑以板上晶振时钟 i\_oscclk 为输入,产生系统工作时钟 pll\_core\_sysclk、CPU 工作时钟 pll\_core\_cpuclk。CPU 内部生成 forever\_cpuclk,用于 CPU 核、BIU 以及 TCIP(包括 CLIC) 使用。

#### 3.2.2 调频操作

E902 支持 SoC 对处理器时钟的动态调节。SoC 设计人员通过置起 pad\_cpu\_dfs\_req 信号通知处理器将要进行调频操作,如图 3.2 所示,经过 T1 时间后处理器会置起 cpu\_pad\_dfs\_ack 信号表示已经准备完成



等待调节。在经过 T2 时间调频操作完成后 SoC 设计人员需将 pad\_cpu\_dfs\_req 置 0, cpu\_pad\_dfs\_ack 也会在两个处理器时钟周期后被置为 0, 处理器继续运行。



图 3.2: 动态调频时序图

### 3.3 多时钟域信号同步

#### 3.3.1 CPU 内核时钟域与系统总线时钟域

在 E902 的设计中, CPU 内核时钟域与系统总线时钟域在总线接口部分逻辑中有信号交互, 要求这两个时钟在物理设计中保证同频同相。

#### 3.3.2 CPU 内核时钟域与 JTAG 时钟域

在 E902 的设计中,CPU 内核时钟 cpuclk 信号与 HAD 内部时钟 jtclk 信号之间有信息交互,CPU 内部已经通过同步逻辑单元将两个时钟域之间的信号进行了有效同步,用户无需关心。其逻辑框图如 图  $3.3~\mathrm{fm}$  示。



图 3.3: CPU 与 JTAG 时钟域之间的同步逻辑

## 3.4 复位信号

E902 输入三根复位信号,分别是用于 CPU 核 (除 HAD 之外) 的复位信号 pad\_cpu\_rst\_b、用于 HAD 中 CPU 域的复位信号 pad\_had\_rst\_b 和用于 HAD TCLK 域的复位信号 had\_pad\_jtg\_trst\_b。



在测试模式下(pad\_yy\_test\_mode=1),复位信号全部选择 pad\_had\_jtg\_trst\_b。

为了有效避免复位过程中亚稳态的出现, E902 采用异步复位、同步释放的方式进行系统的复位。因此需要各个复位信号同步到相对应的时钟域中。复位信号的同步工作由系统完成, CPU 自身仅对复位信号进行选择。下图给出了 E902 的复位信号的一个示例。

#### • pad\_cpu\_rst\_b:

信号由系统上电复位,mcu 复位(通常为整个 mcu 的输入 port 端口)以及 nreset(在线仿真器发出的 cpu 复位信号,用户可以根据实际情况选择是否实现 nreset)经过两级工作在 pll\_core\_cpuclk 时钟下的同步寄存器得到。

#### • pad\_had\_rst\_b:

信号由系统上电复位和 mcu 复位经过两级工作在 pll core cpuclk 时钟下的同步寄存器得到。

#### • $pad_had_jtg_trst_b$ :

由系统上电复位,mcu 复位以及 jtag 复位(在线仿真器发出的 jtag 复位信号,在 2 线 jtag 调试配置下用户可以根据实际情况选择是否实现该 jtag 复位,因为状态机可以实现自复位)得到,jtag 复位信号由在线仿真器完成时钟域同步工作;另外,在测试模式下,pad\_had\_jtag\_trst\_b 为 cpu 全局复位信号,测试机通过上述 MCU 复位端口对复位信号进行控制。

另外, E902 还实现了同步复位的功能(cpu\_pad\_soft\_rst), 软件可以通过设置相关控制寄存器来驱动cpu\_pad\_soft\_rst 信号有效一个系统时钟周期, 系统设计人员可以使用该信号反过来驱动上述三个复位端口, 完成 E902 的复位操作。

另外,E902 支持通过集成信号指定复位启动地址,通过 pad\_cpu\_rst\_addr[31:0] 传入,该信号的低两位需要为 0。

#### 3.4.1 复位后进调试

E902 支持在调试模式下完成复位操作后直接再次进入调试模式的操作。要实现该特性需要软硬件配合 完成如下设置:

- 在调试模式下,通过调试软件在 E902 的复位启动地址设置硬断点;
- 调试软件上设置 E902 进行只复位核心的软复位操作;
- 上述软复位指示信号在 E902 集成时不要反接回 pad had rst b 信号;
- E902 在复位释放后去复位启动地址处取指令执行, 触发硬断点, 进入调试模式。





图 3.4: E902 复位信号产生机制

## 第四章 总线系统集成

### 4.1 总线简介及配置信息

E902 实现了多总线接口,分别包括系统总线、指令总线和紧耦合 IP 接口。其中指令总线可由用户根据 实际的系统需要进行配置。紧耦合 IP 接口的地址空间固定为 0xE00000000~0xEFFFFFFF,用于 clint、clic 等 IP 的访问。当总线矩阵接收访问紧耦合 IP 的地址的请求时,该请求将直接在核内处理,不影响指令总线和系统总线。

总线矩阵为处理器内部请求访问外部总线接口提供了互联功能。总线矩阵与 CPU 内部请求及总线接口的连接关系如 图 4.1 所示。总线矩阵根据内存访问的地址仲裁总线接口类型,将处理器内部访问分发到系统总线、指令总线以及 TCIP 接口上。



图 4.1: E902 总线矩阵

处理器内部的取指访问和数据访问拥有相同的总线访问权限,可以访问所有总线接口。为了解决同一时 钟周期取指访问和数据访问竞争同一总线接口的问题,总线矩阵也负责请求的优先级判断。当取指请求和数 据请求竞争同一总线接口时,数据请求拥有更高的优先级。

E902 多总线接口的基本信息如 表 4.1 所示。



表 4.1: 多总线接口的基本信息和可配置性

| 总线接口 | 总线协议     | 时序方式 |
|------|----------|------|
| 系统总线 | AHB-Lite | 直接输出 |
| 指令总线 | AHB-Lite | 直接输出 |

另外, E902 通过提供一组接口信号(pad\_bmu\_iahbl\_base 和 pad\_bmu\_iahbl\_mask),支持指令总线基地址和空间大小硬件集成时可配置。其中, pad\_bmu\_iahbl\_base 指定了指令总线的基地址; pad\_bmu\_iahbl\_mask 指定了不同地址空间下对地址对齐的需求。

指令总线的地址空间 1MB 到 4GB 可配置,例如设置指令总线地址空间大小为 8M,pad\_bmu\_iahbl\_base[2:0] 必须为 3'b0,pad\_bmu\_iahbl\_mask[11:0] 必须为 12'b1111 1111 1000。不同大小的地址空间具体要求见表 4.2。

地址空间大小 对 pad\_bmu\_iahbl\_base 的要求 对 pad\_bmu\_iahbl\_mask 的要求 1MBbit[11:0]=12' b1111 1111 1111 没有要求 2MBbit[0] = 0bit[11:0]=12' b1111 1111 1110 4MBbit[1:0] = 2, b0bit[11:0]=12' b1111 1111 1100 8MBbit[11:0]=12' b1111 1111 1000 bit[2:0] = 3' b016MB bit[3:0] = 4, b0bit[11:0]=12' b1111 1111 0000 32MBbit[4:0] = 5' b0bit[11:0]=12' b1111 1110 0000 64MBbit[5:0] = 6' b0bit[11:0]=12' b1111 1100 0000 128MBbit[6:0] = 7' b0bit[11:0]=12' b1111 1000 0000 256MBbit[7:0] = 8' b0bit[11:0]=12' b1111 0000 0000 512MB bit[8:0] = 9, b0bit[11:0]=12' b1110 0000 0000 1GB bit[9:0] = 10' b0bit[11:0]=12' b1100 0000 0000 2GBbit[10:0] = 11' b0bit[11:0]=12' b1000 0000 0000 4GBbit[11:0] = 12' b0bit[11:0]=12' b0000 0000 0000

表 4.2: 指令总线对基地址和地址对齐的要求

E902 指令总线地址空间在集成分配时需保证与紧耦合 IP 的地址空间不重叠, 否则在处理器内部请求地址命中该重叠空间时行为不可预期。

## 4.2 系统总线接口

E902 的系统总线接口支持 AMBA3.0 AHB-Lite 协议 (请参考 AMBA 3.0 规格说明—AMBA3 AHB-Lite Protocal Specification Rev 1.0)。考虑到 E902 的应用领域及成本,系统总线接口只实现了 AHB-Lite 协议中的部分内容。

在 AHB-Lite 协议下,作为主设备,总线接口支持的传输类型为:

• HBURST 只支持 SINGLE 传输, 其它突发类型均不支持;

#### 第四章 总线系统集成



- HTRANS 只支持 IDLE 和 NONSEQ, 其它传输类型均不支持;
- HSIZE 支持字、字节和半字传输, 其它传输大小不支持;
- HWRITE 支持读和写操作。在 AHB-Lite 协议下,总线接口接受从设备的响应类型为:
- HREADY 支持 Ready 和 Not Ready;
- HRESP 支持 OKAY 和 ERROR, 其它响应类型不支持。



表 4.3: 系统总线接口信号列表

| 信号名                  | I/O | Reset | 定义                              |
|----------------------|-----|-------|---------------------------------|
| 系统总线接口信号:            |     |       |                                 |
| biu_pad_haddr[31:0]  | О   | -     | 地址总线:                           |
|                      |     |       | 32 位地址总线。                       |
| biu_pad_hwdata[31:0] | О   | -     | 写数据总线:                          |
|                      |     |       | 32 位写数据总线。                      |
| biu_pad_hburst[2:0]  | О   | -     | 突发传输指示信号:                       |
|                      |     |       | 指示传输是一次突发传输的一部分:                |
|                      |     |       | 000: SINGLE;                    |
|                      |     |       | 001: INCR;                      |
|                      |     |       | 010: WRAP4.                     |
|                      |     |       | E902 仅支持 SINGLE 传输。             |
| biu_pad_hsize[2:0]   | О   | -     | 传输宽度指示信号:                       |
|                      |     |       | 指示传输的数据宽度:                      |
|                      |     |       | 000: byte;                      |
|                      |     |       | 001: halfword;                  |
|                      |     |       | 010: word。                      |
| biu_pad_htrans[1:0]  | О   | 00    | 传输类型表示信号:                       |
|                      |     |       | 指示当前总线周期的传输类型:                  |
|                      |     |       | 00: IDLE;                       |
|                      |     |       | 01: BUSY;                       |
|                      |     |       | 10: NONSEQ;                     |
|                      |     |       | 11: SEQ.                        |
|                      |     |       | E902 中仅支持 NONSEQ 和 IDLE 两种传输类型。 |
| biu_pad_hwrite       | О   | 0     | 读写表示信号:                         |
|                      |     |       | 指示当前 CPU 是读取总线数据还是写总线:          |
|                      |     |       | 1: 指示是写总线传输;                    |
|                      |     |       | 0: 指示是读总线传输。                    |
| biu_pad_hprot[3:0]   | О   | -     | 保护控制信号:                         |
|                      |     |       | 指示当前总线周期进行的数据传输的特性:             |
|                      |     |       | ***0: 取指令;                      |
|                      |     |       | ***1: 数据访问;                     |
|                      |     |       | **0*: 用户模式访问;                   |
|                      |     |       | **1*: 机器模式访问;                   |
|                      |     |       | *0**: Non bufferable;           |
|                      |     |       | *1**: bufferable;               |
|                      |     |       | 0***: Non cacheable;            |
|                      |     |       | 1***: cacheable。                |
| pad_biu_hrdata[31:0] | I   | -     | 读数据总线:                          |
|                      |     |       | 32 位读数据总线。                      |



表 4.4: 系统总线接口信号列表

| 信号名            | I/O | Reset | 定义                          |
|----------------|-----|-------|-----------------------------|
| 系统总线接口信号:      |     |       |                             |
| pad_biu_hready | I   | -     | 传输完成指示信号:                   |
|                |     |       | 有效时指示当前传输已完成, CPU 将总线置于待命   |
|                |     |       | 状态。                         |
| pad_biu_hresp  | I   | -     | 传输应答信号:                     |
|                |     |       | 传输应答:                       |
|                |     |       | 0: OKAY;                    |
|                |     |       | 1: ERROR;                   |
|                |     |       | E902 中仅支持 OKAY 和 ERROR 两种响应 |

## 4.3 指令总线接口

E902 的指令总线只支持 AMBA3.0 AHB-LITE 协议,可参考 AMBA 3.0 规格说明-AMBA3 AHB-Lite Protocal Specification Rev 1.0。

E902 指令总线接口只实现了 AHB-Lite 协议中的部分内容。在 AHB-Lite 协议下,作为主设备,总线接口支持的传输类型为:

- HBURST 只支持 SINGLE 传输, 其它突发类型均不支持;
- HTRANS 只支持 IDLE 和 NONSEQ, 其它传输类型均不支持;
- HSIZE 支持字、字节和半字传输, 其它传输大小不支持;
- HWRITE 支持读和写操作。

在 AHB-Lite 协议下,总线接口接受从设备的响应类型为:

- HREADY 支持 Ready 和 Not Ready;
- HRESP 支持 OKAY 和 ERROR, 其它响应类型不支持。



表 4.5: 指令总线接口信号列表

| 信号名                    | I/O | Reset | 定义                             |
|------------------------|-----|-------|--------------------------------|
| 指令 AHB-Lite 接口         |     |       |                                |
| iahbl_pad_haddr[31:0]  | О   | -     | 地址总线:                          |
|                        |     |       | 32 位地址总线。                      |
| iahbl_pad_hburst[2:0]  | О   | -     | 突发传输指示信号:                      |
|                        |     |       | 指示传输是一次突发传输的一部分:               |
|                        |     |       | 000: SINGLE;                   |
|                        |     |       | 001: INCR;                     |
|                        |     |       | 010: WRAP4。                    |
|                        |     |       | E902 仅支持 SINGLE 传输。            |
| iahbl_pad_hprot[3:0]   | О   | -     | 保护控制信号:                        |
|                        |     |       | 指示当前总线周期进行的数据传输的特性:            |
|                        |     |       | ***0: 取指令;                     |
|                        |     |       | ***1: 数据访问;                    |
|                        |     |       | **0*: 用户模式访问;                  |
|                        |     |       | **1*: 机器模式访问;                  |
|                        |     |       | *0**: Non bufferable;          |
|                        |     |       | *1**: bufferable;              |
|                        |     |       | 0***: Non cacheable;           |
|                        |     |       | 1***: cacheable.               |
| iahbl_pad_hsize[2:0]   | О   | -     | 传输宽度指示信号:                      |
|                        |     |       | 指示传输的数据宽度:                     |
|                        |     |       | 000: byte;                     |
|                        |     |       | 001: halfword;                 |
|                        |     |       | 010: word.                     |
| iahbl_pad_htrans[1:0]  | О   | 00    | 传输类型表示信号:                      |
|                        |     |       | 指示当前总线周期的传输类型:                 |
|                        |     |       | 00: IDLE;                      |
|                        |     |       | 01: BUSY;                      |
|                        |     |       | 10: NONSEQ;                    |
|                        |     |       | 11: SEQ.                       |
|                        |     |       | E902 仅支持 IDLE 和 NONSEQ 两种传输类型。 |
| iahbl_pad_hwdata[31:0] | О   | -     | 写数据总线:                         |
|                        |     |       | 32 位写数据总线。                     |
| iahbl_pad_hwrite       | О   | 0     | 读写表示信号:                        |
|                        |     |       | 指示当前 CPU 是读取总线数据还是写总线:         |
|                        |     |       | 1: 指示是写总线传输;                   |
|                        |     |       | 0: 指示是读总线传输。                   |



表 4.6: 指令总线接口信号列表

| 信号名                      | I/O | Reset | 定义                          |
|--------------------------|-----|-------|-----------------------------|
| 指令 AHB-Lite 接口           |     |       |                             |
| pad_iahbl_hready         | I   | -     | 传输完成指示信号:                   |
|                          |     |       | 有效时指示当前传输已完成, CPU 将总线置于待命   |
|                          |     |       | 状态。                         |
| pad_iahbl_hresp          | I   | -     | 传输应答信号:                     |
|                          |     |       | 传输应答:                       |
|                          |     |       | 0: OKAY;                    |
|                          |     |       | 1: ERROR.                   |
|                          |     |       | E902 中仅支持 OKAY 和 ERROR 两种响应 |
| pad_bmu_iahbl_base[11:0] | I   | -     | I AHB-Lite 基址控制信号,上电复位之后需固定 |
| pad_bmu_iahbl_mask[11:0] | I   | -     | IAHB-Lite 地址对齐控制信号,上电复位之后需固 |
|                          |     |       | 定                           |

# 第五章 中断系统集成

### 5.1 中断处理过程简述

中断处理是指处理器在接受到中断请求后从正常的程序处理转而响应中断处理,执行特定的中断处理程序。被中断的指令将正常退休,并在退休时响应中断请求。CPU 会保存当前的指令运行状态,将下一条指令作为中断返回的指令人口,并在退出中断服务程序时恢复之前的状态。

### 5.2 端口列表

中断控制器的接口信号主要用于 CLIC 接收并采样中断源的中断请求信号。

信号名 1/0 Reset 定义 中断源信号:  $pad\_clic\_int\_vld[i-1:0]*$ Ι 0 中断请求信号。 i: 1-240 高电平时表示中断请求有效, bit[0] 对应的中断号为 16, bit[i] 对应的中断号为 16+i, i 最大为 240。 Ι 1 pad cpu ext int b CLINT11 号中断请求信号,为了在 CLIC 配置时兼 容 CLINT 中断而存在。 低电平时表示中断请求有效。 pad\_cpu\_nmi Ι 0 不可屏蔽中断请求,脉冲信号,上升沿有效。 时钟信号: pll\_core\_cpuclk Ι \_ CLIC 的工作及采样时钟

表 5.1: CLIC 中断控制器接口信号

注解: CLIC 低 16 号中断中除 3 号、7 号及 11 号外,其余均为保留中断,中断有效信号均硬件绑 0; 3 号中断为软件中断,需要通过写对应 CLINT 寄存器置位; 7 号中断为 Timer 中断,其中断有效信号由 CLINT 中控制寄存器与外部计数器(pad\_cpu\_sys\_cnt)的比较结果产生; 11 号中断为外部中断,直接与 CLINT 中机器模式外部中断相连,对应中断源为 pad\_cpu\_ext\_int\_b。



### 5.3 中断握手时序图

当 CPU 配置 CLIC 中断控制器且处于 CLIC 模式时,由 CLIC 负责采样外部中断源的中断请求:对于电平中断,CLIC 中断控制器采样到中断有效信号的高电平后设置对应中断进入等待状态,电平中断要求中断服务程序中清除外设的中断源有效信号,否则当中断退出时会重新发起中断请求。外设可以根据这一特点,常置中断信号直到不再需要中断处理程序处理;对于脉冲中断,CLIC 中断控制器采样中断有效信号的上升沿,设置对应中断进入等待状态。然后根据中断的优先级向 CPU 发送中断请求,在 CPU 响应该脉冲中断请求前,若脉冲中断源向 CLIC 中断控制器发起多次中断请求,CLIC 中断控制器只会记录一次中断请求。在 CPU 响应该脉冲中断请求后,若脉冲中断源再次向中断控制器发起请求,CLIC 中断控制器会再次触发对应中断进入等待状态,该处于等待状态的中断请求在中断退出后才能够再次被 CPU 响应。脉冲中断和电平中断的区分由 CLIC 每个中断源中的 clicintattr 控制寄存器的 trig 域决定,当 trig[0] 为 0 时,代表为电平中断。当 trig[0] 为 1 时,trig[1] 为 0 代表上升沿中断,trig[1] 为 1 代表下降沿中断。

图 5.1 给出了 CPU 内核与 CLIC 中断交互时序图。当 CLIC 采样到中断信号时,CLIC 设置中断等待状态位 int\_pending,CLIC 根据中断优先级进行仲裁,向 CPU 发出中断的相关信息(clic\_cpu\_int\_priv、ciic\_cpu\_int\_il、clic\_cpu\_int\_id、clic\_cpu\_int\_hv);CPU 响应中断进入中断服务程序。注意:CPU 在中断响应和中断退出时的行为兼容 RISC-V 中 CLIC 控制器的定义。对于电平中断,CPU 不会向 CLIC 中断控制器返回任何响应和退出信号,需要软件在退出中断服务程序前清除外部 IP 的中断源有效信息;对于Vector 模式的脉冲中断,CPU 在响应中断以后,会清除对应的中断等待状态位;对于非 Vector 模式的脉冲中断,CPU 在机行有效的读 mnxti 寄存器操作后,会清除对应的中断等待位。



图 5.1: CPU 配置 CLIC 时中断相关信号时序简图



#### 5.4 中断嵌套

配备了 CLIC 中断控制器的 CPU 支持中断嵌套功能, CPU 记录当前所处中断等级, 并根据等待响应中断的中断等级判定新来的中断是否要能打断当前正在处理的中断, 从而提高中断响应实时性。具体参考《玄铁 E902 R2S2 用户手册》。

#### 5.5 计时器中断

CLINT 可用于生成机器模式计时器中断。该计时器中断需要搭配 E902 外部由系统设计实现的 64 位计数器使用。该系统计数器需要工作在 always-on 的电压域,复位后在每个时钟周期进行计数。该系统计数器软件不可写,仅能通过复位清零。在 E902 集成时需要将该 64 位系统计数器的值通过 pad\_cpu\_sys\_cnt[63:0] 信号传入 E902 内部,高 32 位的值可通过 E902 设计实现的 MTIMEHI[31:0] 寄存器读取,低 32 位的值可通过 MTIMELO[31:0] 寄存器读取。pad\_cpu\_sys\_cnt[63:0] 在 E902 内部会由 clk\_en 进行采样,系统设计人员需要将该信号在 E902 外部完成同步到 pll\_core\_cpuclk 时钟域的操作。



# 第六章 调试系统集成

## 6.1 端口列表

表 6.1: Debug 系统端口列表

| 信号名                 | I/O | Reset | 描述                          |
|---------------------|-----|-------|-----------------------------|
| pad_had_jtg_trst_b  | I   | -     | JTAG 测试复位信号:                |
|                     |     |       | JTAG 复位信号,下跳变可以初始化和 JTAG 接口 |
|                     |     |       | 相关的触发器,正常工作情况下该信号需置成高电      |
|                     |     |       | 平。                          |
| pad_had_jtg_tclk    | I   | -     | JTAG 测试时钟信号:                |
|                     |     |       | JTAG 和 HAD 内部相关触发器的时钟信号,要求  |
|                     |     |       | 其频率是 cpuclk 频率的一半以下。        |
| pad_had_jtg_tms_i   | I   | -     | JTAG 数据输入信号:                |
|                     |     |       | JTAG 串行输入端口,包括控制命令,数据,输入    |
|                     |     |       | 顺序由低位到高位。                   |
|                     |     |       | 注:此信号出现于实现 2 线制 HAD 的处理器中。  |
| had_pad_jtg_tms_o   | О   | -     | JTAG 数据输出信号:                |
|                     |     |       | JTAG 串行数据输出端口,输出顺序由低位到高位。   |
|                     |     |       | 注:此信号出现于实现 2 线制 HAD 的处理器中。  |
| had_pad_jtg_tms_oe  | О   | -     | JTAG 数据输出有效信号:              |
|                     |     |       | 注:此信号出现于实现 2 线制 HAD 的处理器中。  |
| 调试支持信号:             | ·   |       |                             |
| pad_sysio_dbgrq_b   | I   | -     | 外部调试请求信号:                   |
|                     |     |       | 可用于使 CPU 进入调试模式或使 CPU 从仅关闭  |
|                     |     |       | 时钟的低功耗状态唤醒。                 |
|                     |     |       | 不用该信号时,需要接 1。               |
| had_pad_jdb_pm[1:0] | О   | 00    | 处理器工作模式指示信号:                |
|                     |     |       | 这些输出信号表明处理器的工作模式, 异步于       |
|                     |     |       | pad_had_jtg_tclk。           |
|                     |     |       | 00: normal 模式;              |
|                     |     |       | 01: 低功耗模式;                  |
|                     |     |       | 10: 调试模式;                   |
|                     |     |       |                             |
| www.t-head.cn       |     |       | 31                          |



### 6.2 JATG 接口

pad\_had\_jtg\_tap\_en 信号为调试接口中 TAP 状态机的使能信号,维持该信号为高电平至少一个 JTAG 时钟周期可以使能调试接口中的 TAP 状态机。如果该信号在 CPU 上电之后一直无效,那么使用 同步方式(如设置调试接口寄存器 HCR 中的 DR 位,断点等)使 CPU 进入调试状态时可能无法调试程序。

在 TAP 状态机启动之后, had\_pad\_jtg\_tap\_on 信号将拉高。

pad\_had\_jtg\_tclk 信号为 JTAG 时钟信号。该信号为外部输入信号,一般为调试器产生的时钟信号,要保证该时钟信号的频率低于 CPU 时钟信号的频率 1/2 才能保证调试模块与 CPU 核之间的正常工作。

pad\_had\_jtg\_trst\_b 信号为 JTAG 复位信号,可以复位 TAP 状态机以及其他相关控制信号。

pad\_had\_jtg\_tms\_i 信号为 2 线制 JTAG 串行数据输入信号,调试接口在 JTAG 时钟信号 TCLK 的上升沿对其采样,而外部调试器在 JTAG 时钟的下降沿设置该信号;

该信号在空闲时必须保持为高电平,同时空闲时时钟信号需要停止翻转。用户可以利用该信号同步复位 HAD 逻辑:在实现 2 线制 JTAG 接口的调试模块中,如果 TCLK 时钟信号一直有效,用户只需保持该信号为高电平状态并维持 80 个时钟周期即可同步复位 JTAG 接口控制逻辑,即调试模块的 TAP 状态机回到 RESET 态,同时调试模块寄存器 HACR 复位到 0x82(指向 ID 寄存器)。

had\_pad\_jtg\_tms\_o 信号为 2 线制 JTAG 串行数据输出信号,调试接口在 JTAG 时钟信号 TCLK 的下降沿对其设置,而外部调试器在 JTAG 时钟的上升沿对其采样;

had\_pad\_jtg\_tms\_oe 信号为 had\_pad\_jtg\_tms\_o 信号有效指示信号。CPU 外部应利用该信号将pad\_had\_jtg\_tms\_i 和 had\_pad\_jtg\_tms\_o 信号合为一个双向端口信号。

# 第七章 低功耗系统集成

### 7.1 端口列表

表 7.1: 低功耗端口信号列表

| 信号名                   | I/O | Reset | 功能描述                                   |
|-----------------------|-----|-------|----------------------------------------|
| sysio_pad_lpmd_b[1:0] | О   | 11    | 低功耗模式状态信号:                             |
|                       |     |       | 当处理器执行 WFI 指令时,sysio_pad_lpmd_b[1:0] 被 |
|                       |     |       | 相应的改变:                                 |
|                       |     |       | 00: 深度睡眠;                              |
|                       |     |       | 01: 浅度睡眠;                              |
|                       |     |       | 10: 保留;                                |
|                       |     |       | 11: 正常工作模式。                            |
| pad_cpu_wakeup_event  | I   | -     | 事件唤醒请求,脉冲信号,上升沿有效。该信号需要在               |
|                       |     |       | CPU 外面完成到 CPU 时钟域的同步                   |

## 7.2 工作模式及其转换

E902 总共有三类工作模式:正常运行模式、低功耗工作模式和调试模式,如图 7.1。若支持用户模式,则正常运行模式包括机器模式和用户模式,否则只存在机器模式。

## 7.3 进入低功耗模式握手

CPU 可通过执行低功耗指令(WFI)进入低功耗模式。CPU 执行低功耗指令之后,会关闭内部绝大部分寄存器时钟,除开少量始终采样的寄存器,CPU 内部的流水线停止运行,不再取指令和执行指令,同时还会修改 sysio\_pad\_lpmd\_b[1:0],通知 SoC 进行低功耗操作,之后就一直处于等待状态直到被唤醒。要进入低功耗模式就需要对门控时钟进行全局使能,即 pad\_yy\_gate\_clk\_en\_b 设置为 0。

SoC 在集成时需要把 sysio\_pad\_lpmd\_b[1:0] 作为切换到低功耗模式的控制信号,由它来指示 SoC 进入低功耗场景。





图 7.1: CPU 状态转换图



图 7.2: 进入低功耗模式握手



### 7.4 退出低功耗模式握手

退出低功耗模式由系统中断实现。当处理器接受到中断,且局部中断使能时,处理器会被唤醒。处理器被唤醒后,如果全局中断使能打开,则进入中断服务程序开始执行,否则,唤醒之后 CPU 继续执行低功耗指令(WFI)之后的指令。外部模块可以通过查询 sysio\_pad\_lpmd\_b[1:0] 来查询 CPU 状态。图 7.3 所示为通过 SoC 驱动 11 号中断的来源 pad\_cpu\_ext\_int\_b 来唤醒 CPU,亦可通过驱动 pad\_clic\_int\_vld[i-1:0] 这组信号集成连接的中断来唤醒 CPU。NMI 和调试请求,外部事件请求也可用来唤醒 CPU。



图 7.3: 退出低功耗模式握手

### 7.5 浅睡眠

E902 在低功耗模式下定义了深浅睡眠两种模式,通过 sysio\_pad\_lpmd\_b[1:0] 信号来指示。当 sysio\_pad\_lpmd\_b[1:0]==2'b01 时,表示 CPU 进入浅睡眠低功耗模式。该模式可由软件配置 E902 内部的 CSR 指定。

在浅睡眠模式下, pll\_core\_cpuclk 作用在 E902 内部绝大多数寄存器上的时钟都会被关闭, 只保留跟唤醒逻辑相关的寄存器时钟开启。另外, pad\_had\_jtg\_tclk 作用的寄存器时钟不会被关闭, 以便在低功耗模式下调试请求可以唤醒 CPU。

在浅睡眠模式下,系统设计者可以将 E902 进行降频,进一步降低 E902 的功耗。在这种情况下,如果想通过外部调试器操作两线调试接口唤醒 CPU,需要保证 CPU 频率是调试器输出 TCLK 频率的两倍及以上,调试器最低输出频率为 10KHz。

## 7.6 深睡眠

E902 支持通过执行 WFI 指令进入深睡眠模式,通过 E902 顶层输出信号 sysio\_pad\_lpmd\_b[1:0] 信号来指示。当 sysio\_pad\_lpmd\_b[1:0]==2'b00 时,表示 CPU 进入深睡眠低功耗模式。该模式可由软件配



置 E902 内部的 CSR 指定。

在 E902 进入深睡眠低功耗模式时, CPU 内部相比于浅睡眠模式对于时钟的处理完全相同。系统设计者可以根据该指示信号对 CPU 采取进一步的降低功耗的策略, 比如降压, 关闭 E902 输入时钟(pll\_core\_cpuclk)来消除 E902 内部动态功耗的耗费。

在 E902 输入时钟被关闭的情况下,如果想唤醒 CPU,需要保持唤醒信号,并先将 E902 的输入时钟恢复到正常,这样 CPU 才会从低功耗模式被唤醒。系统设计者可以在 CPU 外部设计针对 E902 的功耗管理模块,并负责采样唤醒请求。当 E902 进入深睡眠低功耗模式时,关闭 E902 的输入时钟。在 E902 处于低功耗模式下去采样 CPU 的唤醒请求信号并传递给 CPU,一旦采样到有效信号,可以先开启 E902 的输入时钟,然后其传递给 CPU 的唤醒请求信号会将 CPU 唤醒。该模块在观测到 CPU 从低功耗模式被唤醒后可以清除其内部的采样寄存器。

# 第八章 CPU 运行观测信号集成

## 8.1 简介

CPU 运行观测信号是提供给 SoC 集成设计人员观测所设计,集成时可悬空处理。SoC 设计人员可以通过监测这些信号来获知 CPU 的指令回写信息和寄存器的相关值。



## 8.2 通用观测信号

表 8.1: 通用观测信号

| 信号名                       | I/O | Reset | 定义                       |
|---------------------------|-----|-------|--------------------------|
| iu_pad_inst_retire        | О   | 0     | 指令退休指示信号:                |
|                           |     |       | 0: 当前周期没有指令退休;           |
|                           |     |       | 1: 当前周期有指令退休。            |
| iu_pad_retire_pc[31:0]    | О   | -     | 退休指令的 PC: 表明当前正在退休的指     |
|                           |     |       | 令的 PC。                   |
| iu_pad_inst_split         | О   | 0     | 指令类型指示信号:                |
|                           |     |       | 0: 当前正在退休的指令不是拆分指令;      |
|                           |     |       | 1: 当前正在退休的指令是拆分指令。       |
| iu_pad_gpr_we             | О   | 0     | 通用寄存器回写指示信号:             |
|                           |     |       | 0: 当前周期不回写通用寄存器;         |
|                           |     |       | 1: 当前周期回写通用寄存器。          |
| iu_pad_gpr_index[4:0]     | О   | -     | 寄存器索引:                   |
|                           |     |       | 表示当前回写的通用寄存器的索引。         |
| iu_pad_gpr_data[31:0]     | О   | -     | 寄存器回写总线:                 |
|                           |     |       | 表示当前回写通用寄存器的值。           |
| $cp0\_pad\_mstatus[31:0]$ | О   | -     | 表示当前 mstatus 值。          |
| cp0_pad_mintstatus[31:0]  | О   | -     | 表示处理器当前中断等级。             |
| Cp0_pad_mcause[31:0]      | О   | -     | 表示当前 MCAUSE 寄存器的值。       |
| cpu_pad_lockup            | О   | 0     | 当 CPU 处于 lockup 状态时会将该信号 |
|                           |     |       | 置为高电平。一旦触发 CPU 锁定状态,     |
|                           |     |       | 该信号一直为 1, 当 CPU 进入调试模式   |
|                           |     |       | 或者响应 nmi 请求将该状态打断时,该     |
|                           |     |       | 信号为低电平。                  |

## 8.3 观测信号示例波形



图 8.1: 观测信号示例波形



如 图 8.1 所示,左侧光标所指位置 iu\_pad\_retire\_pc[31:0],当前退休 pc 为 0x19a,其指令为 addi x7, x3, 1792,其计算结果为 x7 的值为 0x701,在右侧光标位置可看到 iu\_pad\_gpr\_index[4:0] 为 7,表示回写目标寄存器标号为 7,回写值 iu\_pad\_gpr\_data[31:0] 为 0x701。由于 E902 指令退休位于流水线 EX 级,而寄存器回写操作位于 EX 级的后一个时钟周期,所以从观察到退休至观察到回写值,差了一级流水线。

# 第九章 地址空间属性设置

玄铁 E902 支持两种内存属性的配置,分别为是否可高缓(cacheable 或者 non-cacheable)的内存以及是否可暂存的内存(bufferable 或者 non-bufferable)。对于 cacheable 的内存地址空间,E902 从该区域访问得到的数据可以缓存在 E902 内部的指令或者数据 cache 中。而对于 bufferable 的内存地址空间,E902 在对该地址空间进行写操作时,总线写响应(HRESP)可由总线通路的任一节点返回,而不必等待 E902 访问的 slave 上写操作完成后再返回。反之,对于 non-bufferable 的内存地址空间,E902 对该地址空间的写操作的响应必须在 E902 访问的 slave 上写操作完成后由该 slave 返回给 E902。

全空间内存属性的配置在平头哥自定义的 sysmap.h 文件完成。sysmap.h 文件会随着 E902 代码一同交付给客户,客户需要在系统设计阶段完成对内存空间属性的设置,并将该文件放入项目文件列表中,一经设定,软件无法修改。

sysmap.h 支持对 8 个内存地址空间的属性设定,第 i (i 从 0 到 7) 个地址空间地址上限(不包含)由宏SYSMAP\_BASE\_ADDRi (i 从 0 到 7) 定义,地址下限(包含)由 SYSMAP\_BASE\_ADDRi-1 定义,具体为 SYSMAP\_BASE\_ADDRi-1 <= 第 i 个地址空间地址 < SYSMAP\_BASE\_ADDRi。第 0 个地址空间下限是 0x0,内存地址不在 sysmap.h 文件设定的 8 个地址区间的地址属性默认为 cacheable 和 bufferable。每个地址空间上下边界是 4KiB 对齐,因此宏 SYSMAP\_BASE\_ADDRi 定义的是地址的高 20 位。

落在第 i(i 从 0 到 7) 个地址空间内的地址的属性由宏 SYSMAP\_FLAGi (i 从 0 到 7) 定义,具体如图表 9-1 所示。

需要说明的是,该文件仅在硬件配置了 CACHE 时存在。

| į | 4 | 3         | 2          | 1 | 0 |
|---|---|-----------|------------|---|---|
|   | - | Cacheable | Bufferable |   | - |

图 9.1: sysmap.h 地址属性