

# 基于 FPGA 的 Turbo 码数据传输系统的实现

郭 臣 付高原 杨茂辉

(河海大学计算机与信息学院 南京 211100)

摘 要: Turbo 码是在低信噪比条件下具有良好纠错性能的信道编码,以与香农限仅差 0.7~dB 的特征而受到了科学研究者的广泛关注。目前,采用 Turbo 码实现大量数据的传输已经成为了无线通信传输协议的标配。介绍了 Turbo 码及其 FPGA 的实现,深入分析了 Turbo 码的解码理论与算法。首先,分析了 Turbo 码的编码流程及特性。其次,介绍了 Turbo 码的解码流程,并且讨论了在其解码过程中运用的 Max-Log-MAP 算法。最后,采用现场可编程逻辑门阵列(FPGA)硬件平台实现 Turbo 码的实时数据传输系统,并取得了良好的结果。

关键词: Turbo 码; FPGA; 数据传输系统; Max-LOG-MAP 算法

中图分类号: TN911.7 文献标识码: A 国家标准学科分类代码: 510.40

# Implementation of Turbo codes data transmission system on the basis of FPGA

Guo Chen Fu Gaoyuan Yang Maohui (Department of Computer and Information, Hohai University, Nanjing 211100, China)

**Abstract:** Turbo code is a channel coding with excellent error-correcting performance in the condition of low noise-signal ratio. It attracts attention of many science researchers in that Turbo code has significant performance of only 0.7 dB difference from Shannon limit. Currently, the utilization of Turbo code in data transmission has become the standard of wireless transmission protocols. This paper focuses on Turbo code and its implementation with FPGA and analyzes the decoding theory and algorithm of Turbo code. Firstly, it analyzes the process and characteristics of encoding. Then it introduces the decoding process and the Max-Log-MAP algorithm used in its decoding process. At last its ends up with the implementation of data transmission with field-programmable gate array(FPGA) and achieved good results.

Keywords: Turbo code; FPGA; data transmission system; Max-Log-MAP algorithm

#### 0 引 言

随着通信技术的快速发展和互联网业务的飞速增长,第四代移动通信技术已经普及,第五代移动通信技术也在积极的研究之中,现在,移动用户的数量越来越多;随着对通信需求的日渐多样化,用户对通信系统的要求也越来越高,这就需要移动运营商能够提供更加高性能、高效率的通信设备。目前通信系统提供的带宽和容量已足够大,但仍然无法满足人们对速率的需求。运营商从以前的 GSM 二代通信到现在的 LTE 四代通信,不断地进行新的尝试、设计新的设备。

Turbo 码近年来在 3G、4G 及卫星通信中等得到了大量的应用,对 Turbo 码的研究也随之兴起。它是一类具有接近于 Shannon 理论极限的性能优异的纠错码<sup>[1]</sup>。然而由于 Turbo 码原始采用的 MAP 译码算法具有很高的运算复

杂度,仿真及电路实现都比较困难,但随着 FPGA 的出现,让无线系统的快速开发和测试成为可能。近年来,对于在 FPGA 上实现 Turbo 码有了不少研究进展。本文在 FPGA 上实现了运用 Turbo 码的数据传输系统。基于 FPGA 的应用相较于传统的软件实现而言可以节省 CPU 资源,并且可使系统集成度得到一定的提升。

# 1 Turbo 码编译码的基本原理

#### 1.1 并联级联型 Turbo 码编码原理

Turbo 码能拥有接近于 Shannon 理论极限的译码性能主要归功于交织和解交织在编译码中的应用<sup>[2]</sup>,交织器用于改变信息在序列中的排列,以获取与原始内容相同但排列不同的信息序列。Turbo 码在译码器的接收端采用了迭代算法<sup>[3]</sup>。主要的应用方式将在下文中作简要介绍。经过理论研究应用迭代译码的算法可以让信道编码的译码的性

收稿日期:2017-03

能得到极大的提升,Turbo 码正是采用了这种方式,让其成为了受到广泛学者关注的优异纠错码。

Turbo 码常见的 3 种编码方式有:并联级联、串联级联以及混合级联。本文主要对并联级联进行研究。图 1 所表示的就是并行级联结构的 Turbo 码编码器。



图 1 并联级联型 Turbo 码的编码器结构

并联级联结构的 Turbo 码的编码器通常由交织器、两个递归系统卷积码(RSC,即分量编码器 1 和 2)、删余矩阵以及复接器 4 个部分组成 其中,递归卷积码是一个有限的状态机,能让编码器的性能得到提升。删余矩阵单元的作用是在整体上提高 Turbo 码的码率。

如图 1 所示,Turbo 码编码器的具体流程如下。首先,输入一个长度为 N 的信息序列  $\{u_k\}$ ,直接送入分量编码器 1 进行编码得到一个输出的 RSC 序列,这里称为 RSC1;其次,这个长度为 N 的信息序列  $\{u_k\}$  亦被送入交织器经过交织后得到交织序列  $\{u_n\}$ ,交织后的序列  $\{u_n\}$  再送入分量编码器 2 进行编码,再得到一个输出的 RSC 序列,这里称为 RSC2。 RSC1 和 RSC2 的 校验 序列 分别为  $\{x_p^{1k}\}$  和  $\{x_p^{2k}\}$ ;最后,为了让 Turbo 码的编码输出能够具有不同码率的码字,将分量编码器 1 和 2 的输出序列 RSC1 和 RSC2 经过删余矩阵进行操作得到一个输出序列,这里称为 RSC3,校验序列为  $\{x_p^{3k}\}$ 。 RSC3 与输出的长度为 N 的序列  $\{u_k\}$  一起被送入复接器,复接构成编码器的最终输出码字序列  $\{c_k\}$  [5-7]。需要注意的是,RSC1 和 RSC2 的生成矩阵是相同的。

在整个编码过程中,交织器的使用让 Turbo 码的编码 具有了近似随机的特点,也是 Turbo 码与其他信道编码的本质区别。假设交织器的长度为 N,输入的信息序列可以分为好几个帧,并且每个帧的长度也为 N。那么对于图 1 所示的 Turbo 码编码器,如果忽略截断比特的影响,最后输出的码字长度为 3N,这由帧数据长度为 N 的输入序列决定。这样的话, Turbo 码的码率就是 1/3。在实际设计 Turbo 码的编码器时,可以通过在两个子编码器(即两个分量编码器)之间进行切换,将 Turbo 码的码率设置为 1/2。交织器改变输入序列的汉明重量分布,目的是输入序列各个帧之间的汉明重量差,降低相关性。通过这种方式,可以

控制解码序列的长度,让 Turbo 码的纠错性能达到用户对误码率的要求。

## 1.2 并联级联型 Turbo 码的译码原理

Turbo 码在接收端应用了迭代译码算法。其基本结构如图 2 所示。由图中的结构可以看出,分量译码器 1 传输信息给分量译码器 2 以及分量译码器 2 给予分量译码器 1 反馈信息,这样的软信息交换提高了 Turbo 码的译码和纠错性能<sup>®</sup>。由图 1 所示的编码器基本结构可知,Turbo 码的编码需要两个或以上数量的分量编码器,那么,Turbo 码的译码过程也需要采用同样数量的译码器单元<sup>[9]</sup>。



图 2 并行级联型 Turbo 码的译码结构

图 2 以采用两个分量译码器(DEC)单元为例。由图 2 可知,译码器由若干个分量译码器通过串行级联而成,级联中辅以交织器和解交织器。需要注意的是,为了让软信息在各个分量译码器之间进行数据交换,分量译码器采用软输入软输出(SISO)结构。另外,在译码器中采用的是与在编码器中同样的交织器。

Turbo 码译码器的整个流程如下。首先,在接收端,译码器接收的信息连同先验信息和校验信息 3 部分送入分量译码器 1 对 RSC1 进行译码,得到一个输出,这个输出经过求和后包含一个与先验信息和接收信息无关的外部信息。其次,以分量译码器 1 输出的外部信息通过交织后的信息作为先验信息,连同接收的信息和校验信息送到分量解码器 2 对 RSC2 进行译码,得到一个输出,同样的,这个输出经过求和后也包含一个与先验信息和接收信息无关的外部信息。最后以分量译码器 2 输出的外部信息经过解交织后的信息作为先验信息反馈至分量译码器 1,完成一次迭代。重复以上的迭代过程,当分量译码器 1 和 2 的输出信息趋于稳定之后,对分量译码器 2 输出的对数似然比进行硬判决,即可得到最终的译码输出[10-11]。

#### 1.3 基于 MAP 算法的 Turbo 码译码原理以及简化算法

在图 2 所示的 Turbo 码译码器中,分量译码器采用的译码算法是 MAP 算法。MAP 算法是基于编码网格图的

• 222 •

SISO 译码算法,目的是使译码输出比特错误概率最小<sup>[12]</sup>。它在理论上可以准确计算每个信息 Byte 的后验概率。译码结果的判决为:

$$u_k = \begin{cases} 1, & L(u_k) \geqslant 0 \\ 0, & L(u_k) < 0 \end{cases}$$
 (1)

式中:  $L(u_k)$  是  $u_k$  的对数似然比(logLikelihood ratio),定义为[13].

$$L(u_k) = \ln \frac{P(u_k = 1 \mid y_1^N)}{P(u_k = 0 \mid y_1^N)}$$
 (2)

MAP 算法是最优的 SISO 算法,但是它的计算非常复杂,根据 MAP 算法的原理,每个信息比特的  $L(u_k)$  的计算式为:

$$L(u_k) = \ln \left[ \frac{\sum_{S_k} \sum_{i_{k-1}} \gamma_1(S_{k-1}, S_k) \alpha_{k-1}(S_{k-1}) \beta(S_k)}{\sum_{S_k} \sum_{i_{k-1}} \gamma_0(S_{k-1}, S_k) \alpha_{k-1}(S_{k-1}) \beta(S_k)} \right]$$
(3)

式中:  $\alpha_k(S_k)$  是前向状态度量,  $\beta_k(S_k)$  是后向状态度量,  $\gamma(S',S)$  是分支度量,  $S_k$  是 k 时刻的状态。

MAP 算法涉及复杂的乘法运算和乘方运算,运算复杂度高,硬件资源消耗较大,效果不明显 为了避免MAP 算法复杂的运算,提出了 Log-MAP 算法,它在对数域中进行 MAP 算法的运算,将乘法转换为加法,所以实现要比 MAP 算法简单,复杂度降低,适用于硬件实现。Log-MAP 算法定义了(4)式的近似算法来消除对数和指数的运算

$$\max_{e}(f(e)) = \ln\left(\sum_{e} e^{f(e)}\right) \tag{4}$$

由雅克比对数等式可以得到:

$$\ln(e^{x} + e^{y}) = \max(x, y) + \ln(1 + e^{-|x-y|}) = \max(x, y) + f_{\epsilon}(|x - y|)$$
 (5)

若进一步简化,令  $f_{\varepsilon}(|x-y|)=0$ ,可以得到

$$\ln(e^x + e^y) = \max(x, y) \tag{6}$$

这种将指数运算转换成 max 运算的算法就是 Max-Log-MAP 算法。

表 1 为 MAP 算法及其简化算法的复杂性比较,其中 参数 v 为编码的记忆长度。

表 1 几种译码算法的复杂性比较

| 过程  | MAP                | Log-MAP               | Max-Log-MAP            |
|-----|--------------------|-----------------------|------------------------|
| 求最大 |                    | $5 \times 2^v - 2$    | $5 \times 2^v - 2$     |
| 加法  | $4 \times 2^v$     | $15 \times 2^{v} + 9$ | $10 \times 2^{v} + 11$ |
| 乘法  | $6 \times 2^v + 1$ | 8                     | 8                      |
| 查找  |                    | $5 \times 2^v - 2$    | 0                      |

由表 1 可见,3 种算法中 MAP 乘法运算量最大,所以算法最为复杂;Log-MAP 算法将乘法运算转换为加法运算降低了算法实现的复杂度,同时为硬件实现减少了对资源的需求;Max-Log-MAP 算法进一步降低了算法的复杂性,

但性能也降低了。

图 3 为使用 MATLAB 软件对几种译码算法在误比特率信噪比关系下的仿真。仿真采用 3GPP 标准交织器,1/3码率,交织长度为 1 024 进行 5 次迭代的仿真结果。



图 3 算法性能比较

从图中可以看出,Log-MAP 算法由于复杂度高,所以性能最好;Max-Log-MAP 算法由于进行了简化,所以性能上有所下降,但是便于硬件实现且误比特率在可接受的范围之内,所以实际应用中采用 Max-Log-MAP 算法;传统的 SOVA 算法计算最简单,所以性能相应的降低了很多;SW-Log-MAP 算法将大数据块分解成许多小数据块计算后向状态度量  $\beta_k(S_k)$ ,可以降低算法延时,性能相较于 Max-Log-MAP 算法有所提高。

# 2 基于 Turbo 码进行数据传输的 FPGA 实现

FPGA(现场可编程逻辑门阵列)内部拥有大量的逻辑门单元[15-16]。每个逻辑门单元都通过路由通道连接。逻辑门单元和路由通道可以由用户在现场设置。近年来,由于微电子快速发展,FPGA 的性能指标大大提高,规模更大,功能更多,时间性更好。因此,FPGA 在数字系统设计中扮演越来越重要的角色。采用 FPGA 进行 Turbo 码的硬件实现,可以很好的弥补由迭代代码带来的实时性不佳的缺点。

本文选用的是 Spartan6 系列中 XC6SLX25-FTG256 芯片,其中包含了 30 064 个逻辑门、3 758 个 SLICE、38 个 DSP48A21 核、52 组 18 KB Block RAM、2 组 CMT 以及 188 个 I/O 引脚,每组 18 KB 的 Block RAM 可以用作 2 个 9 KB的 Block RAM;每组 CMT 包含 2 个 DCM 和 1 个 PLL<sup>[17]</sup>。充足的资源为实现 Turbo 码的编解码提供了硬件基础。系统整体设计框图如图 4 所示。

整个硬件系统由 4.3 in LCD 显示屏构成的显示模块、 LX25 最小系统板和 100M 网络构成的网络传输与接收模块 3 部分组成。运行过程需要两个系统同时运行,其中一



图 4 系统整体框图设计

个系统对相应的图像数据进行 Turbo 码编码,经过网络传输模块将数据送出,另一个系统接收到之后进行 Turbo 码译码,送到 LCD 显示屏显示。

整个系统在时钟上的要求比较高,所以顶层模块需要对整个系统的时钟进行分配、对系统的时序进行协调和控制以及对系统产生的各类数据进行处理等操作,同时保证程序运行过程中按照正确的时序进行。在顶层模块设计调试时采用了 Xilinx 公司提供的 Chipscope 软件进行了软硬件联合调试。图 5 为 Chipscope 对内存部分相关时序分析结果。



图 123 Chipscope 软件调试

在对各个模块进行了经过仿真、电路设计、软硬件调试等过程后,实现了以 Xilinx-FPGA XC6SLX25 为核心的 Turbo 码数据传输系统。如图 6 所示。该系统可以将要求发送的数据(以图片为例)经过编码通过网络传输模块发送至另一个终端进行解码并在显示屏上显示。图 6 为接收端的效果图,可以看出,图片数据的传输效果良好。

#### 3 结 论

自 1948 年香农发表著名的 Shannon 理论以来,编码学者从构造长码以及简化译码复杂度方向上提出了很多编码方案。经过多年的理论发展,到 1993 年 Turbo 码的提出,以及后续越来越多的简易算法的出现,使 Turbo 码的实现逐步成为可能。Turbo 码应用了独特的迭代解码结构和交织器,具有了接近 Shannon 极限的优越解码性



图 6 最终实现的效果图

能。本文研究了 Turbo 码的编译码原理,并在此基础上设计了以 Xilinx 公司 XC6SLX25 芯片为核心处理器的 Turbo 码编译码数据传输系统。在实际的运行中取得了不错的效果。

## 参考文献

- [1] MISHRA S, MISHRA A, SHASTRI A, et al. FPGA implementation of iterative decoder for turbo codes for software defined radio [C]. International Conference on Wireless Communications, Signal Processing and Networking, 2016; 2357-2361.
- [2] 张琼. 3-DTurbo 码在中继协作传输方案中的应用[D]. 西安:西安电子科技大学. 2014.
- [3] 胡佳彬. Turbo 码与 RS-Turbo 级联编码在光正交频 分复用系统中的应用[D]. 天津: 天津理工大学,2016.
- [4] 雷明然,李鹤,李琦. Turbo 编码调制技术在物理层网络编码中的应用研究[J]. 电子设计工程,2014,22(16):135-138.
- [5] 张旻,陆凯,李歆昊. Turbo 编码类型的盲识别方法[J]. 电子测量与仪器学报,2015,29(5):701-707.
- [6] PARK S J, JEON J H. Interleaveropti-mization of convolutional turbo code for 802. 16 systems [J]. Communications Letters, IEEE, 2009, 13 (5): 339-341.
- [7] 严敏. Turbo 码在 OFDM 传输系统中的应用研究[D]. 西安:西安电子科技大学. 2014.
- [8] GNANASEKARAN T, AARTHI V. Performance enhancement of modified log MAP decoding algorithm for turbo codes [C]. International Conference on Communication and Computational Intelligence, IEEE, 2010;368-373.

• 224 •

- [9] **汪烜,徐哲.** 一种滑窗结构的 Turbo 译码器实现方法[J]. 制导与引信,2016,37(2):48-52.
- [10] XU J, ZHAO Y, DUAN S Q. Research and realization by FPGA of Turbo codes [J]. Advanced Materials Research, 2012, 588-589:765-768.
- [11] PAPAHARALABOS S, SYBIS M, TYCZKA P, et al. Modified Log-MAP Algorithm for Simplified Decoding of Turbo and Turbo TCM codes [C]. Vehicular Technology Conference, 2009, Vtc Spring 2009, IEEE, 2009:1-5.
- [12] 涂娟. 基于 MATLAB 的 Turbo 码译码算法研究分析[J]. 信息通信,2016(11):30-31.
- [13] 崔中普,高俊,窦高奇. Turbo 码译码算法分析与研究[J]. 通信技术,2016,49(9):1144-1148.

- [14] 陈为刚,李思,赵干,等.基于软件无线电的 Turbo 码 编码通信系统实现[J].电子测量技术,2013,36(11): 110-114.
- [15] **王飞.** 基于 FPGA 的全数字化峰值时刻检测技术[J]. 电子测量与仪器学报,2015,29(6):914-919.
- [16] 基于能量变化率的气体超声波流量计信号处理方法[J]. 仪器仪表学报,2015,36(9):2138-2144.
- [17] 徐文波,田耘. Xilinx FPGA 开发实用教程[M]. 2 版. 北京:清华大学出版社, 2012.

## 作者简介

郭臣,1993年出生,硕士研究生,主要研究方向为现代 无线通信网络、信号与信息处理。

E-mail: 1823563649@qq.com