面向众核GPU加速系统的网络编码并行化及优化

计算机工程与应用 ›› 2014, Vol. 50 ›› Issue (21): 79-84.

面向众核GPU加速系统的网络编码并行化及优化

唐绍华

湖南工程职业技术学院信息工程系，长沙 410151

出版日期:2014-11-01 发布日期:2014-10-28

Parallelizing network coding on manycore GPU-accelerated system with optimization

TANG Shaohua

Department of Information Engineering, Hunan Engineering Polytechnic, Changsha 410151, China

Online:2014-11-01 Published:2014-10-28

摘要/Abstract

摘要： 网络编码允许网络节点在数据存储转发的基础上参与数据处理，已成为提高网络吞吐量、均衡网络负载和提高网络带宽利用率的有效方法，但是网络编码的计算复杂性严重影响了系统性能。基于众核GPU加速的系统可以充分利用众核GPU强大的计算能力和有效利用GPU的存储层次结构来优化加速网络编码。基于CUDA架构提出了以片段并行的技术来加速网络编码和基于纹理Cache的并行解码方法。利用提出的方法实现了线性随机编码，同时结合体系结构对其进行优化。实验结果显示，基于众核GPU的网络编码并行化技术是行之有效的，系统性能提升显著。

关键词: 网络编码, 图形处理器（GPU）, 并行, 计算统一设备架构（CUDA）, 优化

Abstract: It is well known that network coding has emerged as a promising technique to improve network throughput, balance network loads as well as better utilization of the available bandwidth of networks, in which intermediate nodes are allowed to perform processing operations on the incoming packets other than forwarding packets. But, its potential for practical use has remained to be a challenge, due to its high computational complexity which also severely damages its performance. However, system accelerated by many-core GPU can advance network coding with powerful computing capacity and optimized memory hierarchy from GPU. A fragment-based parallel coding and texture-based parallel decoding are proposed on CUDA-enable GPU. Moreover, random linear coding is parallelizing using CUDA with optimization based on proposed techniques. Experimental results demonstrate a remarkable performance improvement, and prove that it is extraordinarily effective to parallelize network coding on many-core GPU-accelerated system.

Key words: network coding, Graphic Processing Unit（GPU）, parallelizing, Compute Unified Device Architecture（CUDA）, optimization

唐绍华. 面向众核GPU加速系统的网络编码并行化及优化[J]. 计算机工程与应用, 2014, 50(21): 79-84.

TANG Shaohua. Parallelizing network coding on manycore GPU-accelerated system with optimization[J]. Computer Engineering and Applications, 2014, 50(21): 79-84.

[1]	孙泽宇，徐琛，苏艳超，李传锋，聂雅琳. 雾计算中跨层感知分簇路由协议[J]. 计算机工程与应用, 2021, 57(9): 109-117.
[2]	张朕通，单玉刚，袁杰. 联合多尺度和注意力机制的遥感影像检测[J]. 计算机工程与应用, 2021, 57(9): 212-216.
[3]	兰红，黄敏. 融合KNN优化的密度峰值和FCM聚类算法[J]. 计算机工程与应用, 2021, 57(9): 81-88.
[4]	高一锴，彭力，徐龙壮. 改进AFSA算法优化TWSVM的火焰识别方法[J]. 计算机工程与应用, 2021, 57(8): 204-213.
[5]	高铖铖，陈锡程，张瑞，宋秋月，易东，伍亚舟. 三种新型智能算法在疫情预警模型中的应用——基于百度搜索指数的COVID-19疫情预警[J]. 计算机工程与应用, 2021, 57(8): 256-263.
[6]	史春天，曾艳阳，侯守明. 群体智能算法在图像分割中的应用综述[J]. 计算机工程与应用, 2021, 57(8): 36-47.
[7]	杜垚. 结合局部优化匹配的Android恶意家族检测算法[J]. 计算机工程与应用, 2021, 57(8): 84-90.
[8]	李俊丽. Spark平台下类别数据互信息计算的并行化[J]. 计算机工程与应用, 2021, 57(7): 95-100.
[9]	张水平，王丽娜. 果蝇优化算法的进展研究分析[J]. 计算机工程与应用, 2021, 57(6): 22-29.
[10]	许小媛，李海波，黄黎. 云存储多异构文件联合延迟尾概率凸优化分析[J]. 计算机工程与应用, 2021, 57(5): 88-94.
[11]	沈瑜，刘成，杨倩. 利用子空间稀疏特征的超分辨率图像重建算法[J]. 计算机工程与应用, 2021, 57(5): 173-182.
[12]	石杰元，袁志勇，廖祥云，赵俭辉. 面向磁悬浮视触觉交互的多速率系统框架[J]. 计算机工程与应用, 2021, 57(5): 197-203.
[13]	胡晓敏，王明丰，张首荣，李敏. 用于文本聚类的新型差分进化粒子群算法[J]. 计算机工程与应用, 2021, 57(4): 61-67.
[14]	唐蕊，焦继业，徐华昊. 面向嵌入式的卷积神经网络硬件加速器设计[J]. 计算机工程与应用, 2021, 57(4): 252-257.
[15]	杨玮，吴莹莹，王婷. 子母式穿梭车仓储系统配置优化问题研究[J]. 计算机工程与应用, 2021, 57(4): 258-265.