计算机工程与应用 ›› 2015, Vol. 51 ›› Issue (21): 41-47.
朱正东1,刘 袁1,魏洪昌1,颜 康1,王寅峰2,董小社1
ZHU Zhengdong1, LIU Yuan1, WEI Hongchang1, YAN Kang1, WANG Yinfeng2, DONG Xiaoshe1
摘要: 针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。