编译器技术交流会系列报告简介(四):方建滨,国防科技大学,面向飞腾并行系统的OpenCL高效实现技术
报告题目:面向飞腾并行系统的OpenCL高效实现技术
报告人:方建滨,国防科技大学
报告简介:
OpenCL能够保证使用统一编程接口和语言编写的程序运行在多种类平台上(包括CPU、GPU及其它加速器)。然而,这需要在每个平台上构建平台特定的OpenCL实现。本工作提出一种面向飞腾并行系统的OpenCL实现从而将通用的OpenCL平台模型高效地映射到具体的飞腾并行平台。基于该实现,我们首先从计算能力和访存能力对飞腾设备做了特征化并度量了该OpenCL实现的开销,揭示了进一步优化该实现的方向。接着,选取11个基准测试程序并在飞腾平台上比较分析了每个程序的OpenCL实现与串行实现、OpenMP实现的性能。通过实验发现(1)相对于OpenMP实现,OpenCL实现在飞腾平台上可以取得约6倍的加速比,(2)面向GPU优化的OpenCL代码往往需要重构从而使之高效地运行在飞腾处理器上。
报告人简介:
方建滨,博士,现工作于国防科技大学计算机学院软件研究所。2007年于中南大学计算机科学与技术系获得学士学位,2010年于国防科技大学计算机学院获得硕士学位,2014年于荷兰代尔夫特理工大学获得计算机科学博士学位。目前主要在高性能计算领域致力于并行编程模型、面向体系结构的代码变换、并行程序性能分析与优化等方面的研究。