CPU/ATI GPU混合体系结构上DGEMM的性能研究 | |
李兴建; 谭光明; 李佳佳 | |
刊名 | 信息技术快报 |
2011-11-26 | |
卷号 | 9期号:6页码:12 |
关键词 | 高性能计算 Gpu Cal 矩阵乘法 |
英文摘要 | 本文报道了我们在CPU/ATI GPU混合体系结构上优化双精度矩阵乘法(DGEMM)的工作。在真实应用中, CPU与图形处理器(GPU)之间的数据传输是影响性能的关键因素。由于软件流水可以降低数据传输开销,我们提出了三种软件流水算法,分别是双缓存(Double Buffering)、数据重用(Data Reuse)和数据存储优化(Data Placement)。在AMD公司的图形处理器(GPU)ATI HD5970上,优化后DGEMM性能达到758 GFLOP/s,对应效率为82%,是ACML-GPU v1.1性能的两倍。在Intel Westmere EP和ATI HD5970组成的异构系统上,性能达到844 GFLOP/s,效率为80%。我们进一步考察了多个CPU和多个GPU上DGEMM的扩展性,详细分析了体系结构方面的影响因素。分析表明,PCIe总线和内存总线的竞争是异构系统上程序性能降低的重要影响因素。 |
语种 | 中文 |
公开日期 | 2011-12-31 |
内容类型 | 期刊论文 |
源URL | [http://ictir.ict.ac.cn/handle/311040/1260] |
专题 | 信息技术快报_2011 |
推荐引用方式 GB/T 7714 | 李兴建,谭光明,李佳佳. CPU/ATI GPU混合体系结构上DGEMM的性能研究[J]. 信息技术快报,2011,9(6):12. |
APA | 李兴建,谭光明,&李佳佳.(2011).CPU/ATI GPU混合体系结构上DGEMM的性能研究.信息技术快报,9(6),12. |
MLA | 李兴建,et al."CPU/ATI GPU混合体系结构上DGEMM的性能研究".信息技术快报 9.6(2011):12. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论