带有AVX-512的Intel KNL处理器上矩阵矩阵乘法的实现,Cluster Computing - X-MOL

当前位置： X-MOL 学术 › Cluster Comput. › 论文详情

Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)

带有AVX-512的Intel KNL处理器上矩阵矩阵乘法的实现
Cluster Computing ( IF 3.6 ) Pub Date : 2018-06-01 , DOI: 10.1007/s10586-018-2810-y
Roktaek Lim , Yeongha Lee , Raehyun Kim , Jaeyoung Choi

代号为Knights Landing（KNL）的第二代Intel Xeon Phi处理器最近出现了2D瓦片网格体系结构和Intel AVX-512指令。但是，由于一般用户不熟悉最佳的缓存重用，有效的矢量化和汇编语言，因此使新用户很难获得最佳性能。在本文中，我们说明了几种开发策略，可通过执行常规矩阵-矩阵乘法而不使用汇编语言来使用C编程语言实现良好的性能。我们对矩阵-矩阵乘法的实现基于阻塞式矩阵乘法，它是一种优化技术，可提高数据重用性。我们使用数据预取，循环展开和Intel AVX-512来优化分块矩阵乘法。当我们使用KNL的单个内核时，我们的实现使用Intel MKL（当前最新的库）实现了SGEMM的98％和DGEMM的99％。我们使用KNL的所有68个内核对并行DGEMM的实现，使用英特尔MKL最多可实现90％的DGEMM。

"点击查看英文标题和摘要"

更新日期：2018-06-01

点击分享查看原文

点击收藏

阅读更多本刊新发论文本刊介绍/投稿指南

相关文章参考文献引文

点击加载相关文章

全部期刊列表>>

阿拉丁

老年学Q1区期刊征稿进行中

FEMS Journals历年主题

分享您的投稿习惯

经济学SSCI期刊

英语语言编辑翻译加编辑新

加速出版服务新

1212购书送好礼

Springer旗下全新催化方向高质新刊

动物学生物学

系统生物学合成生物学

专注于基础生命科学与临床研究的交叉领域

传播分子、细胞和发育生物学领域的重大发现

聚焦分子细胞和生物体生物学

图书出版流程

快速找到合适的投稿机会

热点论文一站获取

定位全球科研英才

中国图象图形学学会合作刊

多伦多

西安科技

多伦多

新加坡

浙江大学

中科院

新加坡

ACS材料视界

客服邮箱：service@x-mol.com
官方微信：X-molTeam2
邮编：100098
地址：北京市海淀区知春路56号中航科技大厦

bug