个人简介
学历
1988年9月——1992年7月,山东科技大学 计算机科学与技术 本科
1992年9月——1995年7月,山东科技大学 计算机科学与技术 硕士
1999年9月——2002年7月,中科院计算所 计算机系统结构 博士
学位
计算机系统结构 工学博士
出国学习工作
2007年6月,访问法国INRIA一周;
2009年10月-2010年5月,在美国普渡大学和休斯敦大学作高级访问学者;
工作简历
2010-05~现在, 中国科学院计算技术研究所, 副研究员
2010-04~2010-05,美国休斯顿大学, 高级访问学者
2009-11~2010-03,美国普渡大学, 高级访问学者
2005-11~2009-10,中国科学院技术技术研究所, 副研究员
2002-07~2005-11,中国科学院计算技术研究所, 助理研究员
专利成果
( 1 ) 基于消息传递接口的设备的通信行为信息提取方法及系统, 发明, 2011, 第 3 作者, 专利号: 200910085801.1
( 2 ) 一种利用数据拓扑信息的优先级分组调度方法及系统, 发明, 2015, 第 1 作者, 专利号: 201510382438.5
科研项目
( 1 ) 面向多核/众核处理器的并行程序编程技术、框架和语言支持之计算所课题, 主持, 国家级, 2012-01--2015-12
( 2 ) 面向气候和湍流模拟的百万量级异构众核可扩展并行算法与优化方法, 参与, 国家级, 2015-01--2019-12
( 3 ) 面向E量级系统的并行算法与应用支撑技术, 主持, 国家级, 2016-07--2018-06
( 4 ) 华为A类异构并行框架技术研究项目的支持跨平台编译优化系统, 主持, 研究所(学校), 2018-03--2019-03
( 5 ) 新型高效能计算、编程和运行模型的面向E级计算机的跨平台统一编程模型研究, 参与, 国家级, 2017-06--2020-12
( 6 ) 地球系统模式的改进、应用开发和高性能计算的课题三“可扩展百万核并行共性算法与性能优化关键技术研发”, 参与, 国家级, 2016-07--2021-06
( 7 ) DPU众核处理器的编程和编译环境研究, 主持, 市地级, 2018-07--2020-06
( 8 ) Dataflow based Task-level parallel optimization Framework技术合作项目, 主持, 院级, 2020-04--2021-04
参与会议
(1)Exploiting the potential of multicore computers through high level language abstractions 中丹多核计算研讨会 陈莉 2013-04-11
(2)Exploiting the potential of HPP architectures through high level language abstractions 第二届RIKEN AICS国际会议——艾级计算的计算机和计算科学 陈莉 2012-03-01
(3)Unified Parallel C for GPU Clusters: Language Extensions and Compiler Implementation 第23届并行计算的语言和编译技术研讨会 Li Chen 2010-10-07
项目协作单位
1.Intel Corp., Scalable Execution Environment of Heterogeneous Multi-/Many-core(多核/众核的异构平台上的可扩展执行环境)
2.University of Houston, on "Data oriented extensions to shared memory programming model for hetergeneous Many-core systems (异构平台上以数据为中心的多线程编程模型扩展)."
研究领域
曙光系列超级计算机的UPCH语言和编程环境、神威E级原型机上AceMesh数据流并行编程语言、GPU平台上OpenMP语言扩展和优化技术、多粒度并行化编译系统ParaORC研制、SIMD并行编译优化系统的研究等。
目前的主要研究兴趣是面向高性能计算的并行编程语言,面向新型众核结构的并行编译优化技术。
面向科学计算领域,研究数据驱动的、结构化的并行编程语言,以简化异构和大规模并行系统上多层次并行性的挖掘、自动实现通信和计算的协同优化,提高高性能计算平台上的编程效率、负载均衡和并行扩展性。主要挑战包括,统一表达节点内/节点间多粒度的异步并行性、自适应的通信优化、计算热点的异构编译优化等。
面向深度学习网络,为新型众核结构(AI芯片)研究编程方法和编译优化技术。为AI芯片提供高层的编程语言和工具环境,建立可扩展的编译优化框架以自动挖掘深度学习算子中隐含的大量并行性,并优化地映射到AI芯片复杂的组织结构上。
近期论文
查看导师最新文章
(温馨提示:请注意重名现象,建议点开原文通过作者单位确认)
(1) AceMesh:一个面向高性能计算、结构化、数据驱动的编程语言, AceMesh: A Structured Data Driven Programming Language for High Performance Computing, CCF Transactions on High Performance Computing, 2020, 第 1 作者
(2) 用数据驱动的编程模型并行多重网格应用, Parallelizing a Multigrid application using Data-Driven Programming Model, 计算机科学, 2020, 第 3 作者
(3) 一个面向任务图并行程序的错误检查工具, An Error Checking Tool for DAG-based Task Parallel Programs, 计算机科学, 2017, 第 2 作者
(4) 异构并行编程模型研究与进展, Research on Heterogeneous Parallel Programming Model, 软件学报, 2014, 第 4 作者
(5) 任务并行编程模型研究与进展, Research on Task Parallel Programming Model, 软件学报, 2013, 第 3 作者
(6) 支持算法组件自动替换的编程范式及编译框架, a programming paradigm and compiler framework for automatic replacement of algorithm components, 高技术通讯, 2013, 第 3 作者
(7) 用共享工作表在UPC语言中支持无定形的数据并行性, Shared work list: hacking amorphous data parallelism in UPC, 2012 International Workshop on Programming Models and Applications for Multicores and Manycores (in conjunction with PPoPP2012) , 2012, 第 2 作者
(8) 异构平台上编译辅助的运行时预取, A compiler-assisted runtime-prefetching scheme for heterogeneous platforms, Proceedings of the 8th International Workshop on OpenMP , 2012, 第 1 作者
(9) PADS:基于编译技术的stencil优化工具, PADS: A Pattern-Driven Stencil Compiler-Based Tool for Reuse of Optimizations on GPGPUs, IEEE 17th International Conference on Parallel and Distributed Systems , 2011, 第 3 作者
(10) 计算模式驱动的OpenMP程序的自动编译优化, Computation Pattern Driven Reuse of Mannul Optimizations for GPGPUs, 12th International Conference on Parallel and Distributed Computing, Applications and Technologies, 2011, 第 3 作者
(11) GPU集群上的UPC语言扩展和编译实现, Unified Parallel C for GPU Clusters: Language Extensions and Compiler Implementation, 23rd International Workshop on Languages and Compilers for Parallel Computing, 2010, 第 1 作者
(12) 带类型恢复的编译器源源翻译技术, A source-to-source translation method with type restoration in a compiler, 计算机研究与发展, 2010, 第 3 作者
(13) 面向向量化的局部数据重组, Vectorization-oriented local data regrouping, 小型微型计算机系统, 2009, 第 3 作者
(14) 面向非多媒体程序的SIMD向量化算法的研究及改进, Research and improvement of SIMD vectorization algorithms on non-multimedia applications, 小型微型计算机系统, 2009, 第 3 作者
(15) 基于页分配面向DRAM行缓冲的局部性优化, PARBLO: Page-Allocation-Based DRAM Row Buffer Locality Optimization, Journal of Computer Science and Technology, 2009, 第 4 作者
(16) 分布主存系统上的全局tiling技术, Global loop tiling for distributed memory systems, 14th International Euro-Par Conference on Parallel and Distributed Computing, 2008, 第 2 作者
(17) 利用全局循环分块实现多分割, Automatic Implementation of Multi-partitioning Using Global Tiling, 14th IEEE International Conference on Parallel and Distributed Systems, 2008, 第 4 作者
(18) 全局部分重复计算划分, Global partial replicated computation partitioning, 计算机研究与发展, 2006, 第 2 作者
(19) 基于动态profiling技术的流水粒度调优, Tuning Pipeline granularity based on dynamic profiling framework, 计算机研究与发展, 2005, 第 2 作者
(20) 针对SMP集群的并行化编译技术, Integrating Parallelizing Compilation Technologies for SMP Clusters, Journal of Computer Science and Technology , 2005, 第 2 作者
(21) 全局部分冗余的计算划分技术, Global Partial Replicate Computation Partitioning, International Conference on Parallel Processing, 2004, 第 2 作者
学术兼职
2013-03-27-2014-03-29,HPCC2013, program committee
2006-08-10-2007-03-28,HIPS 2007, program committee