个人简介
招生专业
081201-计算机系统结构
招生方向
并行编程,并行编译,异构编译
教育背景
2006-09--2011-09 中国科学院计算技术研究所 博士
2001-09--2004-02 清华大学 硕士
1997-09--2001-07 清华大学 学士
工作简历
2019-10~现在, 中科院计算所, 研究员
2012-10~2019-10,中国科学院计算技术研究所, 副研究员
2011-09~2012-10,中国科学院计算技术研究所, 助理研究员
教授课程
编译原理(研讨课)
研究领域
构编程模型,异构编译优化,数据中心编程与编译技术等。
近期论文
查看导师新发文章
(温馨提示:请注意重名现象,建议点开原文通过作者单位确认)
(1) DNNTune: Automatic Benchmarking DNN Models for Mobile-cloud Computing, TACO, 2020, 第 3 作者
(2) Referee: A Pattern-Guided Approach for Auto Design in Compiler-Based Analyzers, SANER, 2020, 第 5 作者
(3) Panthera: Holistic Memory Management for Big Data Processing over Hybrid Memories, PLDI, 2019, 第 2 作者
(4) PPOpenCL: a performance-portable OpenCL compiler with host and kernel thread code fusion, CC, 2019, 第 4 作者
(5) NVM Streaker: a fast and reconfigurable performance simulator for non-volatile memory-based memory architecture, Journal of Supercomputing, 2018, 第 4 作者
(6) Revisiting Loop Tiling for Datacenters: Live and Let Live, ICS, 2018, 通讯作者
(7) On Retargetting the AI Programming Framework to New Hardwares, NPC, 2018, 第 5 作者
(8) Lazygraph: lazy data coherency for replicas in distributed graph-parallel computation., PPoPP, 2018, 第 4 作者
(9) Revisiting Loop Tiling for Datacenters: Live and Let Live, ICS, 2018, 第 2 作者
(10) Parallel Incremental Frequent Itemset Mining for Large Data, journal of computer science and technology, 2017, 通讯作者
(11) A Collaborative Divide-and-Conquer K-Means Clustering Algorithm for Processing Large Data. , CF, 2014, 第 1 作者
(12) An Empirical Model for Predicting Cross-Core Performance Interference on Multicore Processors. , PACT, 2013, 通讯作者
(13) Layout-oblivious compiler optimization for matrix computations, ACM Transaction on Architecture and Code Optimization, 2013, 第 1 作者
(14) A Hybrid Circular Queue Method for Iterative Stencil Computations on GPUs, J. Comput. Sci. Technol, 2012, 第 2 作者
(15) Extendable pattern-oriented optimization directives, ACM Transaction on Architecture and Code Optimization, 2012, 第 1 作者
(16) Layout-oblivious optimization for matrix computations, PACT, 2012, 第 1 作者
(17) A Highly Parallel Reuse Distance Analysis Algorithm on GPUs, IPDPS, 2012, 第 1 作者
(18) Extendable pattern-oriented optimization directives, CGO, 2011, 第 1 作者
(19) Automatic Library Generation for BLAS3 on GPUs, IPDPS, 2011, 第 1 作者
(20) Landing Stencil Code on Godson-T, J. Comput. Sci. Technol., 2010, 第 1 作者
(21) An adaptive task creation strategy for work-stealing scheduling, CGO, 2010, 第 2 作者