个人简介
招生专业
083500-软件工程
081202-计算机软件与理论
招生方向
大数据系统,机器学习系统,分布式系统
教育背景
2009-09--2016-01 中国科学院软件研究所 工学博士
2005-09--2009-06 武汉大学 工学学士
工作简历
2019-10~现在, 中国科学院软件研究所, 副研究员
2016-01~2019-09,中国科学院软件研究所, 助理研究员
2014-11~2015-02,阿里巴巴公司, 客座研究生
2013-04~2013-09,微软亚洲研究院, 客座研究生
2010-06~2010-08,腾讯公司, 客座研究生
奖励信息
(1) 中国科学院青年创新促进会会员, 院级, 2019
(2) 中科院软件所优秀青年科技人才, , 研究所(学校), 2018
(3) 2016年OW2国际开源软件程序竞赛, 二等奖, 其他, 2016
(4) 2016年NASAC原型竞赛, 三等奖, 其他, 2016
(5) 中国科学院大学国家奖学金, 院级, 2012
专利成果
( 1 ) 一种基于Spark SQL的分布式全文检索系统及方法, 发明, 2019, 第 1 作者, 专利号: ZL201710269870.2
( 2 ) 一种面向大规模流数据的分布式聚类方法及系统, 发明, 2019, 第 1 作者, 专利号: CN201910795304.4
( 3 ) 一种基于状态更新传播的流式图计算方法及系统, 发明, 2018, 第 1 作者, 专利号: CN201810721794.9
( 4 ) 一种大数据流处理框架的性能基准测试系统及方法, 发明, 2018, 第 2 作者, 专利号: CN201810461515.X
发表著作
(1) 《大数据处理框架Apache Spark设计与实现》, 电子工业出版社, 2020-07, 第 1 作者
科研项目
( 1 ) 面向流式机器学习的并行计算模型与系统框架, 主持, 国家级, 2019-01--2021-12
( 2 ) 联想公司:互联网+协同制造云服务支撑平台大规模图挖掘服务项目, 主持, 院级, 2018-04--2019-12
( 3 ) 京东公司:大规模分布式图挖掘算法库研发项目, 主持, 院级, 2019-06--2020-12
( 4 ) 华为公司:Flink & Spark优化技术开发合作项目, 主持, 院级, 2017-05--2018-05
( 5 ) 华为创新研究计划:面向智能家居故障错误诊断与预测, 主持, 院级, 2018-12--2019-12
( 6 ) 分布式流处理程序的分析与验证, 参与, 国家级, 2019-01--2022-12
( 7 ) 中国科学院青年创新促进会, 主持, 部委级, 2019-01--2022-12
近期论文
查看导师新发文章
(温馨提示:请注意重名现象,建议点开原文通过作者单位确认)
(1) DistStream: An Order-Aware Distributed Framework for Parallelizing Stream Clustering Algorithms, The 40th IEEE International Conference on Distributed Computing Systems (ICDCS, CCF B), 2020, 第 1 作者
(2) Detecting Cache-Related Bugs in Spark Applications, The 29th ACM SIGSOFT International Symposium on Software Testing and Analysis (ISSTA, CCF A), 2020, 第 6 作者
(3) An Experimental Evaluation of Garbage Collectors on Big Data Applications, The 45th International Conference on Very Large Data Bases (VLDB, CCF A), 2019, 第 1 作者
(4) Speeding up Deep Learning with Transient Servers, The 16th IEEE International Conference on Autonomic Computing (ICAC, Core B), 2019, 第 3 作者
(5) Characterizing and Diagnosing Out of Memory Errors in MapReduce Applications, The Journal of Systems and Software (JSS, CCF B), 2018, 第 1 作者
(6) A Reliability Benchmark for Big Data Systems on JointCloud, The Eighth International Workshop on Joint Cloud Computing (JCC 2017) in conjunction with the 37th International Conference on Distributed Computing Systems (ICDCS 2017), 2017, 第 2 作者
(7) Hug the Elephant: Migrating a Legacy Data Analytics Application to Hadoop Ecosystem, The 32th IEEE International Conference on Software Maintenance and Evolution (ICSME, CCF B), 2016, 第 5 作者
(8) A Characteristic Study on Out of Memory Errors in Distributed Data-Parallel Applications, The 26th IEEE International Symposium on Software Reliability Engineering (ISSRE, CCF B), 2015, 第 1 作者
(9) A Lightweight Evaluation Framework for Table Layouts in MapReduce Based Query Systems, The 17th Asia-Pacific Web Conference (APWeb, CCF C), 2015, 第 3 作者
(10) FMEM: A Fine-grained Memory Estimator for MapReduce Jobs, The 10th International Conference on Autonomic Computing (ICAC, Core B), 2013, 第 1 作者
(11) MapReduce Framework Optimization via Performance Modeling, The 26th IEEE International Parallel and Distributed Processing Symposium Workshops & PhD Forum (IPDPS PhD Forum 2012), 2012, 第 1 作者
(12) A Fast and High Throughput SQL Query System for Big Data, The 13th International Conference on Web Information Systems Engineering (WISE 2012), 2012, 第 3 作者
学术兼职
2017-12-01-今,中国计算机学会系统软件专委会, 委员