个人简介
教育背景
University of Delaware, DE, USA M.S. (4.0/4.0 for major) Phd Candidate 08/2007-12/2009
课题:基于多核处理器(Multi-core, GPU)的高性能计算 Computer & Information Sciences department
高性能太阳能系统设计 Electrical & Computer Engineering department
中国科学院高能物理研究所,北京,中国 M.S.(90/100) 09/2004-06/2007
课题:用OTR(Optical Transition Radiation)改善BFEL(Beijing Free Electron Laser)发射度测量,并为OTR设计高性能CCD相机获取高清晰采样
青岛大学理学院电子信息科学与技术系,青岛,中国 B.S.(93/100) 09/2000-06/2004
课题:超短电子束长的前期研究(2005年山东省优秀学士学位论文)
工作经历
◆ 南京大学天文与空间科学学院,南京,中国 06/2014-present
1. 负责学院高性能计算实验室机房
2. 与NVIDIA公司一起合作建立CUDA Teaching Center,负责"并行程序设计"课程
◆ 英伟达 (NVIDIA Corp), Santa Clara, CA, USA 04/2010-1/2014
1. 负责研发分子动力学常用软件在NVIDIA Tesla系列GPU上的应用及利用CUDA(Compute Unified Device Architecture)进行性能改善。
2. 负责研发和分析基于CUDA的线性函数标准运算库性能,主要标准库有:CUBLAS, CUFFT,CURAND, CUSPARSE
3.负责CUDA以及GPU体系结构的培训,教学,美国高校推广以及发表新技术文章。
◆ 北极地区高性能计算中心国家实验室-ARSC(Arctic Region Supercomputing Center), USA 6/2009~08/2009
1.基于NVIDIA GPU(Geforce 9800gx2)分析及改写线性函数Sgemm,Dgemm以及Cgemm用新发布的分别OpenCL和CUDA实现的性能。
2.完成美国防部DOD(Department of Defense)资助的基于NVIDIA GPU报的高性能计算项目,并用来加速北极地区天气预Paraview和IDV图形化计算结果。
◆ 北极地区高性能计算中心国家实验室-ARSC(Arctic Region Supercomputing Center), USA 06/2008~08/2008
1.基于NVIDIA GPU和IBM cell并行处理器进行北极地区烟雾检测的大规模数据并行处理。
2.研究GPU体系结构以及CUDA并行运算架构,优化NVIDIA标准运算库Lever 3 BLAS结果高于,优化结高于HP公司当时的参考值50-80Gflops
◆ DESY(Deutsches Elektronen-Synchrotron),汉堡,德国 12/2006~01/2007
模拟自由电子激光电子束在3-D腔的分布以及2-D线性图像处理
◆ SUN Microsystems China,北京,中国 01/2006~02/2006
SUN微系统系统管理员一级,二级(Solaris operating environment.8 SA288)认证
◆ Nortel Corporation, Beijing, China 06/2004~08/2004
参与设计Nortel UMTS网络协议以及接口参数:Iu, RANAP, MTP3B, etc
承担课程
研究生:《并行程序设计导论》 全校本科创新创业课程:《GPU与人工智能》
研究课题
◆ 基于多核处理器的并行计算和优化 08/2007~12/2010
1.基于CUDA并行优化Bzip2数据压缩算法中的BWT算法,实现GPU了上成功运行,运算速度提高8-16倍,相对与Pthread版的并行Bzip2算法,CUDA版的并行算法的运算速度至少提高了8倍
2.通过JNI和CUDA将JAVA源程序在GPU上运行,大改善可Java Grande基准测试的性能
3.基于CUDA通过并行优化内存检测软件Valgrind检测时间长的问题中最适合优化并且时间消耗最长的函数解决内存
4.基于CUDA成功并行优化SVM-RFE算法以及Monte Carlo算法在金融分析的应用,对比于OpenMP版的算法,性能提高了至少5倍
5.用CUDA加速物理学中大规模粒子碰撞的模拟实验并用OpenGL进行图形可视化
◆ 利用Compressive Sensing(压缩感知)理论进行图像分析处理 08/2007~09/2009
1.搭建光学实验平台,利用对数字微镜器件(Digital Micro-mirror Device)进行硬件编程,与Rice University 合作,将超光谱图像(4-D数组)映射到压缩感知图像进行分析,并完成256x256的信重号新处恢理复的以速及度光以谱及减仪数少据了分有析用,信这息项资技源术的使浪测费。量次数大少于图像的实际像素数,可以大像的素提图高像
2.设计商用太阳能角度调整软件,能够最大效率的追踪太阳的位置,并通过C语言以及Matlab计算,得到最佳器件放置位置并参与设计太阳能接收板以及冷却系统,将传统的进行2-D追踪系统简化为光电池1-D系统,大的提高了系统的传输效率,节约了大量的能量。
3.在光电子&电磁场实验室接受系统的超净间培训,熟练掌握E-Beam, Contact Lithography, Dry(ICP), Wet(Dielectric Etching, Metal), Thin Film(PECVD of poly-silicon, Sputterer), Metal(E-Beam Evaporator, Sputterer), Polysilicon, Optical Spectrum Analyzer(OSA)的操作。
◆ 基于中科院高能所的自由电子激光实验室(BFEL)的束流测量以及图像分析 08/2005~07/2007
用光学渡越辐射(Optical Transition Radiation)改善新BFEL的发射度测量,并设计高性能CCD机获取高清晰采样。
近期论文
查看导师新发文章
(温馨提示:请注意重名现象,建议点开原文通过作者单位确认)
◆Ying Yu, Kehu Yang, Jianping Dai, "CCD Camera System designing for the OTR Beam Measurement”, Vol. 32, No. 1, Jan., 2008, High Energy and Nuclear Physics
◆Ying Yu, Jianping Dai, “FEL Energy Calculation of BFEL Facility”, Vol. 19, No.5, 2007, Intense Laser and Particle Beam
◆Yi Zou, Jian Zhuang, Xueping Yang, Ying Yu, Jianping Dai, “Application of PLC in EPICS control system for BFEL”, Vol.30,No.3, March 2007, High Power Laser And Particle Beams
In preparation:
◆Ying Yu, John Cavazos, “ Implementation of BWT algorithm for data compression on GPU”
◆Ying Yu, “Using the Kohonen Arithmetic for the Fingerprint Identification”