个人简介
招生专业
081002-信号与信息处理
招生方向
语音识别与理解,语音合成,情感识别
丰富音频检测
语音信号处理
教育背景
2004-09--2007-07 中国科学院声学研究所 博士
工作简历
2016-03~现在, 中国科学院声学研究所, 研究员
2015-10~现在, 中国科学院大学, 岗位教授
2013-04~2014-03,英国谢菲尔德大学, 公派访问学者
2010-01~2016-02,中国科学院声学研究所, 副研究员
2007-07~2009-12,中国科学院声学研究所, 助理研究员
教授课程
语音识别技术
语音信号处理
语音识别与理解
专利与奖励
奖励信息
(1) 智能语音能力平台关键技术及其在智能客服行业应用, 二等奖, 省级, 2019
(2) 中国科学院杰出科技成就奖, 一等奖, 院级, 2014
专利成果
( 1 ) 一种低资源嵌入式语音识别的拒识方法, 发明, 2018, 第 1 作者, 专利号: ZL201410387404.0
( 2 ) 数据驱动的基于奇异值分解的神经网络声学模型裁剪方法, 发明, 2015, 第 1 作者, 专利号: 2015102638492
( 3 ) 一种基于字和词混合语言模型的汉语语音关键词检索方法, 发明, 2015, 第 1 作者, 专利号: 2015102910792
( 4 ) 一种基于长短时记忆网络的语言模型重估方法, 发明, 2015, 第 1 作者, 专利号: 2015108446937
( 5 ) 一种连续语音流中的叠音检测方法, 发明, 2015, 第 2 作者, 专利号: 2015108853365
( 6 ) 一种神经网络声学模型压缩及语音识别方法, 发明, 2015, 第 1 作者, 专利号: 2015108810444
( 7 ) 一种拼音拼读的发音质量评测系统, 发明, 2015, 第 2 作者, 专利号: 2015109042305
( 8 ) 基于前向神经网络语言模型的汉语语音关键词检索方法, 发明, 2019, 第 1 作者, 专利号: ZL201510906166.4
( 9 ) 一种基于多尺度马尔科夫假设的语言模型得分规则方法, 发明, 2017, 第 1 作者, 专利号: 201710790753.0
( 10 ) 一种基于统计规律的中文词汇表未登录词比率的估计方法, 发明, 2018, 第 1 作者, 专利号: 201611049017.1
( 11 ) 一种基于N元文法神经网络语言模型的语音识别方法, 发明, 2018, 第 1 作者, 专利号: 201810928881.1
( 12 ) 一种基于空时残差神经网络的远场语音识别方法, 发明, 2018, 第 1 作者, 专利号: 2018110309522
( 13 ) 一种基于生成对抗网络的语言模型数据增强方法, 发明, 2018, 第 1 作者, 专利号: 201810064982.9
( 14 ) 一种基于字和词混合语言模型的汉语语音关键词检索方法, 发明, 2019, 第 1 作者, 专利号: ZL201510291079.2
( 15 ) 一种基于长短时记忆网络的语言模型重估方法, 发明, 2020, 第 1 作者, 专利号: ZL201510844693.7
科研项目
( 1 ) 多语言言语数据的获取、标注和分析, 主持, 国家级, 2016-01--2020-12
( 2 ) ****技术研究与实现, 主持, 国家级, 2016-06--2017-06
( 3 ) ****关键词识别技术研究, 主持, 国家级, 2015-10--2016-10
( 4 ) 语种无关的语音关键词检测技术研究, 主持, 市地级, 2015-08--2016-12
( 5 ) “语音地图”构建的理论与技术研究, 主持, 国家级, 2016-01--2018-12
( 6 ) ****技术研究, 主持, 国家级, 2016-12--2019-12
( 7 ) ****识别技术研究, 主持, 国家级, 2017-04--2018-03
( 8 ) ****技术研究与实现, 主持, 国家级, 2017-11--2018-11
( 9 ) 大规模连续语音识别领域的声学模型算法开发和改进, 主持, 院级, 2017-06--2018-05
( 10 ) 适用于在线语音识别的声学模型拓扑结构研究, 主持, 院级, 2017-10--2018-10
( 11 ) ****挖掘与分析, 主持, 省级, 2016-10--2020-12
( 12 ) Multi-source Speech Recognition with Permutation Invariant Training, 主持, 院级, 2018-07--2019-06
( 13 ) ****技术研究, 主持, 国家级, 2019-02--2022-01
参与会议
(1)IMPROVING MULTICHANNEL SPEECH RECOGNITION WITH GENERALIZED CROSS CORRELATION INPUTS AND MULTITASK LEARNING 2018年国际声学、语音与信号处理会议 2018-04-15
(2)Attention-based LSTM with Multi-task Learning for Distant Speech Recognition 2016年国际语音通信协会年会 2017-08-20
(3)A DNN-HMM Approach to Non-negative Matrix Factorization Based Speech Enhancement 2016年国际语音通信协会年会 2016-09-07
研究领域
语音识别与理解
语音合成
情感识别
丰富音频检测
语音信号处理
近期论文
查看导师新发文章
(温馨提示:请注意重名现象,建议点开原文通过作者单位确认)
(1) Online hybrid ctc/attention end-to-end automatic speech recognition architecture, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2020, 第 3 作者
(2) End-to-End Multilingual Speech Recognition System with Language Supervision Training, IEICE TRANSACTIONS on Information and Systems, 2020, 第 3 作者
(3) Transformer-based online CTC/attention end-to-end speech recognition architecture, ICASSP, 2020, 第 4 作者
(4) Tailoring an Interpretable Neural Language Model, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2019, 通讯作者
(5) Automatic Speech Recognition System with Output-Gate Projected Gated Recurrent Unit, IEICE Transactions on Information and Systems, 2019, 通讯作者
(6) Self-attention Based Prosodic Boundary Prediction for Chinese Speech Synthesis, ICASSP, 2019, 通讯作者
(7) AN AUDIO SCENE CLASSIFICATION FRAMEWORK WITH EMBEDDED FILTERS AND A DCT-BASED TEMPORAL MODULE, ICASSP, 2019, 通讯作者
(8) Character-Aware Sub-Word Level Language Modeling for Uyghur and Turkish ASR, Interspeech, 2019, 第 3 作者
(9) Target Speaker Recovery and Recognition Network with Average x-Vector and Global Training, Interspeech, 2019, 第 2 作者
(10) Speaker-Invariant Feature-Mapping for Distant Speech Recognition via Adversarial Teacher-Student Learning, Interspeech, 2019, 第 4 作者
(11) Multi-Accent Adaptation based on Gate Mechanism, Interspeech, 2019, 第 3 作者
(12) Investigation of knowledge transfer approaches to improve the acoustic modeling of Vietnamese ASR system, IEEE/CAA Journal of Automatica Sinica, 2019, 第 3 作者
(13) Online Hybrid CTC/Attention Architecture for End-to-end Speech Recognition, Interspeech, 2019, 第 3 作者
(14) Deep Scattering Spectra with Deep Neural Networks for Acoustic Scene Classification Tasks, Chinese Journal of Electronics, 2019, 第 1 作者
(15) TEnet: target speaker extraction network with accumulated speaker embedding for automatic speech recognition, Electronics Letters, 2019, 通讯作者
(16) Improving language modeling with an adversarial critic for automatic speech recognition, Interspeech, 2018, 第 2 作者
(17) Deep convolutional neural network with scalogram for audio scene modeling, Interspeech, 2018, 第 2 作者
(18) Multichannel asr with knowledge distillation and generalized cross correlation feature, SLT, 2018, 第 3 作者
(19) Improving Multichannel Speech Recognition with Generalized Cross Correlation Inputs and Multitask Learning, ICASSP, 2018, 第 3 作者
(20) Investigation on the combination of batch normalization and dropout in blstm-based acoustic modeling for asr, Interspeech, 2018, 第 4 作者
(21) Discriminatively learned network for i-vector based speaker recognition, Electronics Letters, 2018, 第 3 作者
(22) 基于对抗训练策略的语言模型数据增强技术, 自动化学报, 2018, 通讯作者
(23) Improve Multichannel Speech Recognition with Temporal and Spatial Information, IEICE TRANSACTIONS on Information and Systems, 2018, 第 2 作者
(24) 基于注意力LSTM和多任务学习的远场语音识别, 清华大学学报, 2018, 通讯作者
(25) Evaluating Modeling Units and Sub-word Features in Language Models for Turkish ASR, ISCSLP, 2018, 第 3 作者
(26) Space-Time Residual LSTM Architechture for Distant Speech Recognition, ISCSLP, 2018, 第 3 作者
(27) Multilingual Speech Recognition Training and Adaptation with Language-Specific Gate Units, ISCSLP, 2018, 第 4 作者
(28) 基于改进主题分布特征的神经网络语言模型, 电子与信息学报, 2018, 通讯作者
(29) Handling OOVWords in Mandarin Spoken Term Detection with an Hierarchical n-Gram Language Model, Chinese Journal of Electronics, 2017, 通讯作者
(30) 一种小资源下语音识别算法设计与优化, 清华大学学报, 2017, 第 1 作者
(31) 基于递归神经网络的语音识别快速解码算法, 电子与信息学报, 2017, 通讯作者
(32) Attention-based LSTM with Multi-task Learning for Distant Speech, INTERSPEECH, 2017, 第 2 作者
(33) Handling OOV Words in Mandarin Spoken Term Detection withAn Hierarchical N-gram Laguange Model, Chinese Journal of Electronics, 2016, 第 2 作者
(34) 基于SVD的DNN裁剪方法和重训练研究, 清华大学学报, 2016, 第 2 作者
(35) An Unsupervised Vocabulary Selection Technique for Chinese Automatic Speech Recognition, IEEE Workshop on Spoken Language Technology, 2016, 第 2 作者
(36) Improved End-to-End Speech Recognition Using Adaptive Per-Dimensional Learning Rate Methods, IEICE Transactions, 2016, 第 2 作者
(37) Enhanced Out of Vocabulary Word Detection Using Local Acoustic Information, IEEE IIH-MSP, 2014, 第 3 作者
(38) Semi-supervised dnn training in meeting recognition, IEEE Spoken Language Technology, 2014, 第 1 作者
(39) Using neural network front-ends on far field multiple microphones based speech recognition, ICASSP, 2014, 第 2 作者