当前位置: X-MOL首页全球导师 国内导师 › 张鹏远

个人简介

招生专业 081002-信号与信息处理 招生方向 语音识别与理解,语音合成,情感识别 丰富音频检测 语音信号处理 教育背景 2004-09--2007-07 中国科学院声学研究所 博士 工作简历 2016-03~现在, 中国科学院声学研究所, 研究员 2015-10~现在, 中国科学院大学, 岗位教授 2013-04~2014-03,英国谢菲尔德大学, 公派访问学者 2010-01~2016-02,中国科学院声学研究所, 副研究员 2007-07~2009-12,中国科学院声学研究所, 助理研究员 教授课程 语音识别技术 语音信号处理 语音识别与理解 专利与奖励 奖励信息 (1) 智能语音能力平台关键技术及其在智能客服行业应用, 二等奖, 省级, 2019 (2) 中国科学院杰出科技成就奖, 一等奖, 院级, 2014 专利成果 ( 1 ) 一种低资源嵌入式语音识别的拒识方法, 发明, 2018, 第 1 作者, 专利号: ZL201410387404.0 ( 2 ) 数据驱动的基于奇异值分解的神经网络声学模型裁剪方法, 发明, 2015, 第 1 作者, 专利号: 2015102638492 ( 3 ) 一种基于字和词混合语言模型的汉语语音关键词检索方法, 发明, 2015, 第 1 作者, 专利号: 2015102910792 ( 4 ) 一种基于长短时记忆网络的语言模型重估方法, 发明, 2015, 第 1 作者, 专利号: 2015108446937 ( 5 ) 一种连续语音流中的叠音检测方法, 发明, 2015, 第 2 作者, 专利号: 2015108853365 ( 6 ) 一种神经网络声学模型压缩及语音识别方法, 发明, 2015, 第 1 作者, 专利号: 2015108810444 ( 7 ) 一种拼音拼读的发音质量评测系统, 发明, 2015, 第 2 作者, 专利号: 2015109042305 ( 8 ) 基于前向神经网络语言模型的汉语语音关键词检索方法, 发明, 2019, 第 1 作者, 专利号: ZL201510906166.4 ( 9 ) 一种基于多尺度马尔科夫假设的语言模型得分规则方法, 发明, 2017, 第 1 作者, 专利号: 201710790753.0 ( 10 ) 一种基于统计规律的中文词汇表未登录词比率的估计方法, 发明, 2018, 第 1 作者, 专利号: 201611049017.1 ( 11 ) 一种基于N元文法神经网络语言模型的语音识别方法, 发明, 2018, 第 1 作者, 专利号: 201810928881.1 ( 12 ) 一种基于空时残差神经网络的远场语音识别方法, 发明, 2018, 第 1 作者, 专利号: 2018110309522 ( 13 ) 一种基于生成对抗网络的语言模型数据增强方法, 发明, 2018, 第 1 作者, 专利号: 201810064982.9 ( 14 ) 一种基于字和词混合语言模型的汉语语音关键词检索方法, 发明, 2019, 第 1 作者, 专利号: ZL201510291079.2 ( 15 ) 一种基于长短时记忆网络的语言模型重估方法, 发明, 2020, 第 1 作者, 专利号: ZL201510844693.7 科研项目 ( 1 ) 多语言言语数据的获取、标注和分析, 主持, 国家级, 2016-01--2020-12 ( 2 ) ****技术研究与实现, 主持, 国家级, 2016-06--2017-06 ( 3 ) ****关键词识别技术研究, 主持, 国家级, 2015-10--2016-10 ( 4 ) 语种无关的语音关键词检测技术研究, 主持, 市地级, 2015-08--2016-12 ( 5 ) “语音地图”构建的理论与技术研究, 主持, 国家级, 2016-01--2018-12 ( 6 ) ****技术研究, 主持, 国家级, 2016-12--2019-12 ( 7 ) ****识别技术研究, 主持, 国家级, 2017-04--2018-03 ( 8 ) ****技术研究与实现, 主持, 国家级, 2017-11--2018-11 ( 9 ) 大规模连续语音识别领域的声学模型算法开发和改进, 主持, 院级, 2017-06--2018-05 ( 10 ) 适用于在线语音识别的声学模型拓扑结构研究, 主持, 院级, 2017-10--2018-10 ( 11 ) ****挖掘与分析, 主持, 省级, 2016-10--2020-12 ( 12 ) Multi-source Speech Recognition with Permutation Invariant Training, 主持, 院级, 2018-07--2019-06 ( 13 ) ****技术研究, 主持, 国家级, 2019-02--2022-01 参与会议 (1)IMPROVING MULTICHANNEL SPEECH RECOGNITION WITH GENERALIZED CROSS CORRELATION INPUTS AND MULTITASK LEARNING 2018年国际声学、语音与信号处理会议 2018-04-15 (2)Attention-based LSTM with Multi-task Learning for Distant Speech Recognition 2016年国际语音通信协会年会 2017-08-20 (3)A DNN-HMM Approach to Non-negative Matrix Factorization Based Speech Enhancement 2016年国际语音通信协会年会 2016-09-07

研究领域

语音识别与理解 语音合成 情感识别 丰富音频检测 语音信号处理

近期论文

查看导师新发文章 (温馨提示:请注意重名现象,建议点开原文通过作者单位确认)

(1) Online hybrid ctc/attention end-to-end automatic speech recognition architecture, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2020, 第 3 作者 (2) End-to-End Multilingual Speech Recognition System with Language Supervision Training, IEICE TRANSACTIONS on Information and Systems, 2020, 第 3 作者 (3) Transformer-based online CTC/attention end-to-end speech recognition architecture, ICASSP, 2020, 第 4 作者 (4) Tailoring an Interpretable Neural Language Model, IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2019, 通讯作者 (5) Automatic Speech Recognition System with Output-Gate Projected Gated Recurrent Unit, IEICE Transactions on Information and Systems, 2019, 通讯作者 (6) Self-attention Based Prosodic Boundary Prediction for Chinese Speech Synthesis, ICASSP, 2019, 通讯作者 (7) AN AUDIO SCENE CLASSIFICATION FRAMEWORK WITH EMBEDDED FILTERS AND A DCT-BASED TEMPORAL MODULE, ICASSP, 2019, 通讯作者 (8) Character-Aware Sub-Word Level Language Modeling for Uyghur and Turkish ASR, Interspeech, 2019, 第 3 作者 (9) Target Speaker Recovery and Recognition Network with Average x-Vector and Global Training, Interspeech, 2019, 第 2 作者 (10) Speaker-Invariant Feature-Mapping for Distant Speech Recognition via Adversarial Teacher-Student Learning, Interspeech, 2019, 第 4 作者 (11) Multi-Accent Adaptation based on Gate Mechanism, Interspeech, 2019, 第 3 作者 (12) Investigation of knowledge transfer approaches to improve the acoustic modeling of Vietnamese ASR system, IEEE/CAA Journal of Automatica Sinica, 2019, 第 3 作者 (13) Online Hybrid CTC/Attention Architecture for End-to-end Speech Recognition, Interspeech, 2019, 第 3 作者 (14) Deep Scattering Spectra with Deep Neural Networks for Acoustic Scene Classification Tasks, Chinese Journal of Electronics, 2019, 第 1 作者 (15) TEnet: target speaker extraction network with accumulated speaker embedding for automatic speech recognition, Electronics Letters, 2019, 通讯作者 (16) Improving language modeling with an adversarial critic for automatic speech recognition, Interspeech, 2018, 第 2 作者 (17) Deep convolutional neural network with scalogram for audio scene modeling, Interspeech, 2018, 第 2 作者 (18) Multichannel asr with knowledge distillation and generalized cross correlation feature, SLT, 2018, 第 3 作者 (19) Improving Multichannel Speech Recognition with Generalized Cross Correlation Inputs and Multitask Learning, ICASSP, 2018, 第 3 作者 (20) Investigation on the combination of batch normalization and dropout in blstm-based acoustic modeling for asr, Interspeech, 2018, 第 4 作者 (21) Discriminatively learned network for i-vector based speaker recognition, Electronics Letters, 2018, 第 3 作者 (22) 基于对抗训练策略的语言模型数据增强技术, 自动化学报, 2018, 通讯作者 (23) Improve Multichannel Speech Recognition with Temporal and Spatial Information, IEICE TRANSACTIONS on Information and Systems, 2018, 第 2 作者 (24) 基于注意力LSTM和多任务学习的远场语音识别, 清华大学学报, 2018, 通讯作者 (25) Evaluating Modeling Units and Sub-word Features in Language Models for Turkish ASR, ISCSLP, 2018, 第 3 作者 (26) Space-Time Residual LSTM Architechture for Distant Speech Recognition, ISCSLP, 2018, 第 3 作者 (27) Multilingual Speech Recognition Training and Adaptation with Language-Specific Gate Units, ISCSLP, 2018, 第 4 作者 (28) 基于改进主题分布特征的神经网络语言模型, 电子与信息学报, 2018, 通讯作者 (29) Handling OOVWords in Mandarin Spoken Term Detection with an Hierarchical n-Gram Language Model, Chinese Journal of Electronics, 2017, 通讯作者 (30) 一种小资源下语音识别算法设计与优化, 清华大学学报, 2017, 第 1 作者 (31) 基于递归神经网络的语音识别快速解码算法, 电子与信息学报, 2017, 通讯作者 (32) Attention-based LSTM with Multi-task Learning for Distant Speech, INTERSPEECH, 2017, 第 2 作者 (33) Handling OOV Words in Mandarin Spoken Term Detection withAn Hierarchical N-gram Laguange Model, Chinese Journal of Electronics, 2016, 第 2 作者 (34) 基于SVD的DNN裁剪方法和重训练研究, 清华大学学报, 2016, 第 2 作者 (35) An Unsupervised Vocabulary Selection Technique for Chinese Automatic Speech Recognition, IEEE Workshop on Spoken Language Technology, 2016, 第 2 作者 (36) Improved End-to-End Speech Recognition Using Adaptive Per-Dimensional Learning Rate Methods, IEICE Transactions, 2016, 第 2 作者 (37) Enhanced Out of Vocabulary Word Detection Using Local Acoustic Information, IEEE IIH-MSP, 2014, 第 3 作者 (38) Semi-supervised dnn training in meeting recognition, IEEE Spoken Language Technology, 2014, 第 1 作者 (39) Using neural network front-ends on far field multiple microphones based speech recognition, ICASSP, 2014, 第 2 作者

推荐链接
down
wechat
bug