个人简介
招生专业
081203-计算机应用技术
085211-计算机技术
招生方向
计算机应用技术,自然语言处理
计算机技术
教育背景
2007-09--2012-07 中国科学院 获得工学博士学位
2003-09--2007-06 长安大学信息工程学院 获得工学学士学位
工作经历
中国科学院语言声学与内容理解重点实验室,博士后。中国科学院新疆理化技术研究所多语种信息技术研究室(新疆维吾尔自治区“民族语言语音文字信息处理”重点实验室、“民族语音文字信息处理联合实验室”),研究员,硕士研究生导师。
从事多语种信息处理关键技术研究,目前主要研究方向为机器翻译关键技术、语种识别关键技术、话题检测与内容理解关键技术等。中国科学院新疆理化技术研究所“一三五”重大突破“面向“一带一路”的多语言机器翻译系统研究与应用”技术负责人。NLPCC、CCL、CWMT、IEEE GlobalSIP等国际、国内学术会议和学术期刊审稿人。
工作简历
2013-10~2017-02,中国科学院声学研究所, 博士后
2012-07~现在, 中国科学院新疆理化技术研究所, 副研究员
教授课程
多语种信息处理技术
专利:
(1)面向资源缺乏语言的实体链接系统
(2)多特征融合的文本相似性度量系统
奖励:
2019年新疆维吾尔自治区科技进步一等奖(排名第二)
奖励信息
(1) 先进工作者, 研究所(学校), 2015
(2) 优秀党务工作者, 研究所(学校), 2015
(3) “优秀党务工作者”荣誉, , 其他, 2013
(4) “先进工作者”荣誉, , 研究所(学校), 2013
(5) 中国科学院院长奖, , 院级, 2012
(6) “朱李月华优秀博士生奖”, , 院级, 2011
(7) “全国人际语音通讯学术会议最佳论文奖”, , 其他, 2011
(8) 中科院新疆理化技术研究所“优秀党员”荣誉, , 研究所(学校), 2011
(9) 中科院研究生院“三好学生标兵”荣誉, , 院级, 2011
(10) 中科院新疆理化技术研究所“优秀党员”荣誉, , 研究所(学校), 2010
(11) 中科院研究生院“优秀学生干部”荣誉, , 院级, 2010
(12) 中科院研究生院“三好学生”荣誉, , 院级, 2009
专利成果
( 1 ) 多特征融合的文本相似性度量系统, 发明, 2017, 第 5 作者, 专利号: ZL201510072955.2
( 2 ) 面向资源缺乏语言的实体链接系统, 发明, 2018, 第 5 作者, 专利号: ZL201510304943.8
科研项目
( 1 ) 维汉机器翻译中复杂语言形态模型的研究, 主持, 部委级, 2012-11--2016-10
( 2 ) 维汉机器翻译中资源缺乏语言的快速知识获取研究, 主持, 省级, 2013-07--2016-06
( 3 ) 新疆少数民族信息处理, 参与, 部委级, 2012-01--2017-02
( 4 ) 面向网络信息采集的维汉机器翻译系统开发与应用, 参与, 部委级, 2013-01--2016-06
( 5 ) 维汉机器翻译关键技术研究及示范应用, 参与, 省级, 2014-01--2017-12
( 6 ) 面向维汉机器翻译的维吾尔语命名实体识别研究, 参与, 部委级, 2014-01--2017-07
( 7 ) 基于多特征融合的复杂形态语言建模研究, 主持, 省级, 2015-01--2017-12
( 8 ) 基于黏着语形态特征的维汉机器翻译最大熵调序研究, 主持, 省级, 2015-01--2017-12
( 9 ) 维汉机器翻译平台, 主持, 省级, 2016-10--2020-12
( 10 ) 中国科学院青年促进会项目, 主持, 部委级, 2017-01--2020-12
( 11 ) 融合复杂形态特征的多语言神经机器翻译研究, 主持, 国家级, 2018-01--2020-12
( 12 ) 中科院西部之光项目, 主持, 部委级, 2017-08--2020-07
( 13 ) 维汉机器翻译关键技术研究, 主持, 国家级, 2019-01--2021-12
( 14 ) 维汉、哈汉机器翻译关键技术研究, 主持, 国家级, 2018-01--2021-12
参与会议
(1)Domain Adaption Based on LDA and Word Embedding in SMT 亚洲自然语言处理学术会议 2017-11-28
(2)Improving adversarial neural machine translation with prior knowledge 2017-10-18
(3)Learning Bilingual Lexicon for Low resource Language Pairs NLPCC2017 2017-10-16
(4)Content-Based Neural Reordering Model for Statistical Machine Translation 全国机器翻译研讨会 潘一荣,李晓,杨雅婷 2017-09-26
(5)Research for Uyghur-Chinese Neural Machine Translation 2016-12-06
(6)维汉机器翻译关键技术研究概述 中国声学学会青年分会年会 2015-10-16
(7)Character Tagging-Based Word Segmentation 2015-10-09
(8)维汉机器翻译中可变权重的编辑距离语言模型语料领域适应 CWMT2015 2015-08-14
(9)Optimized Uyghur Segmentation for Statistical Machine Translation 2015-05-22
(10)Character Tagging-Based Word Segmentation For Uyghur CWMT2014 2014-10-17
(11)面向维汉机器翻译的复杂语言形态分析研究 第十一届自然语言处理青年学者研讨会 杨雅婷 2014-05-16
(12)CWMT2013中国科学院新疆理化技术研究所评测报告 第九届全国机器翻译研讨会 杨雅婷,米成刚, 董瑞,吐尔洪.吾司曼,艾孜孜.吐尔逊,王磊,周喜 2013-10-31
(13)基于字符串相似度的维吾尔语中汉语借词识别 第十二届全国计算语言学学术会议 米成刚,杨雅婷,周喜,李晓,杨明忠 2013-10-10
(14)Discriminative Learning with Natural Annotations: CWS and NER as Case Studies Wenbin Jiang,Meng Sun,Yajuan Lü, Yating Yang, Qun Liu 2013-08-04
近期论文
查看导师新发文章
(温馨提示:请注意重名现象,建议点开原文通过作者单位确认)
(1) Toward Better Loanword Identification in Uyghur Using Cross-lingual Word Embeddings, COLING2018, 2018, 通讯作者
(2) A Neural Network Based Model for Loanword Identification in Uyghur, LREC2018, 2018, 通讯作者
(3) Using Semantic Knowledge in the Uyghur-Chinese Person Name Transliteration, Journal of information processing system, 2018, 通讯作者
(4) Research on temporal expression recognition: a case study of uyghur, An International Journal of Research and Surveys, 2018, 通讯作者
(5) 基于词缀的维吾尔谚语识别关键技术研究, 智能系统学报, 2018, 第 3 作者
(6) 基于短语汉维机器翻译解码的研究及实现, 计算机工程与设计, 2018, 通讯作者
(7) Filtering reorderingtable using a novel Recursive Autoencoder model for Statistical MachineTranslation, Mathematics Problem in Engineering, 2017, 通讯作者
(8) 基于多策略的维吾尔文网页识别方法, 中文信息学报, 2017, 通讯作者
(9) Content-Based Neural Reordering Model for Statistical Machine Translation, CWMT2017, 2017, 第 3 作者
(10) Domain Adaption Based on LDA and Word Embedding in SMT, IALP2017, 2017, 通讯作者
(11) Harvest Uyghur-Chinese Aligned Sentences Bitexts from Multilingual Sites Based on Word Embedding, CCL2017, 2017, 通讯作者
(12) Improving adversarial neural machine translation with prior knowledge, Global SIP2017, 2017, 第 1 作者
(13) Learning Bilingual Lexicon for Low resource Language Pairs, NLPCC2017, 2017, 通讯作者
(14) Log-linear Models for Uyghur Segmentation in Spoken Language Translation, RANLP 2017, 2017, 通讯作者
(15) 基于词向量的维吾尔语词项的归一化, 计算机工程, 2017, 通讯作者
(16) A Post-reordering model BasedMaximum Entropy in Statistic Machine Translation, IJHIT, 2017, 通讯作者
(17) 调序规则表的深度过滤研究, 计算机科学探索, 2017, 通讯作者
(18) Research forUyghur-Chinese Neural Machine Translation, Lecture Notes in ComputerScience, 2016, 通讯作者
(19) 面向维汉机器翻译的语料筛选技术研究, 计算机应用研究, 2016, 通讯作者
(20) 基于双语句对覆盖度的维汉机器翻译语料选取技术, 中国科学技术大学学报, 2016, 通讯作者
(21) A post-reordering model based Maximum Entropy in Statistic Machine Translation, International Journal of Hybrid Information Technology, 2016, 通讯作者
(22) 调序规则表的深度过滤研究, 计算机科学探索, 2016, 通讯作者
(23) 基于深度学习的维汉口语机器翻译研究, CWMT2016, 2016, 通讯作者
(24) A Phrase Table Filtering Model for Uyghur-Chinese MT Based on Binary Classification., Journal of Software., 2015, 通讯作者
(25) Co-occurrence Degree Based Word Alignment in Statistical Machine Translation., Open Automation and Control Systems Journal, 2015, 通讯作者
(26) Optimized Uyghur Segmentation for Statistical Machine Translation, NLDB2015, 2015, 通讯作者
(27) 维汉机器翻译中可变权重的编辑距离语言模型语料领域适应, CWMT2015, 2015, 通讯作者
(28) 维汉机器翻译关键技术研究概述, 网络新媒体技术, 2015, 通讯作者
(29) 泛化语言模型在汉维机器翻译中的应用, 计算机应用研究, 2014, 通讯作者
(30) Detection of Loan Words in Uyghur Texts., Springer Communications in Computer and Information., 2014, 通讯作者
(31) Co-occurrence Degree Based Word Alignment: A Case Study on Uyghur-Chinese., Springer Lecture Notes in Artificial Intelligence, 2014, 通讯作者
(32) Character Tagging-Based Word Segmentation For Uyghur., Springer Communications in Computer and Information., 2014, 第 1 作者
(33) 基于字符串相似度的维吾尔语中汉语借词识别, 中文信息学报, 2013, 第 2 作者
(34) 维汉机器翻译未登录词识别研究, 计算机应用研究, 2013, 第 3 作者
(35) 基于粘着性模糊规则的维汉机器翻译最大熵调序研究, 计算机应用研究, 2013, 第 3 作者
(36) Speech Recognition Research on Uyghur Accent Spoken Language, International Conference on Asian Language Processing, 2013, 第 1 作者
(37) Semantically enhanced Uyghur Information Retrieval Model, Journal of Software, 2012, 第 2 作者
(38) Design and Implementation of Patent Semantics Search Engine, FCC Conference, 2012, 第 2 作者
(39) Based on Ontology Moses-based Chinese-Uyghur statistical machine translation systems, FP_YC-ICT Conference, 2012, 第 2 作者
(40) Pronunciation variations of Uyghur in the automatic speech recognition system, Journal of Tsinghua University(Science and Technology), 2011, 第 1 作者
(41) Multi-pronunciation dictionary based accent modeling for continuous speech recognition, Journal of Tsinghua University(Science and Technology), 2011, 第 1 作者
(42) Speech Endpoint Detection Algorithm for Uyghur Based on Acoustic Frequency Feature, Proceedings of the International Conference on Signal Processing, 2011, 第 1 作者
(43) Research on the Uyghur Spoken Language Speech Corpus of Telephone Channel, Computer Engineering and Applications, 2011, 第 1 作者
(44) Research on Evaluation Model and Method of Regional Informatization, Computer Engineering, 2011, 第 1 作者
学术兼职
2017-02-15-今,中国计算机学会中文息处理专委会青工委, 副主席
2016-05-01-今,新疆自治区专家顾问团网络信息组秘书,
2013-04-15-今,中国中文信息学会青工委, 委员
2012-08-01-今,新疆自治区专家顾问团信息与交通组秘书,