钱馨园 - 北京科技大学 - 计算机与通信工程学院

个人简介

钱馨园博士于英国爱丁堡大学获电子电气工程学士（一等荣誉）和硕士（卓越）学位，于英国伦敦玛丽女王大学获计算机博士学位，期间曾赴意大利FBK研究所交流，后就职于新加坡国立大学与香港中文大学（深圳)，现任北京科技大学计算机与通信工程学院副教授。她的研究方向为语音信号处理、视听觉融合、多模态人机交互。她曾作为新加坡A*STAR资助的人机交互（HRI）项目的主要负责人，带领团队完成视听觉说话人定位及追踪、基于音视频自监督学习的说话人识别、语音识别/提取等智能语音任务。参与了基于视觉线索的实时说话人声音提取系统研究和基于多模态自监督预训练技术的应用研究。她主持/参与了包括国家自然科学基金、深圳市大数据研究院项目、华为技术合作项目和腾讯AI Lab犀牛鸟专项等多项科研基金。她已在国际顶级会议及期刊上发表论文40余篇，包括TASLP,TMM,CVPR, ICASSP等。她曾获英国爱丁堡大学国际交流学术奖学金，苏格兰女性工程师科研助学金，英国博士全额奖学金，2021年COCOSDA最佳论文奖，并担任ICSR2021程序委员与IROS2023副编辑。教育经历 2015.11-2020.3 英国伦敦玛丽女王大学 | 计算机 | 研究生 | 博士 2014.9-2015.11 英国爱丁堡大学 | 信号处理与通信 | 研究生 | 硕士 2012.9-2014.6 英国爱丁堡大学 | 电子电气工程 | 本科 | 学士工作经历 2022.10-至今北京科技大学 2022.2-2022.10 香港中文大学（深圳） 2020.2-2022.3 新加坡国立大学 2017.4-2018.12 Fondazione Bruno Kessler

研究领域

查看导师新发文章（温馨提示：请注意重名现象，建议点开原文通过作者单位确认）

[1]多模态人机交互、人工智能、深度学习技术 [2]声源/说话人定位与追踪（视听觉融合）（Speaker Localization and Tracking） [3]语音识别、语音合成（ASR, TTS） [4]语音分离/降噪/提取（Speech Seperation/Enhancement/Extraction） [5]开放集关键词检测 (Open-set Keyword Spotting) [6]视听触人机交互（Audio, Vision and Tactile perception)