当前位置: X-MOL首页全球导师 国内导师 › 唐胜

个人简介

教育背景 2001-09--2006-03 中国科学院计算技术研究所 工学博士 1998-09--2001-07 湘潭大学 工学硕士 1989-10--1993-06 湘潭大学 工学学士 学历 1. 2001年09月–2006年3月,中科院计算所博士研究生,计算机应用技术专业,获工学博士学位; 2. 1998年09月–2001年6月,湘潭大学计算机科学系硕士研究生,获工学硕士学位; 3. 1989年10月–1993年6月,湘潭大学机械工程系本科生,获工学学士学位。 学位 2006年3月,于中科院计算所博士毕业,计算机应用技术专业,获工学博士学位 出国学习工作 1. 2009年2月-2010年2月:国家公派访问学者,访问新加坡国大学一年,主要研究视频检索与事件检测。 2. 2006年7月-2006年8月:2006年应Prof Chua Tat-Seng邀请,访问了新加坡国立大学计算机学院,参加并完成了国际视频检索权威评测TRECVID。回国后,带领小组参加TRECVID,并在2007年和2008年连续两年取得了优异成绩,参加TRECVID 2008 并做大会报告(http://www-nlpir.nist.gov/projects/tvpubs/tv.pubs.org.html)。2007年联合新加坡国立大学研发的交互式视频检索系统VisionGo,在国际图像视频检索会议CIVR2007中获视频检索现场评测最佳系统奖(http://www.videolympics.org/) 。 工作简历 2018-12~现在, 中国科学院计算技术研究所, 博士生导师 2009-02~现在, 中国科学院计算技术研究所, 硕士生导师 2008-03~现在, 中国科学院计算技术研究所, 副研究员 2006-03~2008-03,中国科学院计算技术研究所, 助理研究员 1993-06~1998-09,湘潭大学, 助理工程师、工程师 奖励信息 (1) 互联网视频流的高通量计算理论与方法(2019年国家自然科学二等奖), 二等奖, 国家级, 2019 (2) 互联网视频的高效流式计算理论与方法(中国电子学会科学技术奖), 一等奖, 其他, 2018 (3) 视觉大数据检索与智能分析关键技术及应用(中国电子学会科学技术奖), 一等奖, 其他, 2017 (4) 2016年ImageNet大规模视觉识别挑战赛(ILSVRC 2016),图像目标检测(DET)任务全球第四(国内第三),视频目标检测(VID)任务全球第三(国内第二),语义分割任务全球第三(国内第一),应邀做大会报告, , 专项, 2016 (5) 2015年ImageNet大规模视觉识别挑战赛(ILSVRC 2015),分类定位(LOC)任务第四(国内第二),目标检测(DET)任务全球第五(国内第一), , 专项, 2015 (6) 大规模网络视频处理与内容分析关键技术及应用(北京市科学技术奖), 一等奖, 省级, 2014 (7) 大规模网络视频内容分析关键技术及应用(2012年首届中国计算机学会科学技术奖), , 其他, 2012 (8) 面向体育训练的三维人体运动模拟与视频分析系统(北京市科学技术奖), 一等奖, 省级, 2006 专利成果 ( 1 ) 一种数字图像Hash签名方法, 发明, 2009, 第 1 作者, 专利号: ZL200510 ( 2 ) 乱笔顺库建立方法及联机手写汉字识别评测系统, 发明, 2007, 第 1 作者, 专利号: ZL200410 ( 3 ) 个人数字助理远程通信系统及流量控制方法, 发明, 2004, 第 2 作者, 专利号: 01119940 ( 4 ) 一种数字图像训练和检测方法, 发明, 2009, 第 1 作者, 专利号: ZL200910092710.0 ( 5 ) 一种基于集成学习的模式训练和识别方法, 发明, 2011, 第 1 作者, 专利号: 2011103033624 ( 6 ) 字典学习、视觉词袋特征提取方法及检索系统, 发明, 2014, 第 1 作者, 专利号: 201410287639.2 ( 7 ) 一种模型参数训练方法、装置及系统, 发明, 2014, 第 1 作者, 专利号: 201410579249 ( 8 ) 色情检测模型建立方法和色情检测方法, 发明, 2010, 第 3 作者, 专利号: CN201010143777 ( 9 ) 一种生成描述图像内容的自然语言的方法与系统, 发明, 2017, 第 1 作者, 专利号: 2017112652103(优先权:2016112441165) ( 10 ) 一种基于目标检测的大规模图像检索方法与系统, 发明, 2017, 第 1 作者, 专利号: 201710574741.4 ( 11 ) 融合全局信息的场景分割修正方法与系统, 发明, 2017, 第 1 作者, 专利号: 201710650525.3 ( 12 ) 融合局部信息的场景分割修正方法与系统, 发明, 2017, 第 1 作者, 专利号: 201710650541.2 ( 13 ) 基于特征图恢复的场景分割方法和系统, 发明, 2018, 第 1 作者, 专利号: 201810664250.3 ( 14 ) 基于克罗内克卷积的场景分割方法与系统, 发明, 2018, 第 1 作者, 专利号: 201811309245.7 ( 15 ) 基于上下文信息指导的场景分割方法与系统, 发明, 2018, 第 1 作者, 专利号: 201811309249.5 科研项目 ( 1 ) 图像语义检测国际合作, 主持, 院级, 2014-10--2016-12 ( 2 ) 基于稀疏表示和深度学习的大规模目标检测(国家自科基金面上项目61572472), 主持, 国家级, 2016-01--2019-12 ( 3 ) 图像识别和图像检索软件, 主持, 国家级, 2015-01--2018-12 ( 4 ) 异构媒体数据的关联与挖掘研究(863), 参与, 国家级, 2014-01--2016-12 ( 5 ) 基于稀疏表示的大规模移动视觉搜索技术研究(北京市自科基金面上项目4152050), 主持, 省级, 2015-01--2017-12 ( 6 ) 跨媒体******技术, 主持, 国家级, 2018-02--2021-12 ( 7 ) 图像语义自动标注研究(腾讯公司), 主持, 院级, 2017-05--2018-04 ( 8 ) 基于多模态类脑强化学习的微视频内容理解技术研究, 参与, 省级, 2017-05--2018-12 ( 9 ) 融合多通道语境信息的类人智能感知机制与方法, 主持, 国家级, 2017-10--2021-09 ( 10 ) 基于影像组学的前列腺肿瘤风险评估与手术导航研究(子课题), 主持, 国家级, 2019-01--2022-12 ( 11 ) 242项目, 主持, 国家级, 2019-05--2020-04 ( 12 ) 中国科学院计算技术研究所—寺库AI 联合实验室项目:奢侈品智能鉴定, 参与, 院级, 2019-05--2022-05 ( 13 ) 实培计划:基于深度学习的特定目标检索技术研究, 主持, 省级, 2019-01--2019-07 ( 14 ) 242项目, 主持, 国家级, 2020-08--2021-06 参与会议 (1)Style Separation and Synthesis via Generative Adversarial Networks 2018 ACM多媒体大会(CCF A类国际顶级会议) 2018-10-22 (2)High Resolution Feature Recovering for Accelerating Urban Scene Parsing 第27届国际人工智能联合大会(IJCAI 2018,CCF A类国际顶级会议) 2018-07-13 (3)Scale-adaptive Convolutions for Scene Parsing IEEE国际计算机视觉大会(CCF A类计算机视觉国际顶级会议) Rui Zhang, Sheng Tang, YongDong Zhang, Jintao Li, Shuicheng Yan 2017-10-22 (4)Global-residual and Local-boundary Refinement Networks for Rectifying Scene Parsing Predictions 第26届国际人工智能联合大会(IJCAI 2017,CCF A类国际顶级会议) Rui Zhang,Sheng Tang, Min Lin, Jintao Li, Shuicheng Yan 2017-08-19 (5)Image Caption with Global-Local Attention 第31届国际人工智能大会(AAAI-2017,CCF A类国际顶级会议) Linghui Li, Sheng Tang, Lixi Deng, Yongdong Zhang and Qi Tian 2017-02-06 (6)MCG-ICT-CAS Object Detection at ILSVRC 2016 2015年欧洲计算机视觉会议及ImageNet大规模视觉识别挑战赛 2016-10-09 (7)MCG-ICT-CAS's Investigation of Model Sparsity and Category Information on Object Classification, Localization and Detection at ILSVRC 2015 2015年国际计算机视觉会议及ImageNet大规模视觉识别挑战赛 唐胜 2015-12-17 (8)Large Visual Words for Large Scale Image Classification 2015年国际图像处理会议 唐胜 2015-09-27 (9)Fitted Spectral Hashing 2013 ACM多媒体大会(CCF A类国际顶级会议) Yu Wang, Sheng Tang, YaLin Zhang, Jintao Li, et al, 2013-10-21 (10)SSF Fingerprint for Image Authentication: An Incidental Distortion Resistant Scheme 2005 ACM多媒体大会(CCF A类国际顶级会议) 2009-11-06 (11)PornProbe: an LDA-SVM based Pornography Detection System 2009 ACM多媒体大会(CCF A类国际顶级会议) 2009-10-21 (12)TRECVID 2008 Content-Based Copy Detection By MCG-ICT-CAS 2008年国际视频检索评测会议 2008-11-17 (13)Active learning approach to interactive spatio-temporal news video retrieval 2007年国际图像视频检索会议 2007-07-09

研究领域

计算机视觉与深度学习、模式识别、多媒体内容分析与检索

近期论文

查看导师新发文章 (温馨提示:请注意重名现象,建议点开原文通过作者单位确认)

(1) CGNet: A Light-weight Context Guided Network for Semantic Segmentation, IEEE Transactions on Image Processing, 30(1):1169-1179, 2021, December, 2019. (CCF A类国际顶级期刊,通讯作者), 2021, 第 2 作者 (2) Perspective-adaptive Convolutions for Scene Parsing, IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI), 42(4): 909 – 924, April, 2020. (CCF A类计算机视觉与人工智能领域国际顶级期刊, 通讯作者,https://ieeexplore.ieee.org/document/8598804), 2020, 第 2 作者 (3) Adaptive Spatial Location with Balanced Loss for Video Captioning, IEEE Transactions on Circuits and Systems for Video Technology, 10.1109/TCSVT.2020.3045735, Published online on December 18, 2020. (CCF B类国际视频处理顶级期刊), 2020, 第 3 作者 (4) Overcoming Classifier Imbalance for Long-tail Object Detection with Balanced Group Softmax, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2020), Seattle, Washington, USA. June 16-18, 2020 (CCF A类计算机视觉国际顶级会议长文,通讯作者), 2020, 第 4 作者 (5) AHFF-Net: Adaptive Hierarchical Feature Fusion Network For Image Inpainting, IEEE International Conference on Image Processing (ICIP 2020),Abu Dhabi, United Arab Emirates(UAE), October 25-28, 2020. (通讯作者), 2020, 第 2 作者 (6) Visual Relation Grounding in Videos, 16th European Conference on Computer Vision (ECCV'20), 23-28 August 2020 (计算机视觉国际顶级会议,Accepted), 2020, 第 4 作者 (7) The Devil is in Classification: A Simple Framework for Long-tail Instance Segmentation, 16th European Conference on Computer Vision (ECCV'20), 23-28 August 2020 (计算机视觉国际顶级会议,Accepted), 2020, 第 6 作者 (8) Detection and Tracking Based Tubelet Generation for Video Object Detection, Journal of Visual Communication and Image Representation, Volume 58, January 2019, Pages 102-111.(通讯作者), 2019, 第 2 作者 (9) Asymmetric GAN for Unpaired Image-to-image Translation, IEEE Transactions on Image Processing, 28(12):5881-5896, December, 2019. (CCF A类国际顶级期刊,通讯作者), 2019, 第 2 作者 (10) Spatiotemporal Breast Mass Detection Network (MD-Net) in 4D DCE-MRI Images, International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2019), 13-17 Oct 2019, Shenzhen, China. (国际顶级会议长文,通讯作者), 2019, 第 2 作者 (11) Boundary Perception Guidance: A Scribble-Supervised Semantic Segmentation Approach, The 28th International Joint Conference on Artificial Intelligence (IJCAI-2019), August 10-16, 2019, Macao, China (CCF A类人工智能国际顶级会议长文,通讯作者), 2019, 第 3 作者 (12) Mixed-dish Recognition with Contextual Relation Network, ACM Multimedia 2019, Nice, France, 21-25 October, 2019. (CCF A类国际顶级会议长文), 2019, 第 5 作者 (13) Boundary Perception Guidance: A Scribble-Supervised Semantic Segmentation Approach, 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), August 10-16 2019, Macao, China.(通讯作者), 2019, 第 3 作者 (14) Learning and Thinking Strategy for Training Sequence Generation Models, British Machine Vision Conference (BMVC) 2018,Newcastle, UK, September 3-6, 2018.(计算机视觉领域著名国际会议,通讯作者), 2018, 第 2 作者 (15) Image Captioning Based on Adaptive Balancing Loss, Fourth IEEE International Conference on Multimedia Big Data, BigMM 2018, Xi'an, China, September 13-16, 2018.(通讯作者)., 2018, 第 2 作者 (16) High Resolution Feature Recovering for Accelerating Urban Scene Parsing, The 27th International Joint Conference on Artificial Intelligence (IJCAI-2018), Stockholm, Sweden, July 13-19, 2018(CCF A类人工智能国际顶级会议长文, 通讯作者), 2018, 第 2 作者 (17) High Sensitivity with Tiny Candidates for Pulmonary Nodule Detection, International Conference On Medical Image Computing and Computer Assisted Intervention (MICCAI 2018), September 16-20, 2018, Granada, Spain. (Proventional Accept without Rebuttal, 医疗影像处理国际顶级会议长文,通讯作者), 2018, 第 3 作者 (18) Style Separation and Synthesis via Generative Adversarial Networks, ACM Multimedia 2018, Seoul, Korea, 22-26 October 2018. (CCF A类多媒体国际顶级会议长文,通讯作者), 2018, 第 2 作者 (19) Implicit Negative Sub-categorization and Sink Diversion for Object Detection, IEEE Transactions on Image Processing, 27(4):1561-1574,2018 (CCF A类图像处理国际顶级期刊,通讯作者), 2018, 第 2 作者 (20) GLA: Global-local Attention for Image Description, IEEE Transactions on Multimedia, 20(3): 726-737, March, 2018.(CCF B类多媒体国际顶级期刊,通讯作者), 2018, 第 2 作者 (21) Zero-shot Learning with Attribute Selection, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A类人工智能国际顶级会议长文), 2018, 第 4 作者 (22) Auto-balanced Filter Pruning for Efficient Convolutional Neural Networks, The 32th AAAI Conference on Artificial Intelligence (AAAI-2018), February 2 - 7, 2018, New Orleans, USA. (CCF A类人工智能国际顶级会议长文), 2018, 第 4 作者 (23) Scale-adaptive Convolutions for Scene Parsing, in Proc. 2017 International Conference on Computer Vision (ICCV) 2017, pp.2031-2039,Venice, Italy, October 22-29, 2017. (CCF A类计算机视觉国际顶级会议长文,通讯作者), 2017, 第 2 作者 (24) Object Localization Based on Proposal Fusion, IEEE Transactions on Multimedia, 19(9):2105-2116, September 2017 (CCF B类多媒体国际顶级期刊), 2017, 第 1 作者 (25) Multi-modal tag localization for mobile video search, Multimedia Systems, 23(6): 713-724, 2017. (CCF C类多媒体国际著名期刊), 2017, 第 3 作者 (26) HDIdx: High-dimensional indexing for efficient approximate nearest neighbor search, Neurocomputing 237: 401-404, 2017. (CCF C类国际期刊,通讯作者), 2017, 第 2 作者 (27) Image Caption with Global-Local Attention, The 31th AAAI Conference on Artificial Intelligence (AAAI-2017), Pages: 4133-4139, San Francisco, California USA, February 4–9, 2017. (CCF A类人工智能国际顶级会议长文,通讯作者), 2017, 第 2 作者 (28) Global-residual and Local-boundary Refinement Networks for Rectifying Scene Parsing Predictions, The 26th International Joint Conference on Artificial Intelligence (IJCAI-2017),Pages:3427-3433,Melbourne, Australia, August 19-25, 2017. (CCF A类人工智能国际顶级会议长文,通讯作者), 2017, 第 2 作者 (29) 移动视觉搜索综述, 计算机辅助设计与图形学学报, 29(6), Preprint, 2017, 通讯作者 (30) 融合多模型和帧间信息的行人检测算法, 计算机辅助设计与图形学学报 29 (3), 444-449, 2017, 第 3 作者 (31) Adaptive weighted imbalance learning with application to abnormal activity recognition, Neurocomputing 173: 1927-1935, 2016, 2016, 第 3 作者 (32) Category Aggregation Among Region Proposals for Object Detection, Advances in Multimedia Information Processing - PCM 2016 - 17th Pacific-Rim Conference on Multimedia, Pages: 210-220, Xi'an, China, September 15-16, 2016(CCF C类国际会议,通讯作者), 2016, 第 2 作者 (33) An Efficient Concept Detection System Via Sparse Ensemble Learning, NeurocomputingNeurocomputing, Volume 169, Pages 124-133,, 2015, 第 1 作者 (34) A Sparse Ensemble Learning System For Efficient Semantic Indexing, ACM International Conference on Multimedia Retrieval (ICMR), June 23-26, 2015, 第 1 作者 (35) Large Visual Words for Large Scale Image Classification, IEEE International Conference on Image Processing (ICIP), Sep. 27-30, 2015, 第 1 作者 (36) Scalable Logo Recognition based on Compact Sparse Dictionary for Mobile Device, The 17th IEEE International Workshop on Multimedia Signal Processing (MMSP), (Top 10% Paper Award), 2015, 第 1 作者 (37) Fusing audio vocabulary with visual features for pornographic video detection, Future Generation Comp. Syst. 31: 69-76 , 2014, 第 4 作者 (38) A Representative Local Region Detector Based On Color-Contrast-MSER, ACM International Conference on Multimedia Retrieval (ICMR), 2014, 第 3 作者 (39) 高通量视频内容分析技术, 工程研究——跨学科视野中的工程, 6(3): 253-265, 2014, 第 1 作者 (40) FSpH: Fitted Spectral Hashing Exploring Entropy Maximizing Criterion for Efficient Retrieval, Computer Vision and Image Understanding (CVIU), 124: 3-11, 2014, 通讯作者 (41) Representative selection based on sparse modeling, Neurocomputing, 139: 423-431, 2014, 第 2 作者 (42) Semi-supervised learning via Sparse Model, Neurocomputing, Volume 131, Number 5, pages: 124-131, 2014, 第 2 作者 (43) Pedestrian Detection based on Sparse Coding and Transfer Learning, Machine Vision and Applications, , 25(7): 1697-1709, 2014, 第 2 作者 (44) Robust Human Body Segmentation based on Part Appearance and, Neurocomputing, Volume 118, Number 22, Pages 191-202, 2013, 第 2 作者 (45) Ensemble Learning with LDA Topic Models for Visual Concept Detection, Multimedia - A Multidisciplinary Approach to Complex Issues , Ioannis Karydis (Ed.), ISBN: 978-953-51-0216-8, InTech - Open Access Publisher, chapter 9, pages: 175-200, 2013, 第 1 作者 (46) Accurate Estimation of Human Body Orientation From RGB-D Sensors, IEEE Transactions on Cybernetics , Volume: 43 Issue: 5, pages: 1442 - 1452,, 2013, 第 3 作者 (47) Robust common visual pattern discovery using graph matching, Journal Visual Communication and Image Representation 24(5): 635-646, 2013, 第 4 作者 (48) Fitted Spectral Hashing, ACM Multimedia 2013: 645-648, Barcelona, Spain, 2013, 第 2 作者 (49) Data Driven Multi-Index Hashing, International Conference on Image Processing (ICIP), 2013, 第 2 作者 (50) Sparse Ensemble Learning for Concept Detection, IEEE Transactions on Multimedia, 14(1):43-54, 2012, 第 1 作者 (51) Fast Pedestrian Detection Based on Sliding Window Filtering, Advances in Multimedia Information Processing – PCM 2012 , pp: 811-822, Singapore, 2012, 通讯作者 (52) Exploring Multi-Modality Structure for Cross Domain Adaptation in Video Concept Annotation, Neurocomputing, 95:11-21, October, 2012, 第 2 作者 (53) Exploring Probabilistic Localized Video Representation for Human Action Recognition, Multimedia Tools and Applications, 58(3):663-685, June,, 2012, 第 2 作者 (54) Localized Multiple Kernel Learning for Realistic Human Action Recognition in Videos, IEEE Transactions on Circuits and Systems for Video Technology, 21(9):1193-1202, 2011, 第 3 作者 (55) Efficient Feature Detection and Effective Post-Verification for Large Scale Near-Duplicate Image Search, IEEE Transactions on Multimedia, 13(6):1319-1332, 2011, 第 4 作者 (56) A Distribution Based Video Representation For Human Action Recognition, Proc. of IEEE International Conference on Multimedia and Expo , 2010, 第 2 作者 (57) PornProbe: an LDA-SVM based Pornography Detection System, ACM Multimedia 2009, 2009, 第 1 作者 (58) 一种基于密度的自适应最优LDA模型选择方法, 计算机学报, 2008, 第 4 作者 (59) TRECVID 2008高级语义概念提取(MCG-ICT-CAS), TRECVID 2008 High-Level Feature Extraction By MCG-ICT-CAS, Proc. TRECVID Workshop 2008, 2008, 第 1 作者 (60) TRECVID 2007高级语义概念提取(MCG-ICT-CAS), TRECVID 2007 High-Level Feature Extraction By MCG-ICT-CAS, Proc. TRECVID Workshop 2007, 2007, 第 1 作者 (61) Secure and Incidental Distortion Tolerant Digital Signature for Image Authentication, Journal of Computer Science and Technology , 2007, 通讯作者 (62) SSF Fingerprint for Image Authentication: An Incidental Distortion Resistant Scheme, Proc. ACM Multimedia 2005, 2005, 第 1 作者 (63) Compact and Robust Image Hashing, Lecture Notes in Computer Science, 2005, 第 1 作者 (64) Compact And Robust Fingerprints Using DCT Coefficients Of Key Blocks, Lecture Notes in Computer Science, 2005, 第 1 作者

推荐链接
down
wechat
bug