当前位置: X-MOL首页全球导师 国内导师 › 夏天

个人简介

男,博士。中国人民大学信息资源管理学院副教授。已经转换的研究成果包括:基于AKKA的高性能分布式定向采集爬虫、网页正文自动抽取、关键词/关键短语抽取、拼写纠错、数据资源的数字指纹生成与检测、相似度计算、情感分析、舆情监测、基于维基的语义分析和图谱构建、基于Spark的轨道交通大数据分析、政府网站内容检测分析等。

研究领域

信息检索、电子文件管理、Web数据挖掘、社会网络分析、语义网

近期论文

查看导师新发文章 (温馨提示:请注意重名现象,建议点开原文通过作者单位确认)

1) Xiaozhong Liu, Tian Xia, Yingying Yu, Chun Guo, Yizhou Sun. Cross Social Media Recommendation, ICWSM-­16, 2016. 2) 2016, 夏天, 基于维基百科的中文文本层次路径生成研究,现代图书情报技术,2016, 32 (3): 25-32. 3) 2016, 张宁,夏天,王皓,黄蕊,陈扬,柳增寿,王烨. 2015年我国省级档案网站建设测评项目综述[J],中国档案,2016,(1): 36-39. 4) 2016, Tian Xia, Miao Chen, Xiaozhong Liu. Twibo: Comparing Very Large Communities via Massive Social Media Datasets. iConference 2016. 5) 2014, Tian Xia, Miao Chen, Xiaozhong Liu, Explicit Semantic Path Mining via Wikipedia Knowledge Tree, Proceedings of the American Society for Information Science and Technology, 2014, 51(1): 1-4. 6) 2014, Xin Shuai, Xiaozhong Liu, Tian Xia, Yuqing Wu, Chun Guo. Comparing the Pulses of Categorical Hot Events in Twitter and Weibo, Proceedings of the 25th ACM conference on Hypertext and social media. 2014, Santiago, Chile, pp.126-135. 7) 2014, 夏天, 陈杰, 魏小贞, 魏书莉, 丁天星. 中国政府网站移动浏览器兼容性研究. 现代情报,2014,34(11): 62-69. 8) 2014, 顾益军, 解易, 夏天. 基于内容代表性评价的关键帧抽取. 计算机科学, 2014, 41(8): 286-288. 9) 2014, 顾益军, 夏天. 融合LDA与TextRank的关键词抽取研究. 现代图书情报技术, 2014, 30(7): 41 -- 47. 10) 2013, 夏天. 词语位置加权TextRank的关键词抽取研究. 现代图书情报技术, 2013, 29(9): 30-34. 11) 2012, 夏天. 中心网页中主题网页链接的自动抽取. 山东大学学报(理学版), 2012, 47(5):25-31. 12) 2011, 夏天. Web数据的深度定向采集. 山东大学学报(理学版),2011,46(5):34-38. 13) 2011, 夏天. 基于扩展标记树的网页正文抽取. 广西师范大学学报(自然科学版), 2011, 29(1): 133-137. 14) 2010, 罗威丽, 夏天, 顾益军. 一种新的电子数据鉴定工具功能交叉划分法. 中国人民公安大学学报(自然科学版) , 2010, 63(1): 67-70. 15) 2010, 夏天. Ajax站点数据采集研究综述. 现代图书情报技术, 2010, 26(3): 52-57. 16) 2010, 夏天. Nutch的插件机制分析. 广西师范大学学报(自然科学版), 2010, 28(1): 105-108. 17) 2009, Tian Xia. Extracting Structured Data from Ajax Site, 2009 International IEEE Workshop on Database Technology and Applications(DBTA2009), 2009-4-25, Wuhan, China, pp. 259-262. 18) 2009, Tian Xia. Generating Multi-page Mirror Site from Ajax Interfaces, Journal of ICS, 2009-06 6(2):985-992. 19) 2008, 夏天. 我国档案网站Web标准化现状分析. 档案学通讯. 2008,5:12-15. 20) 2008, Tian Xia. Extracting Multi-Records from Web Pages, 4th International Conference on Semantics, Knowledge and Grid (SKG2008), 2008-12-3, Beijing, China, pp. 396-399. (EI) 21) 2008, An Edit Distance Algorithm with Block Swap. The 9th International Conference for Young Computer Scientists(ICYCS2008), 2008-11-18, Zhangjiajie, China., pp. 54-59. (EI) 22) 2008, Tian Xia. Large-Scale SMS Messages Mining Based on Map-Reduce. 2008 International Symposium on Computational Intelligence and Design(ISCID2008), 2008-10-17, Wuhan, China. 7-12.(ISTP,EI) 23) 2008, Shinlges-Based Structural Clustering of Web Documents. Journal of Computational Information Systems, 2008,4(4):1721-1729. (EI) 24) 2008, Tian XIA. A Shingles Approach to Web Document Structural Similarity Computation. International Conference on Information Technology & Environmental System Sciences 2008, 2008-05-15, Jiaozuo, P685-691 (ISTP) 25) 2008, Kang CHEN,Xiao-zhong FAN,Jie LIU,Tian XIA. Study on FAQ oriented Question Answering system. Journal of Computational Information Systems. 2008,4(2), 2008-02. 26) 2007, 夏天. 汉语词语语义相似度计算研究. 计算机工程,2007,33(6):191-194. 27) 2006, 夏天. J2EE应用服务器兼容研究. 计算机工程,2006,32(2):65-67.

推荐链接
down
wechat
bug