当前位置: X-MOL首页全球导师 国内导师 › 谢正茂

个人简介

从参加北京大学网络实验室的研究工作之后,就在进行搜索引擎的开发和研究工作,先后对“天网搜索引擎”的搜集程序进行了两次改版,实现了增量式对中国Web的持续搜集,系统具备每天增量搜集三千万网页的能力。现在从事的研究工作主要围绕Web Infomall展开,该系统收集、存储了中国2002年来的70亿互联网网页。 作为骨干参与的项目“北大燕穹海量网络信息的收集、组织与服务平台”,获北京市科学技术二等奖;作为骨干参与的“中国网页信息博物馆及其数据开放”获2016中国计算机学会科学技术二等奖。

研究领域

查看导师新发文章 (温馨提示:请注意重名现象,建议点开原文通过作者单位确认)

互联网内容搜集与信息提取

推荐链接
down
wechat
bug