期刊:Data Science and Engineering
微信原文:点击阅读微信原文
文章介绍
最优次序路径(OSR)查询是智能城市路线规划中的一个热门问题,以寻找从一个起始位置以特定的次序经过多个兴趣点(POI)的最小距离路线。实际上,将POI进行评级排列,有助于用户做出决策。现有的OSR查询忽略了一个事实,即同一类别的POI可能有不同的评分,这可能会影响用户的路线选择。该文研究了OSR查询的一种新改编算法,即评分约束的最优次序路路径查询(RCOSR),该方法中最优次序路径中的每个POI的评分都超过查询阈值。为了有效地处理RCOSR查询,该文首先扩展了现有的TD-OSR算法,提出名为MTDOSR的基线方法。针对MTDOSR算法的不足,设计了一种新的RCOSR算法,即最优子路径扩展(OSE)算法。实验结果表明,该算法的性能明显优于现有算法。图1显示了路网中OSR查询的一个例子。
图1具有评分的兴趣点(POI)的路网
该文的贡献总结如下:
· 提出并解决评分约束最优次序路径查询问题
· 提出MTDOSR算法解决RCOSR查询和低效率问题
· 提出OSE算法, 采用动态规划方式扩展最优子路径,并提出索引(RNII)用以加速OSE中POI对的距离计算
· 在OSE和RNII的基础上,进一步提出ROSE算法,迭代计算最优评分约束序列路径作为引导路径来指导路径探索
· 将ROSE扩展为kROSE,以解决前k个RCOSR查询
实验效果
该文实验采用真实和合成数据集,其中CA数据集是加利福尼亚真实的道路网络,OL数据集是Oldenburg城市真实的道路网络。此外,文章生成的合成数据集中包含100,000个节点,125,000个道路边缘,10,000个POI(随机设置从0到100的评级评分)属于50个类别。所有算法都使用C++实现。
如表1所示,该文对模型算法进行了性能评估,一方面,评估RCOSR算法的效率,比较了在各种参数下的查询时间和被访问的节点数。另一方面,评价RNII的效率,使用RNII比较了参考节点策略的查询时间和覆盖率。
表1 参数范围和默认值
*Query size是指查询规模(即查询类别的数量)
**Network size (×1000)是指网络规模(即|V|)
该文还在查询规模、网络大小、POI数量、节点平均度四个方面,比较了使用随机策略的ROSE(称为ROSE_RD)、使用贪婪合并策略的ROSE(称为ROSE_GM)和使用两个真实数据集的MTDOSR的效率。
如图2所示,随着查询规模的增加,所有算法的查询时间和访问节点数都在增加。对于OL数据集,ROSE的优势比CA数据集更明显。
图2 在实际路网中的性能w.r.t查询大小
如图3所示,合成数据集中ROSE和MTDOSR针对不同网络大小的查询时间和访问节点数。两种算法的查询时间随着网络规模的增大而增大,而ROSE的性能明显优于MTDOSR。
图3 时间w.r.t.网络大小
如图4所示,就POI数的影响而言,ROSE优于MTDOSR,特别是在POI数较小时。随着POI个数的增加,两种算法的查询时间都在增加,且ROSE对POI个数更加敏感。
图4 时间w.r.t POI数量
如图5所示,比较了算法性能与节点平均度的关系。两种算法随着节点平均度的增加,查询时间和访问节点数都略有增加。MTDOSR中使用堆存储整个路径的节点,但排列和搜索堆非常耗时,而ROSE采用A*算法计算两个POI之间的距离,只需要维护堆中的少量节点。
图5 时间w.r.t节点平均度
结语
该文研究评分约束的最优次序路径(RCOSR)查询,指的是最优次序路径所含POI的评级得分都应满足用户阈值。为有效处理查询,该文优化TD-OSR算法作为基线方法,称其为MTDOSR。针对该算法不足之处,该文提出一种新的最优子路由扩展(OSE)算法。此外,该文还提出参考节点倒排索引(RNII)来加速OSE中的距离计算。基于OSE和RNII,进一步提出新的循环最优子路径扩展算法(ROSE)。之后,进一步研究RCOSR查询的改编方法,即RCkOSR查询。最后该文评估综合性能,验证所提指标和算法的有效性。
作者简介
朱怀杰,博士,于2018年获得东北大学计算机软件与理论专业博士学位。攻读博士学位期间,赴美国宾州州立大学联合培养。担任CCF中国数据库专委会执行委员。现为中山大学副研究员,主要研究方向包括:空间数据库,社交网络及隐私保护。目前在数据库领域发表多篇高水平学术论文,其中包括SIGMOD,TKDE,ICDE等多篇顶级学术论文。主持国家自然科学基金1项,广东面上基金1项。
黎文彬,硕士,于2021年获得中山大学计算机专业硕士学位。主要研究领域为空间数据库,路径查询。
刘威, 博士,副研究员,2018年6月博士毕业于中山大学计算机科学与技术专业,并在中山大学数据科学与计算机学院担任副研究员。担任CCF中国数据库专委会通讯委员。近三年,在人工智能、数据挖掘等领域的重要会议期刊发表多篇文章,包括IJCAI、 ACL、WWW Journal、DASFAA、FGCS、IPM等。研究兴趣包括:个体行为分析、时空数据挖掘、推荐系统等。
印鉴,教授,于1989年获武汉大学学士学位,1994年硕博连读,获武汉大学博士学位。现任中山大学人工智能学院副院长。主持国家自然科学基金重点和面上项目、国家科技部重大专项计划项目子课题、广东省自然科学基金团队和重点项目、广东省重点研发计划项目等三十多个项目的研究工作。目前,主要从事人工智能、机器学习、大数据分析与处理、数据库与数据挖掘等方面的研究工作。
徐建良,教授,现任香港浸会大学,于1998年获得浙江大学计算机科学与工程学士学位,2002年获得香港科技大学计算机科学博士学位后加入香港浸会大学计算机科学系,曾为宾夕法尼亚州立大学大学公园分校和复旦大学的访问学者。现任香港浸会大学担任区块链和金融科技实验室主任,并领导数据库研究小组。他的研究方向是大数据、区块链、移动计算、数据安全和隐私。
期刊简介
Data Science and Engineering (DSE)是由中国计算机学会(CCF)主办,数据库专业委员会承办,施普林格 自然(Springer Nature)出版的开放获取期刊。DSE致力于发表所有和数据科学与工程领域相关的关键科学问题与前沿研究热点,以大数据作为研究重点,征稿范畴主要包括:数据本身,数据信息提取方法,数据计算理论,以及用来分析与管理数据的技术和系统。
目前期刊已被EI、ESCI与SCOPUS收录,CiteScore 2021为6.4,在Computer Science Applications领域排名# 157/747(位列前21%)。稿件处理费由赞助商中新赛克(Sinovatio)承担,欢迎大家免费下载阅读期刊全文,并积极投稿。
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!