10038
当前位置: 首页   >  课题组新闻   >  研究组在CCF推荐国际学术会议APSEC 2024发表论文多篇
研究组在CCF推荐国际学术会议APSEC 2024发表论文多篇
发布时间:2024-09-14

近日,第三十一届亚太软件工程国际会议(31st Asia-Pacific Software Engineering Conference, APSEC 2024)公布了今年的论文录用结果,研究组2023级硕士研究生贺昕宇、邹致远同学的两篇论文,均被接收为Technical Paper(Regular/Full Paper),展现了研究组在软件需求跟踪领域的最新研究进展。

论文一录用通知

论文二录用通知

3 FRELinker框架图

贺昕宇同学完成的论文《FRELinker: A Novel Issue-Commit Link Recovery Model Based on Feature Refinement and Expansion with Multi-Classifier Fusion》聚焦于软件跟踪领域的自动化issue-commit链接恢复任务。现有的机器学习方法通常难以应对由自然语言文本、代码及哈希值等多种数据类型构成的复杂特征组合,导致性能受限。为此,本文提出了一种名为FRELinker的模型。在特征工程阶段,该模型将特征分为文本特征、代码特征、非文本特征和相似性特征等四大类,并对相似性特征进行了扩展,通过同时使用单一相似度和混合文本相似度,来挖掘更有价值的特征。在模型训练阶段,该模型针对每一类特征,训练独立分类器,充分发挥机器学习模型在单一类型数据上的效果,并根据模型在数据集上的平均表现分别选择了表现最好的分类器(文本特征使用GB分类器,代码特征使用LR分类器,非文本特征和相似性特征使用RF分类器)。在最终融合阶段,对这四个分类器模型的结果采用贝叶斯模型进行融合,达到了良好的分类效果。实验结果表明,FRELinker 在六个真实开源软件(OSS)数据集上,相比现有的Hybrid-Linker和DeepLink方法,在Precision、Recall和F1指标上均表现出显著的性能提升,展示了其在复杂和多样数据环境下的广泛应用前景。

4 HANTracer框架图

邹致远同学的论文《HANTracer: Leveraging Heterogeneous Graph Attention Network for Large-Scale Requirements-Code Traceability Link Recovery》提出了一种基于异构图注意力网络(HAN)的需求追踪方法。在需求与代码追踪链接恢复任务中,随着软件规模的持续增长,数据间的索引差异逐渐减小,传统的信息检索和机器学习方法无法有效处理数据间的复杂非线性关系,导致模型性能的显著下降。为应对这一挑战,HANTracer 模型将预训练模型生成的高维特征向量作为节点特征,增强节点区分度,并通过图结构学习上下文信息提升节点表示能力。同时,该模型利用异构边的特性,构建了代码调用、代码继承和文本相似性等多种边特征,有效捕捉不同类型数据元素间的关系。通过引入平均池化层和多层全连接层,进一步提升了非线性特征的提取能力。实验结果表明,HANTracer 在七个真实开源软件(OSS)数据集上相比于最先进的TAROT和DF4RT方法,F1指标平均提升了100.30%和46.27%,展示了其在大规模和复杂数据环境下的显著性能优势。

据悉,这两篇论文均在王帮超老师和万红艳老师的指导下完成,研究组成员们通过不懈努力和创新探索,在软件追踪领域取得了持续的进展。未来,我组将继续在前沿课题中深耕细作,为解决软件工程中的复杂问题贡献更多有价值的解决方案!