近日,研究组在软件可跟踪性领域再次取得进展, 2023级硕士研究生邹致远同学的论文“Enhancing Requirements-to-Code Traceability with GA-XWCoDe: Integrating XGBoost, Node2Vec, and Genetic Algorithms for Improving Model Performance and Stability ”被中科院二区期刊Journal of King Saud University - Computer and Information Sciences 录用发表,邹致远同学是该论文的第一作者,王帮超老师是论文的通讯作者,这也是自2022年以来,我组在软件可跟踪性方面持续发表的第17篇高水平论文。
图1:论文录用通知
图2:GA-XWCoDe方法架构总览图
该论文提出了一种针对于需求-代码跟踪链接恢复任务的新模型,名为GA-XWCoDe,其整体架构图如图2所示。该方法将XGBoost与基于Node2Vec的加权代码依赖策略相结合,并通过遗传算法进行参数优化。具体而言,XGBoost作为基模型具有较高的性能同时能够利用其正则化的机制减轻过拟合现象,而通过Node2Vec的方法对不同的代码依赖图和共现关系图又进行了关系紧密度计算,从而对不同的代码依赖关系实施加权处理,最后通过遗传算法优化XGBoost中的超参数和代码依赖策略中的参数,以减少传统方法在确定最优参数步骤上造成的资源上的消耗。
表1. 基于瑞士轮方法的最优遗传算法参数确定表
表2. GA-XWCoDe与基线方法的性能比较表,其中*表示GA-XWCoDe在置信度水平a<0.01下优于其他基线方法
该文还通过瑞士轮的方法对遗传算法中不同的交叉变异概率进行了实验,如表1所示的结果表明,当变异概率为0.1,交叉概率为0.9时模型性能达到最优。此外,研究还利用该配置进行了性能实验,如表2所示的实验结果表明,GA-XWCoDe在上述四个数据集中的精确率、召回率和F1值均在a<0.01的置信度水平下好于其他所有基线方法,这说明GA-XWCoDe的性能具有显著性优势。
据悉,武汉纺织大学智能化软件开发研究组非常注重与国内外知名高校和研究机构的合作,与武汉大学、吉林大学、武汉理工大学、华中农业大学、澳大利亚麦考瑞大学、澳大利亚西澳大学等长期合作,产生了一批高水平的成果。此外,这些高水平成果还得到国家自然科学基金项目、湖北省教育厅科学研究计划中青年人才项目和湖北省服装信息化工程技术研究中心开放课题的资助。