一种面向软件特征定位问题的语义相似度集成方法

被引:10
作者
何云 [1 ]
李彤 [1 ,2 ]
王炜 [1 ,2 ]
李响 [1 ]
兰微 [1 ]
机构
[1] 云南大学软件学院
[2] 云南省软件工程重点实验室(云南大学)
关键词
特征定位; 信息检索; 语义相似度; 词性过滤; 索引方法; 集成;
D O I
暂无
中图分类号
TP311.5 [软件工程]; TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化]; 081205 [计算机软件];
摘要
特征是软件系统中被需求所定义的可执行功能实体.识别软件特征与源代码间映射关系的过程被称作特征定位.基于信息检索的特征定位方法由于高易用性和低开销等优点,被广泛应于软件维护、代码搜索等领域.所有基于信息检索的特征定位方法均建立在语义相似度计算基础之上,当前语义相似度计算存在2个主要问题:第一,源代码数据中大量噪声信息对相似度计算的干扰;第二,不同索引方法局限性导致的相似度计算结果失准.针对这2个问题,提出了一种面向软件特征定位问题的语义相似度集成方法.该方法在预处理过程引入词性过滤,有效过滤源代码中噪声数据,提升相似性计算的准确度.然后,以源代码数据自身结构特性为依据,集成不同索引方法进行相似度计算.在公开数据集上进行了实验,与现有方法相比,词性过滤和相似度集成在平均排序倒数性能上分别带来了30.88%和10.28%的提升,验证了所提方法的有效性.
引用
收藏
页码:394 / 409
页数:16
相关论文
共 9 条
[1]
一种软件演化活动波及效应混合分析方法 [J].
王炜 ;
李彤 ;
何云 ;
李浩 .
计算机研究与发展, 2016, 53 (03) :503-516
[2]
基于最大间隔理论的组合距离学习算法 [J].
郭瑛洁 ;
王士同 ;
许小龙 .
智能系统学报, 2015, 10 (06) :843-850
[3]
面向行为主题的软件特征定位方法 [J].
何云 ;
王炜 ;
李彤 ;
张秀洋 ;
韩俊明 .
计算机科学与探索, 2014, (12) :1452-1462
[4]
特征加权距离与软子空间学习相结合的文本聚类新方法 [J].
王骏 ;
王士同 ;
邓赵红 .
计算机学报, 2012, 35 (08) :1655-1665
[5]
A historical; textual analysis approach to feature location.[J].Muslim Chochlov;Michael English;Jim Buckley.Information and Software Technology.2017,
[6]
Computing Dynamic Slices of Feature--Oriented Programs Using Execution Trace File.[J].Madhusmita Sahu;Durga Prasad Mohapatra.ACM SIGSOFT Software Engineering Notes.2017, 2
[7]
Configuring latent Dirichlet allocation based feature location [J].
Biggers, Lauren R. ;
Bocovich, Cecylia ;
Capshaw, Riley ;
Eddy, Brian P. ;
Etzkorn, Letha H. ;
Kraft, Nicholas A. .
EMPIRICAL SOFTWARE ENGINEERING, 2014, 19 (03) :465-500
[8]
A Systematic Survey of Program Comprehension through Dynamic Analysis [J].
Cornelissen, Bas ;
Zaidman, Andy ;
van Deursen, Arie ;
Moonen, Leon ;
Koschke, Rainer .
IEEE TRANSACTIONS ON SOFTWARE ENGINEERING, 2009, 35 (05) :684-702
[9]
An empirical analysis of information retrieval based concept location techniques in software comprehension [J].
Cleary, Brendan ;
Exton, Chris ;
Buckley, Jim ;
English, Michael .
EMPIRICAL SOFTWARE ENGINEERING, 2009, 14 (01) :93-130