基于LDA主题模型的软件缺陷分派方法

被引:10
作者
黄小亮 [1 ]
郁抒思 [1 ]
关佶红 [2 ]
机构
[1] 复旦大学计算机科学技术学院
[2] 同济大学计算机科学与技术系
关键词
软件缺陷分派; 隐含狄利克雷分配模型; 马尔可夫链蒙特卡洛方法; 吉布斯采样; 文本分类; 向量空间模型;
D O I
暂无
中图分类号
TP311.52 [];
学科分类号
081202 ; 0835 ;
摘要
传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。
引用
收藏
页码:46 / 48
页数:3
相关论文
共 2 条
[1]   基于LDA模型的主题词抽取方法 [J].
石晶 ;
李万龙 .
计算机工程, 2010, 36 (19) :81-83
[2]  
Who should fix this bug?. ANVIK J,HIEW L,MURPHY G C. Proc of International Conference on Software Engineering . 2006