基于VSM和LDA模型的FAQ问答系统

被引:3
作者
郑诚
刘娇丽
项珑
机构
[1] 安徽大学计算机科学与技术学院
基金
安徽省自然科学基金;
关键词
VSM; 相似度计算; LDA(Latent Dirichlet Allocation); 主题-词分布;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
传统的搜索引擎返回的数据太过庞大,很多情况下用户不能快速地找到自己要的答案。在这种情况下,文中引入FAQ系统。FAQ中如何找到最佳匹配答案,是文中的研究重点。改进了传统的VSM模型,使得它能更好地体现问题中词的权重。重点引入了LDA模型,并用计算机故障领域内的文档资料对它进行训练,得到主题-词的概率分布。通过主题-词中词的概率分布,计算词与词的相关度,提出通过词与词间相关度计算句子与句子间相似度的算法。对两个算法进行综合,得到最终的相似度算法。文中对FAQ进行整理,得到了FAQ问答系统的雏形。通过实验分析,说明相似度算法有很好的效果。
引用
收藏
页码:133 / 135
页数:3
相关论文
共 9 条
[1]  
Combining semantic information in question answering systems.[J].Paloma Moreda;Hector Llorens;Estela Saquete;Manuel Palomar.Information Processing and Management.2010, 6
[2]  
基于《知网》的句子相似度计算的研究.[D].张玉娟.中国地质大学(北京).2006, 02
[3]   基于VSM的权重改进文档相似度算法研究 [J].
韩如冰 ;
叶得学 .
软件, 2012, 33 (10) :103-105
[4]   问答系统研究综述 [J].
毛先领 ;
李晓明 .
计算机科学与探索, 2012, 6 (03) :193-207
[5]   一种改进的LDA主题模型 [J].
张小平 ;
周雪忠 ;
黄厚宽 ;
冯奇 ;
陈世波 ;
焦宏官 .
北京交通大学学报, 2010, (02) :111-114
[6]   基于VSM的文本相似度计算的研究 [J].
郭庆琳 ;
李艳梅 ;
唐琦 .
计算机应用研究, 2008, (11) :3256-3258
[7]   一种改进的基于《知网》的词语语义相似度计算 [J].
江敏 ;
肖诗斌 ;
王弘蔚 ;
施水才 .
中文信息学报, 2008, (05) :84-89
[8]   本体映射过程中概念相似度计算方法的改进 [J].
谷志锋 ;
刘勇 ;
郭跟成 .
计算机工程与应用 , 2008, (08) :67-70+91
[9]   基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17