基于矩阵加权关联规则挖掘的伪相关反馈查询扩展

被引:69
作者
黄名选 [1 ]
严小卫 [2 ]
张师超 [3 ,2 ]
机构
[1] 广西教育学院数学与计算机科学系
[2] 广西师范大学计算机科学与信息工程学院
[3] 中山大学逻辑与认知研究所
关键词
信息检索; 伪相关反馈; 查询扩展; 关联规则; 矩阵加权;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高.
引用
收藏
页码:1854 / 1865
页数:12
相关论文
共 7 条
  • [1] 查询扩展技术进展与展望
    黄名选
    严小卫
    张师超
    [J]. 计算机应用与软件, 2007, (11) : 1 - 4+8
  • [2] 基于用户日志的查询扩展统计模型
    崔航
    文继荣
    李敏强
    [J]. 软件学报, 2003, (09) : 1593 - 1599
  • [3] 向量空间模型中完全加权关联规则的挖掘
    谭义红
    林亚平
    不详
    [J]. 计算机工程与应用 , 2003, (13) : 208 - 211
  • [4] Mining web documents to find additional query terms using fuzzy association rules
    Martín-Bautista, MJ
    Sánchez, D
    Chamorro-Martínez, J
    Serrano, JM
    Vila, MA
    [J]. FUZZY SETS AND SYSTEMS, 2004, 148 (01) : 85 - 104
  • [5] Performance standards and evaluations in IR test collections: Cluster-based retrieval models[J] . W.M. Shaw,Robert Burgin,Patrick Howell.Information Processing and Management . 1997 (1)
  • [6] LOCAL FEEDBACK IN FULL-TEXT RETRIEVAL SYSTEMS
    ATTAR, R
    FRAENKEL, AS
    [J]. JOURNAL OF THE ACM, 1977, 24 (03) : 397 - 417
  • [7] Query expansion by mining user logs. Cui H,Wen JR,Nie JY,Ma WY. IEEE Trans.on Knowledge and Data Engineering(TKDE) . 2003