文本信息检索的代数模型综述

被引:5
作者
王修力 [1 ]
马利平 [2 ]
机构
[1] 山东济南广播电视大学信息学院
[2] 山东正元地球物理勘测有限公司
关键词
文本信息检索; 相关性; 相似度; 代数模型; 召回率; 准确率;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
为了比较各类模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验和研究报告,概述了文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统Smart和Lemur。
引用
收藏
页码:569 / 576
页数:8
相关论文
共 19 条
[1]   Introduction: A perspective on Web Information Retrieval [J].
Melucci, M ;
Hawking, D .
INFORMATION RETRIEVAL, 2006, 9 (02) :119-122
[2]   Evaluating implicit feedback models using searcher simulations [J].
White, RW ;
Ruthven, I ;
Jose, JM ;
Van Rijsbergen, CJ .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2005, 23 (03) :325-361
[3]   System performance and natural language expression of information needs [J].
Liggett, W ;
Buckley, C .
INFORMATION RETRIEVAL, 2005, 8 (01) :101-128
[4]   Evaluating implicit measures to improve web search [J].
Fox, S ;
Karnawat, K ;
Mydland, M ;
Dumais, S ;
White, T .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2005, 23 (02) :147-168
[5]   Guest editorial: Spaces, logic, and link analysis in IR: Recent advances from a mathematical and logical perspective [J].
Dominich, S ;
Lalmas, M ;
Van Rijsbergen, CJ .
INFORMATION RETRIEVAL, 2005, 8 (02) :175-179
[6]   Test data likelihood for PLSA models [J].
Brants, T .
INFORMATION RETRIEVAL, 2005, 8 (02) :181-196
[7]  
Data Driven Similarity Measures for <Emphasis Type="Italic">k</Emphasis>-Means Like Clustering Algorithms.[J].Jacob Kogan;Marc Teboulle;Charles Nicholas.Information Retrieval.2005, 2
[8]   Introduction to the special issue on INEX [J].
Fuhr, N ;
Lalmas, M .
INFORMATION RETRIEVAL, 2005, 8 (04) :515-519
[9]   Two-stage statistical language models for text database selection [J].
Yang, H ;
Zhang, MJ .
INFORMATION RETRIEVAL, 2006, 9 (01) :5-31
[10]   Combining multiple strategies for effective monolingual and cross-language retrieval [J].
Savoy, J .
INFORMATION RETRIEVAL, 2004, 7 (1-2) :121-148