基于分类和关键词组抽取的信息检索算法

被引:10
作者
钟敏娟
林亚平
陈治平
机构
[1] 湖南大学计算机与通信学院
关键词
向量空间模型; 文本分类; 关键词组抽取; 查准率; 排序误差率;
D O I
10.16182/j.cnki.joss.2004.05.039
中图分类号
TP391.3 [检索机];
学科分类号
摘要
本文提出一种基于分类和关键词组抽取的信息检索算法。该算法利用文本分类和信息抽取技术辅助检索,避免了向量空间模型算法中时间复杂度过大,查准率不高的缺点。针对传统的信息检索性能指标无法有效地衡量检索结果的排序状况,本文还引入了排序误差率概念用于评价检索结果的排序。实验结果表明,所提算法与TFIDF算法、基于分类的交互式检索算法相比,具有更快的查询速度,更高的查准率和更小的排序误差率。
引用
收藏
页码:1009 / 1012+1016 +1016
页数:5
相关论文
共 2 条
[1]   一个面向Internet的个性化信息检索系统模型 [J].
韩立新 ;
陈贵海 ;
谢立 .
电子学报, 2002, (02) :240-244
[2]   Web信息检索研究进展 [J].
王继成 ;
萧嵘 ;
孙正兴 ;
张福炎 .
计算机研究与发展, 2001, (02) :187-193