一种基于特征抽取的文档信息过滤算法研究

被引:3
作者
杨陟卓
韩燮
机构
[1] 中北大学电子与计算机科学技术学院
关键词
信息检索; 信息过滤; 文本特征抽取; TF-IDF;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对传统TF-IDF在文本过滤时存在的缺点,提出一种基于特征词抽取的文本过滤算法。简要分析文档信息过滤原理和流程,重点讨论文档信息过滤算法设计及技术实现。实验结果表明,所提出的算法可有效对文档信息进行过滤,能够提高信息检索质量。
引用
收藏
页码:29 / 34
页数:6
相关论文
共 3 条
[1]   中文文献主题的自动标引 [J].
王永成 ;
顾晓明 ;
王丽霞 .
情报学报, 1998, (03) :60-66
[2]  
文本过滤中的特征抽取应用研究[J]. 张玉叶,李连,刘海见,王春歆.海军航空工程学院学报. 2005 (01)
[3]   Learning algorithms for keyphrase extraction [J].
Turney P.D. .
Information Retrieval, 2000, 2 (4) :303-336