基于概念的文本过滤模型

被引:11
作者
赵丰年
刘林
商建云
机构
[1] 不详
[2] 北京师范大学信息网络中心
[3] 不详
关键词
文本过滤; HowNet; 用户模板;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
当前,文本过滤技术基本上停留在关键词阶段,无法处理同义和概念之间的上下位关系,因此,准确率和召回率达到一定值后,无论如何改进算法也无法再取得突破进展。文章试图从语义的角度突破这个困境,对常识知识库HowNet在文本过滤中的应用,以及文本过滤中所涉及的关键技术,包括基于概念的文本表示方法、用户模板表示方法、文本过滤算法进行了研究和探讨。实验结果表明,基于概念的方法的确可以提高文本过滤的性能。
引用
收藏
页码:186 / 188
页数:3
相关论文
共 3 条
[1]   基于向量空间模型的文本过滤系统 [J].
黄萱菁 ;
夏迎炬 ;
吴立德 .
软件学报, 2003, (03) :435-442
[2]  
自然语言理解[M]. 清华大学出版社 , 姚天顺等编著, 2002
[3]  
An example based mapping method for text categori-zation and retrieval .2 Yang Y,Chute C. ACM Transaction Information Systems . 1994