文本特征区域与文本过滤的匹配机制

被引:3
作者
林鸿飞
战学刚
姚天顺
不详
机构
[1] 东北大学计算机系!ics@ramm.neu.edu.cn沈阳E-mail:hflin@ics.cs.neu.edu.cn
[2] 东北大学计算机系!ics@ramm.neu.edu.cn沈阳E-mail:hflin@ics.cs.neu
关键词
文本过滤; 用户模板; 概念扩充; 文本特征; 向量空间模型;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
为了根据用户的信息需求,在因特网上搜索相关文本,该文提出了一种文本过滤的匹配机制,其基本思想是:利用基于词典的概念扩张方法,改进用户模板。计算扩张的用户模板与文本的全局相似度,获取初步的过滤结果;在文本特征区域,进行标题、摘要段、首段和尾段等片断的局部相似度计算,以综合评价文本与用户模板的匹配情况。该方法可操作性强,效果明显。
引用
收藏
页码:7 / 9
页数:3
相关论文
共 2 条
[1]   中文文本中抽取特征信息的区域与技术 [J].
刘开瑛 ;
薛翠芳 ;
郑家恒 ;
周晓强 ;
不详 .
中文信息学报 , 1998, (02) :2-8
[2]  
自然语言理解[M]. 清华大学出版社 , 姚天顺等编著, 2002