基于聚类的文本过滤模型

被引:8
作者
林鸿飞
马雅彬
机构
[1] 大连理工大学计算机系
[2] 内蒙古民族大学外语系 辽宁大连
[3] 内蒙古通辽
关键词
语言处理; 聚类分析/文本过滤; 用户模板; 查询扩张;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了帮助用户在因特网上搜索感兴趣的在线文本 ,提出了基于聚类的文本过滤模型 .其基本思想是 :在预定的层次目录之下 ,根据用户给出的过滤模板进行动态扩张 ,以便于全面地反映用户信息需求 .然后 ,通过对扩张模板的聚类分析 ,使得每一类由表达相同或相近兴趣的用户模板组成 .匹配时 ,先将文本推送到相应的模板类中 ,再计算与具体模板的相似度 ,获得最终的匹配结果 ,以提高过滤效率
引用
收藏
页码:249 / 252
页数:4
相关论文
empty
未找到相关数据