文本结构分析与基于示例的文本过滤

被引:18
作者
林鸿飞
战学刚
姚天顺
机构
[1] 东北大学计算机系!沈阳
关键词
文本过滤; 文本结构分析; 文本层次分析; 用户模版; 段落匹配;
D O I
暂无
中图分类号
TN713 [滤波技术、滤波器];
学科分类号
摘要
本文简要介绍了文本过滤的背景和发展 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用本文提出的文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模版 (user profile) ,然后进行文本过滤 ,同时引进段落匹配机制 ,提高过滤效率 .通过用户反馈 ,改进用户模版
引用
收藏
页码:422 / 425
页数:4
相关论文
共 3 条