基于示例的中文文本过滤模型

被引:47
作者
林鸿飞
姚天顺
机构
[1] 大连理工大学计算机科学与工程系!辽宁大连,东北大学计算机科学与工程系!辽宁沈阳
关键词
语义信息/文本过滤; 文本结构分析; 潜在语义索引;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
简要描述了文本过滤的背景 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模板 ,然后进行文本过滤 .在用户反馈的基础上 ,扩充示例文本数量 ,进而采用基于潜在语义标注的文本过滤方法 ,改进用户模板 ,提高过滤效率 .
引用
收藏
页码:375 / 378
页数:4
相关论文
共 2 条
[1]
中文文本中抽取特征信息的区域与技术 [J].
刘开瑛 ;
薛翠芳 ;
郑家恒 ;
周晓强 ;
不详 .
中文信息学报 , 1998, (02)
[2]
基于关系图的篇章分析方法 [J].
韦雄观 ;
吴立德 ;
王文欣 .
模式识别与人工智能, 1997, 10 (02) :112-117