文本分割算法对中文信息过滤影响研究

被引:7
作者
朱寰
阮彤
于庆喜
机构
[1] 中国科学院软件研究所软件工程技术中心
[2] 烟台市公安局信息处 北京
[3] 北京
[4] 烟台
关键词
信息过滤; 特征抽取; 文本分割;
D O I
暂无
中图分类号
TP393.03 [];
学科分类号
081201 ; 1201 ;
摘要
因特网上的信息以前所未有的速度剧烈膨胀,促使对信息过滤的研究成为热点。该本文比较了在基于中文的信息过滤中,不同的文本分割方法、机械分词方法、以及特征抽取阈值对信息过滤的结果的影响,对中文信息过滤使用合适的特征抽取方法提供了指导,得出了使用N元方法可与机械分词方法相比较的结论。
引用
收藏
页码:62 / 65
页数:4
相关论文
共 2 条
[1]  
AMultilevelApproachtoIntelligentInformationFilter-ing:Model,System,andEvaluation. JMostafaetal. ACMTranscationsonInformationSystems . 1997
[2]  
InformationFilteringandInforma-tionRetrieval:TwoSidesofthesameCoin. NicholasJBelkin,WBruceCroft. Communications of the ACM . 1992