基于主观Bayes方法的渐进式中文文档分类

被引:5
作者
汪保友
周益群
周水庚
胡运发
机构
[1] 复旦大学计算机科学系
关键词
文档分类; naive Bayes方法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文介绍基于主观Bayes方法的渐进式中文文档分类。包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量,二是采用渐进式中文文档分类,先进行粗分类,把文档集映射到大的类别集中去,再对属于每一大类别中的文档子集进行细分类,映射到次级类别中去,直到划分到最后的基类,三是选择文档属性时,采用相邻字对提取方法,某种程度可摆脱对复杂切词处理程序和庞大词库的依赖。
引用
收藏
页码:470 / 475
页数:6
相关论文
empty
未找到相关数据