无需词典支持和切词处理的中文文档分类

被引:1
作者
周水庚
关佶红
胡运发
机构
[1] 复旦大学计算机系!上海
[2] 武汉测绘科技大学信息学院!武汉
关键词
中文文档分类; N-gram信息; 属性选择; 贝叶斯分类; kNN法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
利用中文文本的N gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖。实验结果表明 ,该方法能够取得令人满意的分类效果
引用
收藏
页码:31 / 35
页数:5
相关论文
共 1 条
[1]   汉语语料的自动分类 [J].
吴军,王作英,禹锋,王侠 .
中文信息学报, 1995, (04) :25-32