共 2 条
一个无需词典支持和切词处理的中文文档分类系统
被引:22
作者:
周水庚
关佶红
胡运发
周傲英
机构:
[1] 武汉大学软件工程国家重点实验室!武汉
[2] 武汉大学计算机学院!武汉
[3] 复旦大学计算机科学与工程系!上海
来源:
基金:
中国博士后科学基金;
关键词:
中文文档分类;
N-gram信息;
属性选择;
Bayes分类;
kNN法;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
报道了一个无需词典支持和切词处理的中文文档分类系统 .其特点是利用 N - gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现了中文文档分类的领域无关性和时间无关性 ;采用开放的体系结构使文档分类系统易于功能扩充和性能完善 .测试结果表明该系统具有令人满意的分类性能 .
引用
收藏
页码:839 / 844
页数:6
相关论文