中文文本分类系统的设计与实现

被引:3
作者
王俊英
郭景峰
霍峥
机构
[1] 燕山大学信息科学与工程学院
关键词
文本分类; 向量空间模型; 特征项选择; 权重;
D O I
10.19304/j.cnki.issn1000-7180.2006.s1.092
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文章介绍了中文文本分类系统的基本过程及其关键技术,比较和分析Rocchio、朴素贝叶斯(NB)、kNN三种文本分类算法的分类原理,提出了中文文本分类系统的结构模型,并给出了评估方法和实验结果,测试结果表明KNN算法的分类效果最佳。
引用
收藏
页码:262 / 265
页数:4
相关论文
empty
未找到相关数据