文本分类系统SECTCS中若干技术问题的探讨

被引:3
作者
唐焕玲
付克明
鲁明羽
不详
机构
[1] 烟台职业学院计算机专业教研室
[2] 烟台大学光电信息学院
[3] 烟台大学计算机学院 烟台
[4] 清华大学计算机科学与技术系
[5] 北京
[6] 烟台
[7] 烟台
[8] 北京
关键词
文本分类; VSM; KNN; NaveBayes分类器;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
SECTCS是笔者在深入研究各种文本分类方法的基础上实现的一个中英文文本分类系统。它集成了质心分类、K近邻分类和朴素贝叶斯分类器等多种文本分类方法,在大规模文本分类实验中表现出良好的性能。该文结合以该系统作为测试平台所得到的各种实验结果,对系统中涉及的若干重要技术问题进行探讨和分析,力图得到一些有价值的结论,希望能够对相关研究工作提供可借鉴的依据。
引用
收藏
页码:80 / 83
页数:4
相关论文
共 2 条
[1]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[2]  
高等数理统计[M]. 高等教育出版社 , 茆诗松, 2006