一种改进的kNN方法及其在文本分类中的应用

被引:37
作者
孙丽华
张积东
李静梅
机构
[1] 哈尔滨工程大学计算机科学与技术学院
关键词
kNN; 属性关联; 改进kNN; 文本分类;
D O I
暂无
中图分类号
TP393.03 [];
学科分类号
摘要
介绍了基于kNN的文本分类方法 ,分析了kNN方法实质 ,指出了该方法的不足 ,然后提出了一种改进方法。改进方法是基于文本属性关联和概念共现等基础上提出来的。它实质上是强化了文本中语义链属性因子的作用 ,修正了次要因素的噪声影响 ,使文本分类结果更加理想 ,已有的测试结果证明了这一点 ,尤其在测试文本与训练文本集中的某些文本直观上较相似时 ,结果更佳
引用
收藏
页码:25 / 27
页数:3
相关论文
共 6 条
[1]   独立于语种的文本分类方法 [J].
黄萱菁 ;
吴立德 ;
石崎洋之 ;
徐国伟 .
中文信息学报, 2000, (06) :1-7
[2]   文档中词语权重计算方法的改进 [J].
鲁松 ;
李晓黎 ;
白硕 ;
王实 .
中文信息学报, 2000, (06) :8-13+20
[3]   汉语文本特征词的抽取方法 [J].
薛翠芳 ;
郭炳炎 .
情报学报, 2000, (03) :242-247
[4]   增强型朴素贝叶斯学习 [J].
王实 ;
高文 .
计算机科学, 2000, (04) :46-49
[5]   文本分类中基于对数似然比测试的特征词选择方法 [J].
李国臣 .
中文信息学报, 1999, (04) :17-22
[6]   中文文本的关键词自动抽取和模糊分类 [J].
何新贵 ;
彭甫阳 .
中文信息学报, 1999, (01) :10-16