应用于中文文本分类的改进KNN算法

被引:3
作者
刘慧 [1 ]
杨宏光 [2 ]
机构
[1] 西南交通大学信息科学与技术学院
[2] 黑龙江省伊春市南岔区人民政府办公室
关键词
文本分类; KNN; 相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
本文介绍了文本分类的基本流程及涉及到的相关技术,详细介绍了传统KNN方法并分析了它存在的不足之处,在此基础上提出了一种改进的KNN方法,该方法在相似度计算上进行了改进,通过实验证明了改进的KNN方法在宏召回率、宏准确率、宏F1值以及微F1上都有所提高。
引用
收藏
页码:54 / 55
页数:2
相关论文
共 7 条
[1]
K-近邻法的文本分类算法分析与改进 [J].
于一 .
火力与指挥控制, 2008, (04) :143-145
[2]
基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[3]
基于KNN与自动检索的迭代近邻法在自动分类中的应用.[J].杨建良;王永成;.情报学报.2004, 02
[4]
文本分类及其相关技术研究 [D]. 
李荣陆 .
复旦大学,
2005
[5]
基于K近邻的分类算法研究 [D]. 
桑应宾 .
重庆大学,
2009
[6]
中文文本自动分类的研究 [D]. 
孙丽华 .
哈尔滨工程大学,
2002
[7]
...http://www.ictclas.org/index.html.,