应用于中文文本分类的改进KNN算法

被引：3

作者：

刘慧 ^{[1
]}

杨宏光 ^{[2
]}

机构：

[1] 西南交通大学信息科学与技术学院

[2] 黑龙江省伊春市南岔区人民政府办公室

来源：

今日科苑 | 2010年 / 08期

关键词：

文本分类; KNN; 相似度;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

本文介绍了文本分类的基本流程及涉及到的相关技术,详细介绍了传统KNN方法并分析了它存在的不足之处,在此基础上提出了一种改进的KNN方法,该方法在相似度计算上进行了改进,通过实验证明了改进的KNN方法在宏召回率、宏准确率、宏F1值以及微F1上都有所提高。

引用

页码：54 / 55

页数：2

共 7 条

[1]

K-近邻法的文本分类算法分析与改进 [J].

于一 .

火力与指挥控制, 2008, (04) :143-145

[2]

基于向量空间模型的文本自动分类系统的研究与实现 [J].

庞剑锋 ;

卜东波 ;

白硕 .

计算机应用研究, 2001, (09) :23-26

[3]

基于KNN与自动检索的迭代近邻法在自动分类中的应用.[J].杨建良;王永成;.情报学报.2004, 02

[4]

文本分类及其相关技术研究 [D].

李荣陆 .

复旦大学,

2005

[5]

基于K近邻的分类算法研究 [D].

桑应宾 .

重庆大学,

2009

[6]

中文文本自动分类的研究 [D].

孙丽华 .

哈尔滨工程大学,

2002

[7]

...http://www.ictclas.org/index.html.,

← 1 →