学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于向量投影的KNN文本分类算法
被引:10
作者
:
论文数:
引用数:
h-index:
机构:
卜凡军
钱雪忠
论文数:
0
引用数:
0
h-index:
0
机构:
江南大学信息工程学院
钱雪忠
机构
:
[1]
江南大学信息工程学院
来源
:
计算机工程与设计
|
2009年
/ 30卷
/ 21期
关键词
:
K-近邻;
文本分类;
投影;
效率;
高维;
D O I
:
10.16208/j.issn1000-7024.2009.21.026
中图分类号
:
TP301.6 [算法理论];
学科分类号
:
摘要
:
针对KNN算法分类时间过长的缺点,分析了提高分类效率的方法。在KNN算法基础上,结合向量投影理论以及iDistance索引结构,提出了一种改进的KNN算法——PKNN。该算法通过比较待分类样本和训练样本的一维投影距离,获得最有可能的临近样本点,减小了参与计算的训练样本数,因此可以减少每次分类的计算量。实验结果表明,PKNN算法可以明显提高KNN算法的效率,PKNN算法的原理决定其适合大容量高维文本分类。
引用
收藏
页码:4939 / 4941
页数:3
相关论文
共 6 条
[1]
基于χ2统计量的kNN文本分类算法
印鉴
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学计算机科学系
印鉴
谭焕云
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学计算机科学系
谭焕云
[J].
小型微型计算机系统,
2007,
(06)
: 1094
-
1097
[2]
基于向量投影的支撑向量预选取
论文数:
引用数:
h-index:
机构:
李青
焦李成
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
焦李成
论文数:
引用数:
h-index:
机构:
周伟达
[J].
计算机学报,
2005,
(02)
: 145
-
152
[3]
一种应用向量聚合技术的KNN中文文本分类方法
李莹
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
李莹
张晓辉
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
张晓辉
王华勇
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
王华勇
常桂然
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
常桂然
[J].
小型微型计算机系统,
2004,
(06)
: 993
-
996
[4]
基于隐含语义的kNN文本分类研究
李永平
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
李永平
论文数:
引用数:
h-index:
机构:
程莉
论文数:
引用数:
h-index:
机构:
叶卫国
[J].
计算机工程与应用,
2004,
(06)
: 71
-
73
[5]
数据挖掘原理[M]. - 机械工业出版社 , (英) 汉德 (Hand, 2003
[6]
Array-index:A Plug and Search K Nearest Neighbors Method for High-Dimensional Data .2 Zaher Al Aghbari. Data and Knowledge Engineering . 2005
←
1
→
共 6 条
[1]
基于χ2统计量的kNN文本分类算法
印鉴
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学计算机科学系
印鉴
谭焕云
论文数:
0
引用数:
0
h-index:
0
机构:
中山大学计算机科学系
谭焕云
[J].
小型微型计算机系统,
2007,
(06)
: 1094
-
1097
[2]
基于向量投影的支撑向量预选取
论文数:
引用数:
h-index:
机构:
李青
焦李成
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学智能信息处理研究所
焦李成
论文数:
引用数:
h-index:
机构:
周伟达
[J].
计算机学报,
2005,
(02)
: 145
-
152
[3]
一种应用向量聚合技术的KNN中文文本分类方法
李莹
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
李莹
张晓辉
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
张晓辉
王华勇
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
王华勇
常桂然
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算中心
常桂然
[J].
小型微型计算机系统,
2004,
(06)
: 993
-
996
[4]
基于隐含语义的kNN文本分类研究
李永平
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
李永平
论文数:
引用数:
h-index:
机构:
程莉
论文数:
引用数:
h-index:
机构:
叶卫国
[J].
计算机工程与应用,
2004,
(06)
: 71
-
73
[5]
数据挖掘原理[M]. - 机械工业出版社 , (英) 汉德 (Hand, 2003
[6]
Array-index:A Plug and Search K Nearest Neighbors Method for High-Dimensional Data .2 Zaher Al Aghbari. Data and Knowledge Engineering . 2005
←
1
→