学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种基于增量学习型矢量量化的有效文本分类算法
被引:13
作者
:
王修君
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系
王修君
沈鸿
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系
沈鸿
机构
:
[1]
中国科学技术大学计算机科学与技术系
来源
:
计算机学报
|
2007年
/ 08期
关键词
:
学习型矢量量化(LVQ);
生长型神经气(GNG);
学习误差;
类间距离;
学习概率;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种新的增量学习型矢量量化方法,并将其应用到文本分类中.文中提出的算法对所有的训练样本有选择性地进行一次训练就可以生成有效的代表样本集,具有较强的学习能力.实验结果表明:这种方法不仅可以降低KNN方法的测试时间,而且可以保持甚至提高分类的准确性.
引用
收藏
页码:1277 / 1285
页数:9
相关论文
共 3 条
[1]
一种改进的快速k-近邻分类算法
[J].
乔玉龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学自动化测试与控制系
乔玉龙
;
潘正祥
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学自动化测试与控制系
潘正祥
;
孙圣和
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学自动化测试与控制系
孙圣和
.
电子学报,
2005,
(06)
:1146
-1149
[2]
基于密度的kNN文本分类器训练样本裁剪方法
[J].
论文数:
引用数:
h-index:
机构:
李荣陆
;
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系,复旦大学计算机与信息技术系上海,上海
胡运发
.
计算机研究与发展,
2004,
(04)
:539
-545
[3]
矩阵计算.[M].[美]G·H·戈卢布;C·F·范洛恩 著;袁亚湘等 译.科学出版社.2001,
←
1
→
共 3 条
[1]
一种改进的快速k-近邻分类算法
[J].
乔玉龙
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学自动化测试与控制系
乔玉龙
;
潘正祥
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学自动化测试与控制系
潘正祥
;
孙圣和
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学自动化测试与控制系
孙圣和
.
电子学报,
2005,
(06)
:1146
-1149
[2]
基于密度的kNN文本分类器训练样本裁剪方法
[J].
论文数:
引用数:
h-index:
机构:
李荣陆
;
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系,复旦大学计算机与信息技术系上海,上海
胡运发
.
计算机研究与发展,
2004,
(04)
:539
-545
[3]
矩阵计算.[M].[美]G·H·戈卢布;C·F·范洛恩 著;袁亚湘等 译.科学出版社.2001,
←
1
→