学术探索
学术期刊
文章热点
数据分析
智能智评
立即登录
基于改进KNN的文本分类方法
被引:17
作者
:
钱晓东
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学系统工程研究所
钱晓东
王正欧
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学系统工程研究所
王正欧
不详
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学系统工程研究所
不详
机构
:
[1]
天津大学系统工程研究所
[2]
天津大学系统工程研究所 天津
[3]
天津
来源
:
情报科学
|
2005年
/ 04期
关键词
:
文本分类;
特征提取;
自组织神经网络;
向量空间模型;
K最近邻算法;
模式聚合;
D O I
:
暂无
中图分类号
:
TP183 [人工神经网络与计算];
学科分类号
:
摘要
:
本文针对VSM (向量空间模型)中KNN (K最近邻算法)在文本处理环境下的不足,根据SOM (自组织映射神经网络)理论、特征选取和模式聚合理论,提出了一种改进的KNN文本分类方法。应用特征选取和模式聚合理论以降低特征空间维数。传统的VSM模型各维相同的权重并不适应于文本处理的环境,本文提出应用SOM神经网络进行VSM模型各维权重的计算。结合两种改进,有效地降低了向量空间的维数,提高了文本分类的精度和速度。
引用
收藏
页码:550 / 554
页数:5
相关论文
共 3 条
[1]
应用特征聚合进行中文文本分类的改进KNN算法
张晓辉
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
张晓辉
李莹
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
李莹
王华勇
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
王华勇
赵宏
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
赵宏
不详
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
不详
[J].
东北大学学报 ,
2003,
(03)
: 229
-
232
[2]
隐含语义索引及其在中文文本处理中的应用研究
论文数:
引用数:
h-index:
机构:
周水庚
论文数:
引用数:
h-index:
机构:
关佶红
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机系!上海
胡运发
[J].
小型微型计算机系统,
2001,
(02)
: 239
-
243
[3]
时间序列数据挖掘中相似性和趋势预测的研究[D]. 王晓晔.天津大学. 2003
←
1
→
共 3 条
[1]
应用特征聚合进行中文文本分类的改进KNN算法
张晓辉
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
张晓辉
李莹
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
李莹
王华勇
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
王华勇
赵宏
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
赵宏
不详
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
不详
[J].
东北大学学报 ,
2003,
(03)
: 229
-
232
[2]
隐含语义索引及其在中文文本处理中的应用研究
论文数:
引用数:
h-index:
机构:
周水庚
论文数:
引用数:
h-index:
机构:
关佶红
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机系!上海
胡运发
[J].
小型微型计算机系统,
2001,
(02)
: 239
-
243
[3]
时间序列数据挖掘中相似性和趋势预测的研究[D]. 王晓晔.天津大学. 2003
←
1
→