学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
两种分类方法特征选择的比较
被引:1
作者
:
论文数:
引用数:
h-index:
机构:
王晓微
机构
:
[1]
燕山大学信息科学与工程学院
来源
:
电子技术
|
2007年
/ Z3期
关键词
:
文本分类;
特征选择;
支持向量机;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
由于网络的发展,中文文本的分类技术也有待提高。向量空间模型是中文文本分类中常用的模型,词作为中文文本的特征,其维数很高,如此高的维数对分类并不是都有用的。所以对特征的选择尤为重要,文章通过两种分类器对多种特征选择方法在同一平面内进行比较,将分类器的各种参数设为最优状态,得到了IG的分类效果较好,并且利用了平均查全率对不同的特征选择方法进行纵向与横向的比较,实验证明,SVM整体的分类效果要优于KNN的分类效果。
引用
收藏
页码:132 / 134
页数:3
相关论文
共 2 条
[1]
基于SVM的多类文本分类研究
[J].
张爱丽
论文数:
0
引用数:
0
h-index:
0
机构:
中国农业大学,中国农业大学,石家庄陆军指挥学院
张爱丽
;
论文数:
引用数:
h-index:
机构:
刘广利
;
刘长宇
论文数:
0
引用数:
0
h-index:
0
机构:
中国农业大学,中国农业大学,石家庄陆军指挥学院
刘长宇
.
情报杂志,
2004,
(09)
:6
-7+10
[2]
基于文本的分类方法研究
[J].
论文数:
引用数:
h-index:
机构:
陈鑫
.
电脑开发与应用,
2003,
(07)
:4
-5
←
1
→
共 2 条
[1]
基于SVM的多类文本分类研究
[J].
张爱丽
论文数:
0
引用数:
0
h-index:
0
机构:
中国农业大学,中国农业大学,石家庄陆军指挥学院
张爱丽
;
论文数:
引用数:
h-index:
机构:
刘广利
;
刘长宇
论文数:
0
引用数:
0
h-index:
0
机构:
中国农业大学,中国农业大学,石家庄陆军指挥学院
刘长宇
.
情报杂志,
2004,
(09)
:6
-7+10
[2]
基于文本的分类方法研究
[J].
论文数:
引用数:
h-index:
机构:
陈鑫
.
电脑开发与应用,
2003,
(07)
:4
-5
←
1
→