学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种改进的特征权重算法
被引:20
作者
:
论文数:
引用数:
h-index:
机构:
张瑜
论文数:
引用数:
h-index:
机构:
张德贤
机构
:
[1]
河南工业大学信息科学与工程学院
来源
:
计算机工程
|
2011年
/ 37卷
/ 05期
关键词
:
文本分类;
特征权重;
类间偏斜度;
类内离散度;
权重调整因子;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
特征权重算法对文本分类系统的精确度有很大影响,传统的TFIDF算法未能考虑特征项在类间和类内的分布情况。为此,在对传统算法和相关改进算法进行分析的基础上,引入类间偏斜度、类内离散度和权重调整因子的改进思路,提出一种基于WA-DI-SI的特征权重改进算法,分别采用支持向量机和朴素贝叶斯2种分类算法进行测试。测试结果表明,与其他改进算法相比,该算法能够获得更好的分类效果。
引用
收藏
页码:210 / 212
页数:3
相关论文
共 6 条
[1]
TFIDF算法研究综述
[J].
施聪莺
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学教育技术系
施聪莺
;
论文数:
引用数:
h-index:
机构:
徐朝军
;
论文数:
引用数:
h-index:
机构:
杨晓江
.
计算机应用,
2009,
29(S1)
(S1)
:167
-170+180
[2]
基于反馈信息的特征权重调整方法
[J].
李艳玲
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学自动化学院
第二炮兵工程学院
西北工业大学自动化学院
李艳玲
;
戴冠中
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学自动化学院
西北工业大学自动化学院
戴冠中
;
余梅
论文数:
0
引用数:
0
h-index:
0
机构:
二炮装备研究院
西北工业大学自动化学院
余梅
.
计算机工程,
2009,
35
(02)
:206
-207+229
[3]
文本分类中特征权重算法的改进
[J].
论文数:
引用数:
h-index:
机构:
沈志斌
;
白清源
论文数:
0
引用数:
0
h-index:
0
机构:
福州大学数学与计算机科学学院
白清源
.
南京师范大学学报(工程技术版),
2008,
(04)
:95
-98+149
[4]
基于文本分类TFIDF方法的改进与应用
[J].
张玉芳
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
重庆大学计算机学院
张玉芳
;
论文数:
引用数:
h-index:
机构:
彭时名
;
论文数:
引用数:
h-index:
机构:
吕佳
.
计算机工程,
2006,
(19)
:76
-78
[5]
文本自动分类中特征权重算法的改进研究
[J].
徐凤亚
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算语言学研究室
徐凤亚
;
罗振声
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算语言学研究室
罗振声
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算语言学研究室
不详
.
计算机工程与应用 ,
2005,
(01)
:181
-184+220
[6]
中文文本分类语料库-TanCorpV1.0 .2 谭松波,王月粉. http://www.searchforum.org.cn/tansongbo/corpus1.php . 2006
←
1
→
共 6 条
[1]
TFIDF算法研究综述
[J].
施聪莺
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学教育技术系
施聪莺
;
论文数:
引用数:
h-index:
机构:
徐朝军
;
论文数:
引用数:
h-index:
机构:
杨晓江
.
计算机应用,
2009,
29(S1)
(S1)
:167
-170+180
[2]
基于反馈信息的特征权重调整方法
[J].
李艳玲
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学自动化学院
第二炮兵工程学院
西北工业大学自动化学院
李艳玲
;
戴冠中
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学自动化学院
西北工业大学自动化学院
戴冠中
;
余梅
论文数:
0
引用数:
0
h-index:
0
机构:
二炮装备研究院
西北工业大学自动化学院
余梅
.
计算机工程,
2009,
35
(02)
:206
-207+229
[3]
文本分类中特征权重算法的改进
[J].
论文数:
引用数:
h-index:
机构:
沈志斌
;
白清源
论文数:
0
引用数:
0
h-index:
0
机构:
福州大学数学与计算机科学学院
白清源
.
南京师范大学学报(工程技术版),
2008,
(04)
:95
-98+149
[4]
基于文本分类TFIDF方法的改进与应用
[J].
张玉芳
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
重庆大学计算机学院
张玉芳
;
论文数:
引用数:
h-index:
机构:
彭时名
;
论文数:
引用数:
h-index:
机构:
吕佳
.
计算机工程,
2006,
(19)
:76
-78
[5]
文本自动分类中特征权重算法的改进研究
[J].
徐凤亚
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算语言学研究室
徐凤亚
;
罗振声
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算语言学研究室
罗振声
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算语言学研究室
不详
.
计算机工程与应用 ,
2005,
(01)
:181
-184+220
[6]
中文文本分类语料库-TanCorpV1.0 .2 谭松波,王月粉. http://www.searchforum.org.cn/tansongbo/corpus1.php . 2006
←
1
→