学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于扩展的情感词典和卡方模型的中文情感特征选择方法
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
胡思才
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
孙界平
[
1
]
琚生根
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
四川大学计算机学院
琚生根
[
1
]
论文数:
引用数:
h-index:
机构:
王霞
[
1
]
论文数:
引用数:
h-index:
机构:
龙彬
[
1
,
3
]
廖强
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
廖强
[
4
]
机构
:
[1]
四川大学计算机学院
[2]
解放军部队
[3]
四川大学外国语学院
来源
:
四川大学学报(自然科学版)
|
2019年
/ 56卷
/ 01期
关键词
:
情感词典;
卡方模型;
特征选择;
知网;
否定词;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
根据经典的特征选择方法在中文情感评论文本中应用的缺陷和不足,提出了一种改进的中文情感特征选择方法.目前,现有的情感特征选择方法普遍只利用了特征项在褒贬类中的统计信息,忽略了情感极性值对特征选择的影响;同时情感文本中否定词会带来特征项情感极性反转的情况,为特征选择带来较大的负面影响.针对这些问题,首先对情感文本中的否定词进行了检测和判定,对否定词界定范围内的情感特征词进行反义变换处理,有效的解决了情感文本中极性反转的问题.同时还将特征项的情感极性值和其在类中的频率特点两个因素融入到卡方特征选择模型(CHI)中,从而提升了卡方模型在文本情感特征选择的效果.实验结果表明,本文算法较其他算法在多个领域数据集上的情感分类准确率提高了1.5%左右.
引用
收藏
页码:37 / 44
页数:8
相关论文
共 12 条
[1]
基于情感词典方法的情感倾向性分析
[J].
杨奎
论文数:
0
引用数:
0
h-index:
0
机构:
南华大学计算机科学与技术学院
杨奎
;
段琼瑾
论文数:
0
引用数:
0
h-index:
0
机构:
南华大学计算机科学与技术学院
段琼瑾
.
计算机时代,
2017,
(03)
:10
-13
[2]
基于特征选择技术的情感词权重计算
[J].
论文数:
引用数:
h-index:
机构:
吴金源
;
论文数:
引用数:
h-index:
机构:
冀俊忠
;
论文数:
引用数:
h-index:
机构:
赵学武
;
吴晨生
论文数:
0
引用数:
0
h-index:
0
机构:
北京市科学技术情报研究所
北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
吴晨生
;
论文数:
引用数:
h-index:
机构:
杜芳华
.
北京工业大学学报,
2016,
42
(01)
:142
-151
[3]
基于情感字典与连词结合的中文文本情感分类
[J].
论文数:
引用数:
h-index:
机构:
刘玉娇
;
琚生根
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
琚生根
;
论文数:
引用数:
h-index:
机构:
伍少梅
;
论文数:
引用数:
h-index:
机构:
苏翀
.
四川大学学报(自然科学版),
2015,
52
(01)
:57
-62
[4]
一种基于HowNet的词语语义相似度计算方法
[J].
论文数:
引用数:
h-index:
机构:
范弘屹
;
论文数:
引用数:
h-index:
机构:
张仰森
.
北京信息科技大学学报(自然科学版),
2014,
29
(04)
:42
-45
[5]
基于词频信息的改进信息增益文本特征选择算法
[J].
论文数:
引用数:
h-index:
机构:
石慧
;
论文数:
引用数:
h-index:
机构:
贾代平
;
论文数:
引用数:
h-index:
机构:
苗培
.
计算机应用,
2014,
34
(11)
:3279
-3282
[6]
基于扩展情感词典及特征加权的情感挖掘方法
[J].
徐晓丹
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
徐晓丹
;
段正杰
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
段正杰
;
陈中育
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
陈中育
.
山东大学学报(工学版),
2014,
44
(06)
:15
-18+69
[7]
基于扩展情感词典及特征加权的情感挖掘方法
[J].
徐晓丹
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
徐晓丹
;
段正杰
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
段正杰
;
陈中育
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
陈中育
.
山东大学学报(工学版),
2014,
44
(06)
:15
-18+69
[8]
Sentiment classification and polarity shifting. S.Li,S.Y.M.Lee,Y.Chen,C.Huang,G.Zhou. International Conference on Computational Linguistics . 2010
[9]
基于双层HHMM的产品评论特征和情感分类
[J].
张磊
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
张磊
;
李梦诗
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
李梦诗
;
陈黎
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
陈黎
;
黎红友
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
黎红友
;
论文数:
引用数:
h-index:
机构:
李志蜀
;
论文数:
引用数:
h-index:
机构:
彭舰
.
四川大学学报(工程科学版),
2013,
45
(02)
:94
-102
[10]
基于HowNet和PMI的词语情感极性计算
[J].
论文数:
引用数:
h-index:
机构:
王振宇
;
论文数:
引用数:
h-index:
机构:
吴泽衡
;
论文数:
引用数:
h-index:
机构:
胡方涛
.
计算机工程,
2012,
38
(15)
:187
-189+193
←
1
2
→
共 12 条
[1]
基于情感词典方法的情感倾向性分析
[J].
杨奎
论文数:
0
引用数:
0
h-index:
0
机构:
南华大学计算机科学与技术学院
杨奎
;
段琼瑾
论文数:
0
引用数:
0
h-index:
0
机构:
南华大学计算机科学与技术学院
段琼瑾
.
计算机时代,
2017,
(03)
:10
-13
[2]
基于特征选择技术的情感词权重计算
[J].
论文数:
引用数:
h-index:
机构:
吴金源
;
论文数:
引用数:
h-index:
机构:
冀俊忠
;
论文数:
引用数:
h-index:
机构:
赵学武
;
吴晨生
论文数:
0
引用数:
0
h-index:
0
机构:
北京市科学技术情报研究所
北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
吴晨生
;
论文数:
引用数:
h-index:
机构:
杜芳华
.
北京工业大学学报,
2016,
42
(01)
:142
-151
[3]
基于情感字典与连词结合的中文文本情感分类
[J].
论文数:
引用数:
h-index:
机构:
刘玉娇
;
琚生根
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
琚生根
;
论文数:
引用数:
h-index:
机构:
伍少梅
;
论文数:
引用数:
h-index:
机构:
苏翀
.
四川大学学报(自然科学版),
2015,
52
(01)
:57
-62
[4]
一种基于HowNet的词语语义相似度计算方法
[J].
论文数:
引用数:
h-index:
机构:
范弘屹
;
论文数:
引用数:
h-index:
机构:
张仰森
.
北京信息科技大学学报(自然科学版),
2014,
29
(04)
:42
-45
[5]
基于词频信息的改进信息增益文本特征选择算法
[J].
论文数:
引用数:
h-index:
机构:
石慧
;
论文数:
引用数:
h-index:
机构:
贾代平
;
论文数:
引用数:
h-index:
机构:
苗培
.
计算机应用,
2014,
34
(11)
:3279
-3282
[6]
基于扩展情感词典及特征加权的情感挖掘方法
[J].
徐晓丹
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
徐晓丹
;
段正杰
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
段正杰
;
陈中育
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
陈中育
.
山东大学学报(工学版),
2014,
44
(06)
:15
-18+69
[7]
基于扩展情感词典及特征加权的情感挖掘方法
[J].
徐晓丹
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
徐晓丹
;
段正杰
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
段正杰
;
陈中育
论文数:
0
引用数:
0
h-index:
0
机构:
浙江师范大学数理与信息工程学院
陈中育
.
山东大学学报(工学版),
2014,
44
(06)
:15
-18+69
[8]
Sentiment classification and polarity shifting. S.Li,S.Y.M.Lee,Y.Chen,C.Huang,G.Zhou. International Conference on Computational Linguistics . 2010
[9]
基于双层HHMM的产品评论特征和情感分类
[J].
张磊
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
张磊
;
李梦诗
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
李梦诗
;
陈黎
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
陈黎
;
黎红友
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
黎红友
;
论文数:
引用数:
h-index:
机构:
李志蜀
;
论文数:
引用数:
h-index:
机构:
彭舰
.
四川大学学报(工程科学版),
2013,
45
(02)
:94
-102
[10]
基于HowNet和PMI的词语情感极性计算
[J].
论文数:
引用数:
h-index:
机构:
王振宇
;
论文数:
引用数:
h-index:
机构:
吴泽衡
;
论文数:
引用数:
h-index:
机构:
胡方涛
.
计算机工程,
2012,
38
(15)
:187
-189+193
←
1
2
→