学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
有效的中文微博短文本倾向性分类算法
被引:99
作者
:
论文数:
引用数:
h-index:
机构:
韩忠明
张玉沙
论文数:
0
引用数:
0
h-index:
0
机构:
北京工商大学计算机与信息工程学院
张玉沙
论文数:
引用数:
h-index:
机构:
张慧
万月亮
论文数:
0
引用数:
0
h-index:
0
机构:
北京工商大学计算机与信息工程学院
万月亮
论文数:
引用数:
h-index:
机构:
黄今慧
机构
:
[1]
北京工商大学计算机与信息工程学院
来源
:
计算机应用与软件
|
2012年
/ 29卷
/ 10期
关键词
:
倾向性;
情感;
词典;
自动机;
知网;
支持向量机;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
对具有长度短、结构复杂以及变形词多等特点的短文本倾向性分类进行深入研究,目的是提高倾向性分类的准确性和效率。以HowNet的情感词典为基础,提出一个微博新词发现算法,构建微博情感词典。在对文本进行分句、分词、标注、情感处理等后,构建一个自动机来计算短文本情感倾向性。为了客观评价该方法,选择基于HowNet的分类方法、基于SVM的分类方法进行比较性实验。实验结果表明提出的方法在一般文本分类上与SVM效果类似,在短文本上则具有明显的优势。同时该方法在效率上也具有突出优势。
引用
收藏
页码:89 / 93
页数:5
相关论文
共 8 条
[1]
Exploiting effective features for chinese sentiment classification
[J].
论文数:
引用数:
h-index:
机构:
Zhai, Zhongwu
;
论文数:
引用数:
h-index:
机构:
Xu, Hua
;
Kang, Bada
论文数:
0
引用数:
0
h-index:
0
机构:
Univ So Calif, Viterbi Sch Engn, Los Angeles, CA 90089 USA
Tsinghua Univ, State Key Lab Intelligent Technol & Syst, Tsinghua Natl Lab Informat Sci & Technol, Dept Comp Sci & Technol, Beijing 100084, Peoples R China
Kang, Bada
;
论文数:
引用数:
h-index:
机构:
Jia, Peifa
.
EXPERT SYSTEMS WITH APPLICATIONS,
2011,
38
(08)
:9139
-9146
[2]
基于语义理解的中文博文倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
何凤英
.
计算机应用,
2011,
31
(08)
:2130
-2133+2137
[3]
网络评论倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
丁建立
;
论文数:
引用数:
h-index:
机构:
慈祥
;
黄剑雄
论文数:
0
引用数:
0
h-index:
0
机构:
中国国际航空股份有限公司信息管理部
中国民航大学计算机科学与技术学院
黄剑雄
.
计算机应用,
2010,
30
(11)
:2937
-2940
[4]
新闻报道文本的情感倾向性研究
[J].
论文数:
引用数:
h-index:
机构:
昝红英
;
论文数:
引用数:
h-index:
机构:
郭明
;
论文数:
引用数:
h-index:
机构:
柴玉梅
;
论文数:
引用数:
h-index:
机构:
吴云芳
.
计算机工程,
2010,
36
(15)
:20
-22
[5]
基于情感词典扩展技术的网络舆情倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
杨超
;
论文数:
引用数:
h-index:
机构:
冯时
;
论文数:
引用数:
h-index:
机构:
王大玲
;
论文数:
引用数:
h-index:
机构:
杨楠
;
论文数:
引用数:
h-index:
机构:
于戈
.
小型微型计算机系统,
2010,
31
(04)
:691
-695
[6]
基于支持向量机的文本倾向性分类研究
[J].
论文数:
引用数:
h-index:
机构:
王素格
;
论文数:
引用数:
h-index:
机构:
杨安娜
;
论文数:
引用数:
h-index:
机构:
李德玉
;
论文数:
引用数:
h-index:
机构:
魏英杰
;
论文数:
引用数:
h-index:
机构:
李伟
;
张武
论文数:
0
引用数:
0
h-index:
0
机构:
上海大学计算机工程与科学学院
山西大学数学科学学院
张武
.
中北大学学报(自然科学版),
2008,
(05)
:421
-425
[7]
基于监督学习的中文情感分类技术比较研究
[J].
唐慧丰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
唐慧丰
;
论文数:
引用数:
h-index:
机构:
谭松波
;
论文数:
引用数:
h-index:
机构:
程学旗
.
中文信息学报,
2007,
(06)
:88
-94+108
[8]
基于多重冗余标记CRFs的句子情感分析研究
[J].
王根
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化研究所模式识别国家重点实验室
王根
;
论文数:
引用数:
h-index:
机构:
赵军
.
中文信息学报,
2007,
(05)
:51
-55+86
←
1
→
共 8 条
[1]
Exploiting effective features for chinese sentiment classification
[J].
论文数:
引用数:
h-index:
机构:
Zhai, Zhongwu
;
论文数:
引用数:
h-index:
机构:
Xu, Hua
;
Kang, Bada
论文数:
0
引用数:
0
h-index:
0
机构:
Univ So Calif, Viterbi Sch Engn, Los Angeles, CA 90089 USA
Tsinghua Univ, State Key Lab Intelligent Technol & Syst, Tsinghua Natl Lab Informat Sci & Technol, Dept Comp Sci & Technol, Beijing 100084, Peoples R China
Kang, Bada
;
论文数:
引用数:
h-index:
机构:
Jia, Peifa
.
EXPERT SYSTEMS WITH APPLICATIONS,
2011,
38
(08)
:9139
-9146
[2]
基于语义理解的中文博文倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
何凤英
.
计算机应用,
2011,
31
(08)
:2130
-2133+2137
[3]
网络评论倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
丁建立
;
论文数:
引用数:
h-index:
机构:
慈祥
;
黄剑雄
论文数:
0
引用数:
0
h-index:
0
机构:
中国国际航空股份有限公司信息管理部
中国民航大学计算机科学与技术学院
黄剑雄
.
计算机应用,
2010,
30
(11)
:2937
-2940
[4]
新闻报道文本的情感倾向性研究
[J].
论文数:
引用数:
h-index:
机构:
昝红英
;
论文数:
引用数:
h-index:
机构:
郭明
;
论文数:
引用数:
h-index:
机构:
柴玉梅
;
论文数:
引用数:
h-index:
机构:
吴云芳
.
计算机工程,
2010,
36
(15)
:20
-22
[5]
基于情感词典扩展技术的网络舆情倾向性分析
[J].
论文数:
引用数:
h-index:
机构:
杨超
;
论文数:
引用数:
h-index:
机构:
冯时
;
论文数:
引用数:
h-index:
机构:
王大玲
;
论文数:
引用数:
h-index:
机构:
杨楠
;
论文数:
引用数:
h-index:
机构:
于戈
.
小型微型计算机系统,
2010,
31
(04)
:691
-695
[6]
基于支持向量机的文本倾向性分类研究
[J].
论文数:
引用数:
h-index:
机构:
王素格
;
论文数:
引用数:
h-index:
机构:
杨安娜
;
论文数:
引用数:
h-index:
机构:
李德玉
;
论文数:
引用数:
h-index:
机构:
魏英杰
;
论文数:
引用数:
h-index:
机构:
李伟
;
张武
论文数:
0
引用数:
0
h-index:
0
机构:
上海大学计算机工程与科学学院
山西大学数学科学学院
张武
.
中北大学学报(自然科学版),
2008,
(05)
:421
-425
[7]
基于监督学习的中文情感分类技术比较研究
[J].
唐慧丰
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
唐慧丰
;
论文数:
引用数:
h-index:
机构:
谭松波
;
论文数:
引用数:
h-index:
机构:
程学旗
.
中文信息学报,
2007,
(06)
:88
-94+108
[8]
基于多重冗余标记CRFs的句子情感分析研究
[J].
王根
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化研究所模式识别国家重点实验室
王根
;
论文数:
引用数:
h-index:
机构:
赵军
.
中文信息学报,
2007,
(05)
:51
-55+86
←
1
→