基于词典与机器学习的中文微博情感分析研究

被引:48
作者
孙建旺
吕学强
张雷瀚
机构
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
基金
北京市自然科学基金;
关键词
微博; 表情符号; 极性值; 位置权重; 情感分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
随着Web2.0时代的兴起,与微博相关的研究得到学术界和工业界的广泛关注。选取微博文本中的动词和形容词作为特征;提出基于层次结构的特征降维方法;采用设计的基于表情符号的方法计算特征极性值;在此基础上,提出基于特征极性值的位置权重计算方法,借助SVM作为机器学习模型将微博文本分为正面、负面和中性三类。实验结果表明,提出的方法能够比较有效地对中文微博文本进行情感分类。
引用
收藏
页码:177 / 181
页数:5
相关论文
共 7 条
  • [1] 一种基于极性词典的情感分析方法[J].张成功,刘培玉,朱振方,方明. 山东大学学报(理学版).2012(03)
  • [2] 基于层次结构的多策略中文微博情感分析和特征抽取[J].谢丽星,周明,孙茂松. 中文信息学报.2012(01)
  • [3] 基于机器学习的中文微博情感分类实证研究[J].刘志明,刘鲁. 计算机工程与应用.2012(01)
  • [4] 对层次聚类算法的改进[J].段明秀,杨路明. 湖南理工学院学报(自然科学版).2008(02)
  • [5] 程度副词的特点范围与分类[J].蔺璜,郭姝慧. 山西大学学报(哲学社会科学版).2003(02)
  • [6] 现代汉语否定副词研究[D].郝雷红.首都师范大学.2003
  • [7] Useofnegationphrasesinautomaticsentimentclassificationofproductreviews[J].Jin-CheonNa,ChristopherKhoo,PaulHorngJyhWu. LibraryCollections,AcquisitionsandTechnicalServices.2005(2)