基于深度学习的领域情感词典自动构建——以金融领域为例

被引:24
作者
胡家珩 [1 ]
岑咏华 [1 ]
吴承尧 [2 ]
机构
[1] 南京理工大学经济管理学院
[2] 南京农业大学金融学院
关键词
情感词典; 深度学习; 金融领域; 词向量; 神经网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
【目的】为特定领域情感分析任务构建一个适用的情感词典。【方法】以金融领域为例,结合语料库和知识库的特点,提出一种全新的构建情感词典的方法:利用词向量方法将文本信息映射到向量空间,借助已有的通用情感词典,自动标引训练语料,按照9:1的比例构建训练集和预测集。使用Python构建深度神经网络分类器,判断特定领域候选情感词的情感极性,构成情感词典。【结果】本文构建的神经网络分类器的训练集准确度为95.02%,预测集准确度为95.00%,同时证明了利用本文方法所构建的情感词典在金融领域中的表现优于其他已有方法。【局限】抽取种子词的方法需要进一步优化。【结论】本文方法解决了训练神经网络分类器中训练语料不足的问题,同时解决了词向量的语义相关性无法区分情感信息的问题。在构建面向特定领域情感词典上具有较好的表现,为该领域其他研究提供参考依据。
引用
收藏
页码:95 / 102
页数:8
相关论文
共 12 条
[1]   基于词向量的跨领域中文情感词典构建方法 [J].
冯超 ;
梁循 ;
李亚平 ;
周小平 ;
李晓菲 .
数据采集与处理, 2017, 32 (03) :579-587
[2]   基于Word2Vec的情感词典自动构建与优化 [J].
杨小平 ;
张中夏 ;
王良 ;
张永俊 ;
马奇凤 ;
吴佳楠 ;
张悦 .
计算机科学, 2017, 44 (01) :42-47+74
[3]   基于关联规则挖掘和极性分析的商品评论情感词典构建 [J].
钟敏娟 ;
万常选 ;
刘德喜 .
情报学报, 2016, (05) :501-509
[4]   情感词典自动构建方法综述 [J].
王科 ;
夏睿 .
自动化学报, 2016, 42 (04) :495-511
[5]  
利用复杂网络为自由评论鉴定词汇情感倾向性[J]. 殷春霞,彭勤科.自动化学报. 2012(03)
[6]   中文基础情感词词典构建方法研究 [J].
柳位平 ;
朱艳辉 ;
栗春亮 ;
向华政 ;
文志强 .
计算机应用, 2009, 29 (10) :2875-2877
[7]   Sentiment analysis on social media for stock movement prediction [J].
Thien Hai Nguyen ;
Shirai, Kiyoaki ;
Velcin, Julien .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (24) :9603-9611
[8]   Word Polarity Disambiguation Using Bayesian Model and Opinion-Level Features [J].
Xia, Yunqing ;
Cambria, Erik ;
Hussain, Amir ;
Zhao, Huan .
COGNITIVE COMPUTATION, 2015, 7 (03) :369-380
[9]  
Stream-based active learning for sentiment analysis in the financial domain[J] . Jasmina Smailovi?,Miha Gr?ar,Nada Lavra?,Martin ?nidar?i?.Information Sciences . 2014
[10]  
News impact on stock price return via sentiment analysis[J] . Xiaodong Li,Haoran Xie,Li Chen,Jianping Wang,Xiaotie Deng.Knowledge-Based Systems . 2014