基于迁移学习的唐诗宋词情感分析

被引:17
作者
吴斌
吉佳
孟琳
石川
赵惠东
李仪清
机构
[1] 北京邮电大学智能通信软件与多媒体北京市重点实验室
关键词
情感分析; 社会计算学; 唐诗宋词; 迁移学习;
D O I
暂无
中图分类号
I207.2 [诗歌、韵文]; TP391.1 [文字信息处理];
学科分类号
0501 ; 081203 ; 0835 ;
摘要
随着计算社会学的兴起,利用数据挖掘分析社会情感是近期的研究重点.当前的研究主要针对现代文本,对于古代诗歌这类短文本的情感分析相对较少.本文提出了一个基于短文本特征扩展的迁移学习模型CATLPCO,通过分析诗歌情感对当时社会及文化进行进一步了解.该模型首先基于频繁词对对古文特征向量进行扩展,再通过迁移学习方式,建立三个分类器并投票得出最后的情感分析结果.CATL-PCO模型首先能够解决古文短文本特征稀疏的问题,在此基础上进一步解决由于现代译文信息匮乏所导致的古代诗歌情感分析困难问题,从而准确的分析古诗词情感倾向,从计算社会学的角度,增进对中国历史的认识.实验表明,当训练集为中国唐诗时,本文提出方法能够准确的对唐代诗歌进行情感分类,并能应用于唐代和宋代各个时期情感分析及代表流派分析.
引用
收藏
页码:2780 / 2787
页数:8
相关论文
共 3 条
[1]   Multi-aspect sentiment analysis for Chinese online social reviews based on topic modeling and HowNet lexicon [J].
Fu Xianghua ;
Liu Guo ;
Guo Yanyan ;
Wang Zhiqiang .
KNOWLEDGE-BASED SYSTEMS, 2013, 37 :186-195
[2]  
面向微博短文本的情感分析研究.[D].刘楠.武汉大学.2013, 05
[3]   具有协同约束的共生迁移学习算法研究 [J].
张景祥 ;
王士同 ;
邓赵红 ;
李奕 ;
蒋亦樟 .
电子学报, 2014, 42 (03) :556-560