基于深度表示学习的多语言文本情感分析

被引:13
作者
余传明 [1 ]
冯博琳 [1 ]
田鑫 [1 ]
安璐 [2 ]
机构
[1] 中南财经政法大学信息与安全工程学院
[2] 武汉大学信息管理学院
关键词
跨语言; 迁移学习; 深度表示学习; 情感分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
迁移学习专注于解决监督学习在小数据集上难以获得好的分类效果的问题,与传统监督学习的基本假设相比,它并不要求训练集和测试集服从相同或相似的数据分布。通过在标注资源丰富的源语言中学习,并将目标语言的文档投影到与源语言相同的特征空间中去,从而解决目标语言因数据量较小而难以获得好的分类模型的问题。选择亚马逊在书籍、DVD和音乐类目下的中文、英文和日文评论作为实验数据,情感分析作为研究任务,提出了一种新的跨语言深度表示学习模型(cross lingual deep representation learning,CLDRL),实现了不同语言环境下的知识迁移。实验结果表明,CLDRL模型在跨语言环境下最优F1值达到了78.59%,证明了该模型的有效性。
引用
收藏
页码:13 / 23
页数:11
相关论文
共 34 条
[1]  
Probabilistic topic modeling in multilingual settings: An overview of its methodology and applications[J] . Ivan Vuli?,Wim De Smet,Jie Tang,Marie-Francine Moens. &nbspInformation Processing and Management . 2015 (1)
[2]   Cross-lingual adaptation using structural correspondence learning [J].
Prettenhofer, Peter ;
Stein, Benno .
ACM Transactions on Intelligent Systems and Technology, 2011, 3 (01)
[3]  
Co-training for cross-lingual sentiment classification. WAN Xiaojun. Processing of the AFNLP . 2009
[4]  
Sentiment Analysis Leveraging Emotions and Word Embeddings. Giatsoglou M,Vozalis M G. Expert Systems With Applications . 2017
[5]  
Indexing by latent semantic analysis. Deerwester S,Dumais ST,Landauer TK,et al. Journal of American Society for Information Science . 1990
[6]  
A training algorithm for optimal margin classifiers. Boser B E,Guyon I M,Vapnik V N. Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory . 1992
[7]  
Learning bilingual sentiment word embeddings for cross-language sentiment classification. Zhou H W,Chen L,Shi F L,et al. Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics . 2015
[8]  
Adversarial deep averaging networks for cross-lingual sentiment classification. CHEN Xilun,SUN Yu,ATHIWARATKUN B. . 2016
[9]  
Deep learning using linear support vector machines. TANG Yichuan. . 2017
[10]   从产品评论中挖掘观点:原理与算法分析 [J].
余传明 .
情报理论与实践, 2009, (07) :124-128