面向迁移学习的文本特征对齐算法

被引:7
作者
魏晓聪 [1 ,2 ]
林鸿飞 [1 ]
机构
[1] 大连理工大学计算机科学与技术学院
[2] 大连外国语大学软件学院
关键词
迁移学习; 特征对齐; 情感分析; 源领域; 目标领域;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
源领域和目标领域特征空间的不一致导致迁移学习准确率下降。为此,提出一种基于Word2Vec的不同领域特征对齐算法。只选取形容词、副词、名词、动词作为特征,针对每种词性,选择源领域和目标领域的枢纽特征,分别在源领域和目标领域为该枢纽特征计算出与之语义相似度最大的非枢纽特征,将其作为相似枢纽特征,从而为每个枢纽特征构成一个相似枢纽特征对。将出现在这些领域中的每一个相似枢纽特征按照枢纽特征对进行特征替换,从而将不同领域语义相似的特征进行对齐,并在特征替换后的源领域和目标领域数据上进行机器学习。实验结果表明,该算法的平均分类精度达到88.2%,高于Baseline算法。
引用
收藏
页码:215 / 219+226 +226
页数:6
相关论文
共 3 条
[1]   基于特征变换的跨领域产品评论倾向性分析 [J].
孟佳娜 ;
段晓东 ;
杨亮 .
计算机工程, 2013, 39 (10) :167-171
[2]  
Cross-Domain Sentiment Classification via Topical Correspondence Transfer[J] . Guangyou Zhou,Yan Zhou,Xiyue Guo,Xinhui Tu,Tingting He.Neurocomputing . 2014
[3]  
Domain adaptation for large-scalesentiment classification: A deep learning approach .2 Glorot Xavier,Bordes Antoine,Bengio Yoshua. Proceedings of the28thInternational Conference on Machine Learning . 2011