基于层叠CRFs模型的句子褒贬度分析研究

被引:22
作者
刘康
赵军
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
基金
北京市自然科学基金;
关键词
计算机应用; 中文信息处理; 句子褒贬度分析; 褒贬分类; 褒贬强度分析; 冗余标记; 层叠式条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文研究句子的褒贬度分析问题。针对传统的基于分类的句子褒贬度分析方法不能考虑上下文信息的问题,以及基于单层模型的句子褒贬度分类方法中的由于标记冗余引起的分类精度不高问题,本文提出了基于层叠式CRFs模型的句子褒贬度分析方法。该方法利用多个CRFs模型从粗到细分步地判断句子的褒贬类别及其褒贬强度,其中层叠式框架可以考虑句子褒贬类别与褒贬强度类别之间的层级冗余关系,而CRFs模型可以利用上下文信息对于句子褒贬类别和强度的影响。该方法在有效识别句子褒贬度的同时,提高了句子褒贬强度判别的准确度。实验证明相对于传统分类方法和单层CRFs模型,本文的方法取得了良好的效果。
引用
收藏
页码:123 / 128
页数:6
相关论文
共 10 条
[1]  
LIBSVM:alibrary for support vector machines. Chih-Chung Chang,and Chih-Jen Lin. http://www.csie.ntu.edu.tw/~cjlin/libsvm . 2001
[2]  
Thumbs up? Sentiment Classification using Machine Learning Techniques. Bo Pang,Lillian Lee,Shivakumar Vaithyanathan. Proceedings of EMNLP . 2002
[3]  
Learning Extraction Patterns for Subjective Expressions. Ellen Riloff,Janyce Wiebe. Proceedings of the 2003 Conference on Empirical Methods in Natural Language Processing (EMNLP-03) . 2003
[4]  
Thumbs up or thumbs down?Semantic orientation applied to unsupervised classification of reviews[A]. TURNEY PD. Proceedings of the Association forComputationalLinguistics 40 th AnniversaryMeeting . 2002
[5]  
Isotonic ConditionalRandom Fields and Local Sentiment Flow. Y.Mao,and G Lebanon. Advances in Neural Information Processing Systems . 2007
[6]  
2003 Shallow Parsingwith Conditional Random Fields. Fei Sha,and Fernando Pereira,Canada,2003,213-220. Proc.of.HLT-NAACL 2003 .
[7]  
Conditionalrandom fields:Probabilistic models for segmenting andlabeling sequence data. J Lafferty,A McCallum,F Pereira. Proc.ICML-01 . 2001
[8]  
“FlexCRFs:Flexible Conditional RandomField Toolkit”. Xuan-Hieu Phan,Le-Minh Nguyen,and Cam-TuNguyen. http://flexCRF.sourceforge.net . 2005
[9]  
Structured Models for Fine-to-Coarse SentimentAnalysis. Ryan McDonald,Kerry Hannan,and Tyler Neylon etal. Proceedings of ACL . 2007
[10]  
A sentiment education:Sentiment analysis using subjectivity summarizationbased on minimum cuts. Bo Pang,and Lillian Lee. Proceedings of ACL 2004 . 2004