基于BootStrapping的集成分类器的中文观点句识别方法

被引:16
作者
吕云云 [1 ]
李旸 [1 ]
王素格 [2 ,3 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 山西大学 计算机与信息技术学院
[3] 山西大学 计算智能与中文信息处理教育部重点实验室
关键词
观点句识别; BootStrapping; 集成分类器;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。
引用
收藏
页码:84 / 92
页数:9
相关论文
共 6 条
[1]
极性相似度计算在词汇倾向性识别中的应用 [J].
宋乐 ;
何婷婷 ;
王倩 ;
闻彬 .
中文信息学报, 2010, 24 (04) :63-67
[2]
基于同义词的词汇情感倾向判别方法 [J].
王素格 ;
李德玉 ;
魏英杰 ;
宋晓雷 .
中文信息学报, 2009, (05) :68-74
[3]
A feature selection method based on improved fisher’s discriminant ratio for text sentiment classification[J] Suge Wang;Deyu Li;Xiaolei Song;Yingjie Wei;Hongxia Li Expert Systems With Applications 2011,
[4]
Learning Subjective Language[J] Janyce Wiebe;Theresa Wilson;Rebecca Bruce;Matthew Bell;Melanie Martin Computational Linguistics 2004,
[5]
Measuring praise and criticism[J] Peter D. Turney;Michael L. Littman ACM Transactions on Information Systems (TOIS) 2003,
[6]
Which Is the Best Multiclass SVM Method? An Empirical Study Kai-Bo Duan;S Sathiya Keerthi; Proceedings of the Sixth International Workshop on Multiple Classifier Systems 2005,