基于CRF算法的汉语比较句识别和关系抽取

被引:22
作者
黄高辉
姚天昉
刘全升
机构
[1] 上海交通大学计算机科学与工程系
关键词
比较句; 比较关系; CRF模型; 比较主体; 比较基准;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
比较句是表明事物之间关系的常见表达方式,对于文本挖掘,特别是情感分析,具有重要的价值。目前汉语比较句的研究还是一个新颖的课题,包括汉语比较句的识别和比较关系的抽取。对于汉语比较句的识别,在前人研究的基础上,以SVM为分类器,以特征词和CSR序列规则为特征,同时利用CRF算法抽取实体对象,并增加以实体对象的信息作为特征,显著提高了比较句识别的准确率、召回率和F-度量,最高分别达到96.55%、88.63%和92.43%。对于汉语比较关系的抽取,在CRF算法抽取实体对象的基础上,通过定义一些规则,抽取比较主体和比较基准,也取得了较好的效果,其中比较主体的抽取效果要好于比较基准。
引用
收藏
页码:2061 / 2064
页数:4
相关论文
共 4 条
[1]   汉语比较句识别研究 [J].
黄小江 ;
万小军 ;
杨建武 ;
肖建国 .
中文信息学报, 2008, (05) :30-38
[2]   现代汉语比较句论略 [J].
车竞 .
湖北师范学院学报(哲学社会科学版), 2005, (03) :60-63
[3]  
现代汉语差比范畴研究.[M].许国萍; 著.学林出版社.2007,
[4]  
现代汉语比较范畴的语义认知基础.[M].刘焱著;.学林出版社.2004,