基于特征组合的中文语义角色标注

被引:46
作者
李世奇 [1 ]
赵铁军 [1 ]
李晗静 [1 ]
刘鹏远 [2 ]
刘水 [1 ]
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 北京大学计算语言学研究所
关键词
语义角色标注; 自然语言处理; 支持向量机; 特征组合;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
提出一种基于特征组合和支持向量机(support vector machine,简称SVM)的语义角色标注(semantic role labeling,简称SRL)方法.该方法以句法成分作为基本标注单元,首先从当前基于句法分析的语义角色标注系统中选出高效特征,构成基本特征集合.然后提出一种基于统计的特征组合方法.该方法能够根据正反例中组合特征的分布状况,以类间距离和类内距离之比作为统计量来衡量组合特征对分类所产生的效果,保留分类效果较好的组合特征.最后,在Chinese PropBank(CPB)语料上利用支持向量机进行分类实验,结果表明,引入该特征组合方法后,语义角色标注整体F值达91.81%,提高了近2%.
引用
收藏
页码:222 / 232
页数:11
相关论文
共 8 条
[1]
语义角色标注中特征优化组合研究 [J].
丁金涛 ;
王红玲 ;
周国栋 ;
朱巧明 ;
钱培德 .
计算机应用与软件, 2009, 26 (05) :17-21+52
[2]
基于最大熵分类器的语义角色标注 [J].
刘挺 ;
车万翔 ;
李生 .
软件学报, 2007, (03) :565-573
[3]
中文语义角色标注的特征工程 [J].
刘怀军 ;
车万翔 ;
刘挺 .
中文信息学报, 2007, (01) :79-84
[4]
基于特征向量的中英文语义角色标注研究 [D]. 
王红玲 .
苏州大学,
2009
[5]
Labeling Chinese predicates with semantic roles [J].
Xue, Nianwen .
COMPUTATIONAL LINGUISTICS, 2008, 34 (02) :225-255
[6]
Support vector learning for semantic argument classification [J].
Pradhan, S ;
Hacioglu, K ;
Krugler, V ;
Ward, W ;
Martin, J ;
Jurafsky, D .
MACHINE LEARNING, 2005, 60 (1-3) :11-39
[7]
The Proposition Bank: An annotated corpus of semantic roles [J].
Palmer, M ;
Kingsbury, P ;
Gildeafi, D .
COMPUTATIONAL LINGUISTICS, 2005, 31 (01) :71-105
[8]
Automatic Labeling of semantic roles [J].
Gildea, D ;
Jurafskyy, D .
COMPUTATIONAL LINGUISTICS, 2002, 28 (03) :245-288