基于语义角色标注的新闻领域复述句识别方法

被引:5
作者
吴晓锋
宗成庆
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
关键词
复述识别; 语义角色标注; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
复述(Paraphrase)句的识别可看作文本蕴含(Text Entailment)识别的一个子问题,传统的解决方法是通过词频或句法上的相似度来判断。即使用相同的文字书写的句子其含义也可能差别很大,而相同句法结构也不能保证意义一致。该文根据新闻语料的特点,提出了一种通过引入深层的语义角色标注来帮助识别新闻领域复述句的方法。该方法通过在语义角色这种结构化的含义表达形式中提取的特征来弥补传统方法的不足:先识别待判断的两个句子中所有谓词的语义角色,然后计算两个句子间对应语义角色的相似度,最后结合传统的句子相似度计算方法来进行相似性计算。实验证明,该文提出的方法能有效地提高复述语句的识别效果。
引用
收藏
页码:3 / 9
页数:7
相关论文
共 3 条
[1]   多文档自动文摘综述 [J].
秦兵 ;
刘挺 ;
李生 .
中文信息学报, 2005, (06) :15-22+58
[2]  
基于改进编辑距离的中文相似句子检索[J]. 车万翔,刘挺,秦兵,李生.高技术通讯. 2004 (07)
[3]  
Paraphrasing using given and new information in a question-answer system .2 McKeown KR. Proc.of the ACL . 1979