基于事件指导的多文档生成式摘要方法

被引:6
作者
王振超
孙锐
姬东鸿
机构
[1] 武汉大学计算机学院
关键词
事件; 生成式; 组合语义; 子主题; 多语句压缩; 多文档摘要;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。
引用
收藏
页码:343 / 346+356 +356
页数:5
相关论文
共 20 条
[1]  
A latent topic extracting method based on events in a document and its application. Kitajima R,Kobayashi I. Proc of the 49th Annual Meeting of ACL . 2011
[2]  
Abstractive multi-document summarization via phrase selection and merging. Bing Lidong,Li Piji,Liao Yi,et al. Proc of the53rd Annual Meeting of ACL . 2015
[3]  
Toward abstractive summarization using semantic representations. Liu Fei,Flanigan J,Thomson S,et al. Proc of the North American Chapter of the ACL . 2015
[4]  
Reader-aware multi-document summarization via sparse coding. Li Piji,Bing Lidong,Lam W,et al. Proc of the 24th International Conference on Artificial Intelligence . 2015
[5]   多文档自动文摘综述 [J].
秦兵 ;
刘挺 ;
李生 .
中文信息学报, 2005, (06) :15-22+58
[6]   改进的潜在语义分析中文摘录方法 [J].
肖升 ;
何炎祥 .
计算机应用研究, 2012, 29 (12) :4507-4511
[7]  
Multiple alternative sentence compressions for automatic text summarization. Madnani N,Zajic D,Dorr B,et al. Proc of Document Understunding Conference . 2007
[8]  
Framework for abstractive summarization using text-to-text generation. Genest P,Lapalme G. Proc of Monolingual Text-To-Text Generation Workshop . 2011
[9]  
Information fusion in the context of multi-document summarization. Barzilay R,Mc Keown K R,Elhadad M. Proc of the 37th Annual Meeting of ACL . 1999
[10]  
A review of recent progress in multidocument summarization. Tabassum S,Oliveira E. Proc of the 10th Doctoral Symposium in Informatics Engineering . 2015