使用关键词扩展的新闻文本自动摘要方法

被引:13
作者
李峰 [1 ,2 ]
黄金柱 [3 ]
李舟军 [1 ]
杨伟铭 [2 ]
机构
[1] 北京航空航天大学计算机学院
[2] 中国人民解放军后勤科学研究所
[3] 中国人民解放军外国语学院语言工程系
基金
国家高技术研究发展计划(863计划);
关键词
扩展; 相近文本; 自动摘要; 图算法; 系统实现;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出了使用关键词扩展的新闻文本自动摘要方法。该方法从大规模的语料中提取与输入文档相近主题的文本组成背景语料,并基于背景语料进行关键词的扩展,强化关键词对文摘句的指示作用,从而提高新闻文本摘要抽取质量。研究和实验表明,该方法在Rouge-1,Rouge-2评测中取得了优于基于关键词、基于TextRank和基于Manifold Ranking方法的结果。在研究中组织制定了100篇新闻文本的4份中文新闻文本标准评价集,研制了基于关键词扩展的中文新闻文本自动摘要系统,开发了面向中文的基于ROUGE原理的新闻文本摘要结果自动评测系统,初步实现了从理论到实践的转化。
引用
收藏
页码:372 / 380
页数:9
相关论文
共 7 条
[1]   基于段落-句子互增强的自动文摘算法 [J].
谢浩 ;
孙伟 .
计算机科学, 2013, 40(S2) (S2) :246-250
[2]   多特征融合的语句相似度计算模型 [J].
张培颖 .
计算机工程与应用, 2010, (26) :136-137+157
[3]   A Survey of Unstructured Text Summarization Techniques [J].
Elfayoumy, Sherif ;
Thoppil, Jenny .
INTERNATIONAL JOURNAL OF ADVANCED COMPUTER SCIENCE AND APPLICATIONS, 2014, 5 (04) :149-154
[4]  
A new graph based text segmentation using Wikipedia for automatic text summarization[J] . Mohsen Pourvali,Ph.D. Mohammad Saniee Abadeh.International Journal of Advanced Computer Science and Applications . 2012 (1)
[5]  
Automatic summarising: The state of the art[J] . Information Processing and Management . 2007 (6)
[6]  
Manifold-ranking based topic-focused multi-document summarization. Wan X,Yang J,Xiao J. The 20th International Joint Conference on Artificial Intelligence . 2007
[7]  
A generalized co-hits algorithm and its application to bipartitegraphs. Deng H,Lyu M,King I. Proceedings of the15th ACM SIGKDD International Conference on KnowledgeDiscovery and Data Mining . 2009