以关键词抽取为核心的文摘句选择策略

被引:8
作者
马亮 [1 ,2 ]
何婷婷 [1 ,2 ]
李芳 [1 ,2 ]
陈劲光 [1 ,2 ]
邵伟 [1 ,2 ]
机构
[1] 华中师范大学计算机科学系
[2] 国家语言资源监测与研究中心网络媒体分中心
关键词
计算机应用; 中文信息处理; 多文档文摘; 关键词抽取; 文摘句选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打分,进一步利用改进的MMR(Maximal Marginal Relevance)技术来调整候选句的得分,最后生成文摘。该文将特征融合引入到词语层面,在DUC2005的语料中测试取得了较好的效果。
引用
收藏
页码:50 / 54
页数:5
相关论文
共 2 条
[1]  
统计自然语言处理基础[M]. 电子工业出版社 , (美)ChristopherD.Manning, 2005
[2]  
NUS at DUC Using Evolutionary Models of Text .2 Ziheng Lin,Tat-Seng Chua,Min-Yen Kan. Proceedings of DUC 2007 . 2007