多文档文摘中句子优化选择方法研究

被引:11
作者
秦兵
刘挺
陈尚林
李生
机构
[1] 哈尔滨工业大学计算机科学与技术学院信息检索研究室
基金
国家自然科学基金重点项目;
关键词
多文档文摘; 子主题; 句子优化选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在多文档文摘子主题划分的基础上,提出了一种在子主题之间对文摘句优化选择的方法·首先在句子相似度计算的基础上,形成多文档集合的子主题,通过对各子主题打分,确定子主题的抽取顺序·以文摘中有效词的覆盖率作为优化指标,在各个子主题中选择文摘句·从减少子主题之间及子主题内部的信息的冗余性两个角度选择文摘句,使文摘的信息覆盖率得到很大提高·实验表明,生成的文摘是令人满意的·
引用
收藏
页码:1129 / 1134
页数:6
相关论文
共 2 条
[1]   基于常问问题集的中文问答系统研究 [J].
秦兵 ;
刘挺 ;
王洋 ;
郑实福 ;
李生 .
哈尔滨工业大学学报, 2003, (10) :1179-1182
[2]   基于依存分析改进贝叶斯模型的词义消歧 [J].
卢志茂 ;
刘挺 ;
张刚 ;
李生 .
高技术通讯, 2003, (05) :1-7