多文档自动文摘中的特征组合优化

被引：6

作者：

刘茂福

李淑君

金可佳

张晓龙

机构：

[1] 武汉科技大学计算机科学与技术学院

来源：

计算机系统应用 | 2008年 / 08期

关键词：

tf*idf; 句子位置; 标题句相似度; 句子长度; 组合优化;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

在分析当前多文档自动文摘方法中使用较多的特征基础上,提出了一种特征组合优化模型。该模型选用tf*idf,句子位置及与标题句相似度来判断句子包含信息的重要程度。并加入了句子长度特征解决由tf*idf特征引起的长度偏长的句子占优势的问题,采用这4个特征来判断句子的重要性。并给每个特征指定权重来解决优化问题,实验结果表明特征组合优化模型在多文档自动文摘中的可行性。

引用

页码：59 / 63

页数：5

共 6 条

[1] 自动文摘基集语句的提取与润色的数学模型 [J].