自动文摘基集语句的提取与润色的数学模型

被引：2

作者：

吴岩

李秀坤

机构：

[1] 哈尔滨工业大学计算机学院

来源：

计算机应用研究 | 2007年 / 05期

关键词：

自然语言处理; 自动文摘; 语义距离;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

针对统计和理解相结合的自动文摘方法,提出了一种新的内容词、有效词和特征词的动态加权函数以及句子重要性的动态加权函数。鉴于基于统计的自动文摘结果常常出现语句间缺乏连贯性及信息冗余的问题,设计了句间语义距离测试函数,并通过大量实验确定语句间语义距离的上限和下限。上限用于控制语句间的逻辑联系,下限用于解决文摘结果信息冗余的问题。实验结果证明,该模型能有效地提取文章中的重点语句,且很好地解决了统计文摘语句不连冠的瓶颈问题。

引用

页码：52 / 55

页数：4