基于规则和统计的中文自动文摘系统

被引：20

作者：

傅间莲

陈群秀

机构：

[1] 清华大学计算机系智能技术与系统国家重点实验室

来源：

中文信息学报 | 2006年 / 05期

关键词：

计算机应用; 中文信息处理; 自动文摘; 向量空间模型; 主题划分; 可读性; 评价;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-m easure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。

引用

页码：10 / 16

页数：7