基于规则和统计的中文自动文摘系统

被引:20
作者
傅间莲
陈群秀
机构
[1] 清华大学计算机系智能技术与系统国家重点实验室
关键词
计算机应用; 中文信息处理; 自动文摘; 向量空间模型; 主题划分; 可读性; 评价;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-m easure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。
引用
收藏
页码:10 / 16
页数:7
相关论文
共 2 条
[1]   自动文摘系统中的主题划分问题研究 [J].
傅间莲 ;
陈群秀 .
中文信息学报, 2005, (06) :30-37
[2]   基于连续段落相似度的主题划分算法 [J].
傅间莲 ;
陈群秀 .
计算机应用, 2005, (09) :2022-2024