共 2 条
基于规则和统计的中文自动文摘系统
被引:20
作者:
傅间莲
陈群秀
机构:
[1] 清华大学计算机系智能技术与系统国家重点实验室
来源:
关键词:
计算机应用;
中文信息处理;
自动文摘;
向量空间模型;
主题划分;
可读性;
评价;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-m easure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。
引用
收藏
页码:10 / 16
页数:7
相关论文