基于概念统计的英文自动文摘研究

被引:8
作者
万敏
罗振声
季姮
高小云
机构
[1] 清华大学人文学院计算语言学研究室
关键词
概念统计; 主题概念; 向量空间模型; 句子重要度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文章提出了一种基于概念统计和语义层次分析的自动文摘方法,并以此实现了一个英文自动文摘系统。系统利用WordNet对英文文章进行词语分析,用概念统计的方法选取文章的主题概念,以此构建向量空间模型;并根据主题概念在概念层次树上的分布划分意义块,以意义块为单位抽取文摘,初步解决多主题文章的文摘结构不平衡问题。该文主要介绍概念层次树的构造,主题概念的抽取步骤,句子重要度的计算和意义块的划分算法。测试表明该文提到的方法比传统的基于词频统计的方法有更高的召回率与精确率。
引用
收藏
页码:7 / 9+16 +16
页数:4
相关论文
共 1 条
[1]   面向非受限领域的综合式自动中文文摘方法 [J].
郭玉箐 ;
万敏 ;
罗振声 .
清华大学学报(自然科学版), 2002, (01) :139-142