基于HowNet概念获取的中文自动文摘系统

被引：19

作者：

王萌

何婷婷

姬东鸿

王晓荣

机构：

[1] 华中师范大学计算机科学系

[2] 新加坡信息通讯研究所

[3] 华中师范大学计算机科学系武汉

[4] 武汉

[5] 新加坡

来源：

中文信息学报 | 2005年 / 03期

关键词：

计算机应用; 中文信息处理; HowNet; 自动文摘; 概念向量空间模型;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。

引用

页码：87 / 93

页数：7