基于HowNet概念获取的中文自动文摘系统

被引:19
作者
王萌
何婷婷
姬东鸿
王晓荣
机构
[1] 华中师范大学计算机科学系
[2] 新加坡信息通讯研究所
[3] 华中师范大学计算机科学系 武汉
[4] 武汉
[5] 新加坡
关键词
计算机应用; 中文信息处理; HowNet; 自动文摘; 概念向量空间模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。
引用
收藏
页码:87 / 93
页数:7
相关论文
共 3 条
[1]   句子相似模型和最相似句子查找算法 [J].
吕学强 ;
任飞亮 ;
黄志丹 ;
姚天顺 ;
不详 .
东北大学学报 , 2003, (06) :531-534
[2]   基于概念统计的英文自动文摘研究 [J].
万敏 ;
罗振声 ;
季姮 ;
高小云 ;
不详 .
计算机工程与应用 , 2002, (24) :7-9+16
[3]   基于知识的文本摘要系统研究与实现 [J].
孙春葵 ;
李蕾 ;
杨晓兰 ;
钟义信 .
计算机研究与发展, 2000, (07) :874-881