共 3 条
基于HowNet概念获取的中文自动文摘系统
被引:19
作者:
王萌
何婷婷
姬东鸿
王晓荣
机构:
[1] 华中师范大学计算机科学系
[2] 新加坡信息通讯研究所
[3] 华中师范大学计算机科学系 武汉
[4] 武汉
[5] 新加坡
来源:
关键词:
计算机应用;
中文信息处理;
HowNet;
自动文摘;
概念向量空间模型;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
本文提出了一种中文自动文摘的方法。不同于其它的基于词频统计的一般方法,运用概念(词义)作为特征取代词语。用概念统计代替传统的词形频率统计方法,建立概念向量空间模型,计算出句子重要度,并对句子进行冗余度计算,抽取文摘句。对于文摘测试,采用两种不同的方法进行测试:一是用机器文摘和专家文摘进行比较的内部测试;二是对不同文摘方法进行分类,通过对分类正确率的比较的外部评测方法。
引用
收藏
页码:87 / 93
页数:7
相关论文