基于句子特征和语义距离的文本摘要技术

被引:10
作者
张培颖
机构
[1] 中国石油大学(华东)计算机与通信工程学院
关键词
文本摘要; 句子特征; 语义距离; 句子抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
自动摘要是解决网络信息过载问题的关键技术之一。在对文本中句子的特征和句子之间的语义距离分析的基础上,提出了一种基于句子特征和语义距离的自动文本摘要算法。首先计算文档中句子的各个特征权重,在此基础上决定句子的权重;然后,通过句子之间的语义距离计算,修改句子的权重,据此进行排序,权重大的作为文本的主题句;最后,对文摘句进行平滑处理,生成文字流畅的文本摘要。实验表明,该算法在不同的压缩率下生成的摘要接近于人工摘要,具有较好的性能。
引用
收藏
页码:14 / 18
页数:5
相关论文
共 4 条
[1]
一种改进的基于《知网》的词语语义相似度计算 [J].
江敏 ;
肖诗斌 ;
王弘蔚 ;
施水才 .
中文信息学报, 2008, (05) :84-89
[2]
一种主题句发现的中文自动文摘研究 [J].
王萌 ;
李春贵 ;
唐培和 ;
王晓荣 .
计算机工程, 2007, (08) :180-181+189
[3]
An effective sentence-extraction technique using contextual information and statistical approaches for text summarization [J].
Ko, Youngjoong ;
Seo, Jungyun .
PATTERN RECOGNITION LETTERS, 2008, 29 (09) :1366-1371
[4]
Automatic Text Summarization..Mohamed Abdel Fattah;Fuji Ren;.International Journal of Computer Science.2008, 01