Internet网络新闻文本自动摘要的研究

被引:9
作者
官礼和
机构
[1] 重庆交通大学信息与计算科学研究所
关键词
自然语言处理; 自动摘要; 分词; 断句; 权重; 平滑处理;
D O I
10.16208/j.issn1000-7024.2007.14.074
中图分类号
TP311.52 [];
学科分类号
081202 ; 0835 ;
摘要
给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法。针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。
引用
收藏
页码:3518 / 3520+3545 +3545
页数:4
相关论文
共 6 条
[1]   基于概念统计的英文自动文摘研究 [J].
万敏 ;
罗振声 ;
季姮 ;
高小云 ;
不详 .
计算机工程与应用 , 2002, (24) :7-9+16
[2]   基于EM算法的汉语自动分词方法 [J].
李家福 ;
张亚非 .
情报学报, 2002, (03) :269-272
[3]   自动分词技术及其在信息检索中应用的研究 [J].
黄崑 ;
符绍宏 .
现代图书情报技术, 2001, (03) :26-29
[4]   自动文摘的四种主要方法 [J].
刘挺 ;
王开铸 .
情报学报, 1999, (01) :10-19
[5]   自然语言篇章理解及基于理解的自动文摘研究 [J].
王建波 ;
王开铸 .
中文信息学报, 1992, (02) :1-7
[6]  
论自动文摘及其分类[J]. 王志琪,王永成,刘传汉.情报学报. 2005 (02)