学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
Internet网络新闻文本自动摘要的研究
被引:9
作者
:
论文数:
引用数:
h-index:
机构:
官礼和
机构
:
[1]
重庆交通大学信息与计算科学研究所
来源
:
计算机工程与设计
|
2007年
/ 14期
关键词
:
自然语言处理;
自动摘要;
分词;
断句;
权重;
平滑处理;
D O I
:
10.16208/j.issn1000-7024.2007.14.074
中图分类号
:
TP311.52 [];
学科分类号
:
081202 ;
0835 ;
摘要
:
给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法。针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。
引用
收藏
页码:3518 / 3520+3545 +3545
页数:4
相关论文
共 6 条
[1]
基于概念统计的英文自动文摘研究
[J].
万敏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
万敏
;
罗振声
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
罗振声
;
季姮
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
季姮
;
高小云
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
高小云
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
不详
.
计算机工程与应用 ,
2002,
(24)
:7
-9+16
[2]
基于EM算法的汉语自动分词方法
[J].
李家福
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学通信工程学院
李家福
;
张亚非
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学通信工程学院
张亚非
.
情报学报,
2002,
(03)
:269
-272
[3]
自动分词技术及其在信息检索中应用的研究
[J].
黄崑
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学信息技术与管理学系!北京,北京师范大学信息技术与管理学系!北京
黄崑
;
符绍宏
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学信息技术与管理学系!北京,北京师范大学信息技术与管理学系!北京
符绍宏
.
现代图书情报技术,
2001,
(03)
:26
-29
[4]
自动文摘的四种主要方法
[J].
论文数:
引用数:
h-index:
机构:
刘挺
;
王开铸
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系
王开铸
.
情报学报,
1999,
(01)
:10
-19
[5]
自然语言篇章理解及基于理解的自动文摘研究
[J].
论文数:
引用数:
h-index:
机构:
王建波
;
论文数:
引用数:
h-index:
机构:
王开铸
.
中文信息学报,
1992,
(02)
:1
-7
[6]
论自动文摘及其分类[J]. 王志琪,王永成,刘传汉.情报学报. 2005 (02)
←
1
→
共 6 条
[1]
基于概念统计的英文自动文摘研究
[J].
万敏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
万敏
;
罗振声
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
罗振声
;
季姮
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
季姮
;
高小云
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
高小云
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学人文学院计算语言学研究室
不详
.
计算机工程与应用 ,
2002,
(24)
:7
-9+16
[2]
基于EM算法的汉语自动分词方法
[J].
李家福
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学通信工程学院
李家福
;
张亚非
论文数:
0
引用数:
0
h-index:
0
机构:
解放军理工大学通信工程学院
张亚非
.
情报学报,
2002,
(03)
:269
-272
[3]
自动分词技术及其在信息检索中应用的研究
[J].
黄崑
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学信息技术与管理学系!北京,北京师范大学信息技术与管理学系!北京
黄崑
;
符绍宏
论文数:
0
引用数:
0
h-index:
0
机构:
北京师范大学信息技术与管理学系!北京,北京师范大学信息技术与管理学系!北京
符绍宏
.
现代图书情报技术,
2001,
(03)
:26
-29
[4]
自动文摘的四种主要方法
[J].
论文数:
引用数:
h-index:
机构:
刘挺
;
王开铸
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机系
王开铸
.
情报学报,
1999,
(01)
:10
-19
[5]
自然语言篇章理解及基于理解的自动文摘研究
[J].
论文数:
引用数:
h-index:
机构:
王建波
;
论文数:
引用数:
h-index:
机构:
王开铸
.
中文信息学报,
1992,
(02)
:1
-7
[6]
论自动文摘及其分类[J]. 王志琪,王永成,刘传汉.情报学报. 2005 (02)
←
1
→