自动文本摘要方法的研究及应用

被引:0
作者
丛艳
机构
[1] 华北电力大学(北京)
关键词
文本挖掘; 文本摘要; 网页摘要; 网页分类;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
随着万维网(WWW)的迅猛发展,用户可在线获得的信息量呈指数级增长。面对如此浩瀚的信息,人们迫切需要寻找一条能够快速、准确获得所需信息的途径,因而出现了多种文本处理技术,包括信息检索、文本分类、文本摘要等。其中文本摘要技术因其既可以压缩文本,减少用户的浏览负担,又可以为其他文本处理技术提供支持,逐渐成为国内外研究的热点。 本文就文本摘要进行了较为系统的研究:首先全面系统地综述了自动文本摘要的相关问题和技术;然后根据网页自身的特点(如结构、链接等),提出了一种基于网页分割技术的文本摘要算法;其次鉴于自动摘要能够有效除去噪声、提取出文章的主题内容的特点,我们把自动摘要技术运用在网页分类上,实验证明这种方法能够使分类性能大大提高;在论文的最后,介绍了我们的网络挖掘系统-WEBME中的自动摘要子模块的设计与实现。
引用
收藏
页数:60
共 5 条
[1]
网页分类技术 [J].
孙建涛 ;
沈抖 ;
陆玉昌 ;
石纯一 .
清华大学学报(自然科学版), 2004, (01) :65-68
[2]
一种提高中文搜索引擎检索质量的HTML解析方法 [J].
宋睿华 ;
马少平 ;
陈刚 ;
李景阳 .
中文信息学报, 2003, (04) :19-26
[3]
自动文摘技术的原理与应用 [J].
崔长利 ;
李辉 ;
刘桢祥 .
黑龙江电子技术, 1999, (07)
[4]
自动文摘的四种主要方法 [J].
刘挺 ;
王开铸 .
情报学报, 1999, (01)
[5]
SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297