基于主题划分的网页自动摘要

被引:18
作者
陈志敏
沈洁
林颖
周峰
机构
[1] 扬州大学信息工程学院
关键词
Web信息检索; 文档对象模型; 主题划分; 句子重要度;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
提出了一种以网页结构为指导的自动摘要方法。对页面源文件进行解析时,利用文档的结构信息生成DOM树,并在此基础上划分文档主题。同时充分挖掘网页标记对主题词提取和句子重要性计算的价值。最后以主题块为单位,根据句子间的相似度调整句子权重,动态生成摘要。实验结果表明该方法能有效解决文档摘要分布不平衡问题,减少了文摘内容的冗余。
引用
收藏
页码:641 / 644
页数:4
相关论文
共 3 条
[1]
一种篇章结构指导的中文Web文档自动摘要方法 [J].
王继成 ;
武港山 ;
周源远 ;
张福炎 .
计算机研究与发展, 2003, (03) :398-405
[2]
基于信息抽取和文本生成的自动文摘系统设计 [J].
刘挺 ;
吴岩 ;
王开铸 .
情报学报, 1997, (S1)
[3]
OA中文文献自动摘要系统 [J].
王永成 ;
许慧敏 .
情报学报, 1997, (02)