学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于主题划分的网页自动摘要
被引:18
作者
:
论文数:
引用数:
h-index:
机构:
陈志敏
论文数:
引用数:
h-index:
机构:
沈洁
林颖
论文数:
0
引用数:
0
h-index:
0
机构:
扬州大学信息工程学院
林颖
论文数:
引用数:
h-index:
机构:
周峰
机构
:
[1]
扬州大学信息工程学院
来源
:
计算机应用
|
2006年
/ 03期
关键词
:
Web信息检索;
文档对象模型;
主题划分;
句子重要度;
D O I
:
暂无
中图分类号
:
TP393.092 [];
学科分类号
:
摘要
:
提出了一种以网页结构为指导的自动摘要方法。对页面源文件进行解析时,利用文档的结构信息生成DOM树,并在此基础上划分文档主题。同时充分挖掘网页标记对主题词提取和句子重要性计算的价值。最后以主题块为单位,根据句子间的相似度调整句子权重,动态生成摘要。实验结果表明该方法能有效解决文档摘要分布不平衡问题,减少了文摘内容的冗余。
引用
收藏
页码:641 / 644
页数:4
相关论文
共 3 条
[1]
一种篇章结构指导的中文Web文档自动摘要方法
[J].
论文数:
引用数:
h-index:
机构:
王继成
;
论文数:
引用数:
h-index:
机构:
武港山
;
周源远
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室,南京大学计算机科学与技术系南京,南京
周源远
;
论文数:
引用数:
h-index:
机构:
张福炎
.
计算机研究与发展,
2003,
(03)
:398
-405
[2]
基于信息抽取和文本生成的自动文摘系统设计
[J].
论文数:
引用数:
h-index:
机构:
刘挺
;
论文数:
引用数:
h-index:
机构:
吴岩
;
论文数:
引用数:
h-index:
机构:
王开铸
.
情报学报,
1997,
(S1)
[3]
OA中文文献自动摘要系统
[J].
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所
王永成
;
论文数:
引用数:
h-index:
机构:
许慧敏
.
情报学报,
1997,
(02)
←
1
→
共 3 条
[1]
一种篇章结构指导的中文Web文档自动摘要方法
[J].
论文数:
引用数:
h-index:
机构:
王继成
;
论文数:
引用数:
h-index:
机构:
武港山
;
周源远
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室,南京大学计算机科学与技术系南京,南京
周源远
;
论文数:
引用数:
h-index:
机构:
张福炎
.
计算机研究与发展,
2003,
(03)
:398
-405
[2]
基于信息抽取和文本生成的自动文摘系统设计
[J].
论文数:
引用数:
h-index:
机构:
刘挺
;
论文数:
引用数:
h-index:
机构:
吴岩
;
论文数:
引用数:
h-index:
机构:
王开铸
.
情报学报,
1997,
(S1)
[3]
OA中文文献自动摘要系统
[J].
王永成
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学电脑应用技术研究所
王永成
;
论文数:
引用数:
h-index:
机构:
许慧敏
.
情报学报,
1997,
(02)
←
1
→