学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于主题分割与PageRank算法的文本主题抽取
被引:9
作者
:
段晓丽
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学管理学院
段晓丽
论文数:
引用数:
h-index:
机构:
王宇
机构
:
[1]
大连理工大学管理学院
来源
:
现代图书情报技术
|
2010年
/ 12期
关键词
:
主题句抽取;
主题分割;
句子关系图;
PageRank算法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
针对主题句抽取时完整性差的问题,在对文本进行主题分割的基础上,为每个主题包构建句子关系图,并采用基于图的PageRank算法对关系图中的句子排序,选取权重大的句子作为每个主题包的主题句。实验表明,该算法抽取的主题句对全文有很好的覆盖率。
引用
收藏
页码:34 / 39
页数:6
相关论文
共 13 条
[1]
基于句子特征和语义距离的文本摘要技术
[J].
论文数:
引用数:
h-index:
机构:
张培颖
.
微计算机应用,
2009,
30
(07)
:14
-18
[2]
基于句子关系图的网页文本主题句抽取
[J].
论文数:
引用数:
h-index:
机构:
何维
;
论文数:
引用数:
h-index:
机构:
王宇
.
现代图书情报技术,
2009,
(03)
:57
-61
[3]
以关键词抽取为核心的文摘句选择策略
[J].
论文数:
引用数:
h-index:
机构:
马亮
;
论文数:
引用数:
h-index:
机构:
何婷婷
;
论文数:
引用数:
h-index:
机构:
李芳
;
论文数:
引用数:
h-index:
机构:
陈劲光
;
论文数:
引用数:
h-index:
机构:
邵伟
.
中文信息学报,
2008,
22
(06)
:50
-54
[4]
文本线性分割方法的研究
[J].
论文数:
引用数:
h-index:
机构:
刘娜
;
论文数:
引用数:
h-index:
机构:
唐焕玲
;
论文数:
引用数:
h-index:
机构:
鲁明羽
.
计算机工程与应用,
2008,
(21)
:212
-216
[5]
一种基于文本关系图的多文档自动摘要技术
[J].
论文数:
引用数:
h-index:
机构:
马慧芳
;
论文数:
引用数:
h-index:
机构:
祁云平
;
论文数:
引用数:
h-index:
机构:
杨小东
.
情报杂志 ,
2007,
(03)
:67
-69
[6]
基于综合方法的文本主题句的自动抽取
[J].
张云涛
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心
上海交通大学网络信息中心
张云涛
;
论文数:
引用数:
h-index:
机构:
龚玲
;
论文数:
引用数:
h-index:
机构:
王永成
.
上海交通大学学报,
2006,
(05)
:771
-774+782
[7]
基于连续段落相似度的主题划分算法
[J].
傅间莲
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华大学计算机科学与技术系智能技术与系统国家重点实验室北京,北京
傅间莲
;
论文数:
引用数:
h-index:
机构:
陈群秀
.
计算机应用,
2005,
(09)
:2022
-2024
[8]
文本的图表示初探
[J].
周昭涛
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
周昭涛
;
卜东波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
卜东波
;
程学旗
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
程学旗
.
中文信息学报,
2005,
(02)
:36
-43
[9]
一种基于字同现频率的汉语文本主题抽取方法
[J].
论文数:
引用数:
h-index:
机构:
马颖华
;
论文数:
引用数:
h-index:
机构:
王永成
;
论文数:
引用数:
h-index:
机构:
苏贵洋
;
张宇萌
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海
张宇萌
.
计算机研究与发展,
2003,
(06)
:874
-878
[10]
一种篇章结构指导的中文Web文档自动摘要方法
[J].
论文数:
引用数:
h-index:
机构:
王继成
;
论文数:
引用数:
h-index:
机构:
武港山
;
周源远
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室,南京大学计算机科学与技术系南京,南京
周源远
;
论文数:
引用数:
h-index:
机构:
张福炎
.
计算机研究与发展,
2003,
(03)
:398
-405
←
1
2
→
共 13 条
[1]
基于句子特征和语义距离的文本摘要技术
[J].
论文数:
引用数:
h-index:
机构:
张培颖
.
微计算机应用,
2009,
30
(07)
:14
-18
[2]
基于句子关系图的网页文本主题句抽取
[J].
论文数:
引用数:
h-index:
机构:
何维
;
论文数:
引用数:
h-index:
机构:
王宇
.
现代图书情报技术,
2009,
(03)
:57
-61
[3]
以关键词抽取为核心的文摘句选择策略
[J].
论文数:
引用数:
h-index:
机构:
马亮
;
论文数:
引用数:
h-index:
机构:
何婷婷
;
论文数:
引用数:
h-index:
机构:
李芳
;
论文数:
引用数:
h-index:
机构:
陈劲光
;
论文数:
引用数:
h-index:
机构:
邵伟
.
中文信息学报,
2008,
22
(06)
:50
-54
[4]
文本线性分割方法的研究
[J].
论文数:
引用数:
h-index:
机构:
刘娜
;
论文数:
引用数:
h-index:
机构:
唐焕玲
;
论文数:
引用数:
h-index:
机构:
鲁明羽
.
计算机工程与应用,
2008,
(21)
:212
-216
[5]
一种基于文本关系图的多文档自动摘要技术
[J].
论文数:
引用数:
h-index:
机构:
马慧芳
;
论文数:
引用数:
h-index:
机构:
祁云平
;
论文数:
引用数:
h-index:
机构:
杨小东
.
情报杂志 ,
2007,
(03)
:67
-69
[6]
基于综合方法的文本主题句的自动抽取
[J].
张云涛
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学网络信息中心
上海交通大学网络信息中心
张云涛
;
论文数:
引用数:
h-index:
机构:
龚玲
;
论文数:
引用数:
h-index:
机构:
王永成
.
上海交通大学学报,
2006,
(05)
:771
-774+782
[7]
基于连续段落相似度的主题划分算法
[J].
傅间莲
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华大学计算机科学与技术系智能技术与系统国家重点实验室北京,北京
傅间莲
;
论文数:
引用数:
h-index:
机构:
陈群秀
.
计算机应用,
2005,
(09)
:2022
-2024
[8]
文本的图表示初探
[J].
周昭涛
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
周昭涛
;
卜东波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
卜东波
;
程学旗
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
程学旗
.
中文信息学报,
2005,
(02)
:36
-43
[9]
一种基于字同现频率的汉语文本主题抽取方法
[J].
论文数:
引用数:
h-index:
机构:
马颖华
;
论文数:
引用数:
h-index:
机构:
王永成
;
论文数:
引用数:
h-index:
机构:
苏贵洋
;
张宇萌
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海,上海
张宇萌
.
计算机研究与发展,
2003,
(06)
:874
-878
[10]
一种篇章结构指导的中文Web文档自动摘要方法
[J].
论文数:
引用数:
h-index:
机构:
王继成
;
论文数:
引用数:
h-index:
机构:
武港山
;
周源远
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学软件新技术国家重点实验室,南京大学计算机科学与技术系南京,南京
周源远
;
论文数:
引用数:
h-index:
机构:
张福炎
.
计算机研究与发展,
2003,
(03)
:398
-405
←
1
2
→