学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
面向自动文摘的文本结构划分
被引:6
作者
:
论文数:
引用数:
h-index:
机构:
朱荷香
[
1
]
论文数:
引用数:
h-index:
机构:
曲维光
[
1
]
论文数:
引用数:
h-index:
机构:
卢俊之
[
2
]
论文数:
引用数:
h-index:
机构:
李素建
[
3
]
论文数:
引用数:
h-index:
机构:
邵艳秋
[
3
]
机构
:
[1]
南京师范大学计算机科学系
[2]
南京师范大学文学院
[3]
北京大学计算语言研究所
来源
:
南京大学学报(自然科学版)
|
2008年
/ 02期
关键词
:
文本结构;
自动文摘;
向量空间模型;
段落相似度;
意义段划分;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
引用
收藏
页码:204 / 211
页数:8
相关论文
共 12 条
[1]
Automatic text structuring and summarization
[J].
论文数:
引用数:
h-index:
机构:
Salton, G
;
Singhal, A
论文数:
0
引用数:
0
h-index:
0
机构:
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
Singhal, A
;
Mitra, M
论文数:
0
引用数:
0
h-index:
0
机构:
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
Mitra, M
;
Buckley, C
论文数:
0
引用数:
0
h-index:
0
机构:
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
Buckley, C
.
INFORMATION PROCESSING & MANAGEMENT,
1997,
33
(02)
:193
-207
[2]
利用分割技术提高对话文本自动摘要的一致性
[J].
刘传汉
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
刘传汉
;
论文数:
引用数:
h-index:
机构:
王永成
;
刘德荣
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
刘德荣
;
王志琪
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
王志琪
.
上海交通大学学报,
2007,
(08)
:1292
-1296+1300
[3]
计算机对文章意义段划分的研究
[J].
刘美茹
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨铁道职业技术学院基础部
刘美茹
.
计算机工程,
2007,
(13)
:205
-206
[4]
基于小世界模型的中文文本主题分析
[J].
论文数:
引用数:
h-index:
机构:
石晶
;
论文数:
引用数:
h-index:
机构:
胡明
;
论文数:
引用数:
h-index:
机构:
戴国忠
.
中文信息学报,
2007,
(03)
:69
-75
[5]
基于多元判别分析的文本分割模型
[J].
论文数:
引用数:
h-index:
机构:
朱靖波
;
论文数:
引用数:
h-index:
机构:
叶娜
;
罗海涛
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
罗海涛
.
软件学报,
2007,
(03)
:555
-564
[6]
基于滑动窗口的动态摘要算法
[J].
蔡建山
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
蔡建山
;
迟呈英
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
迟呈英
;
战学刚
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
战学刚
;
王丫
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
王丫
.
计算机工程,
2007,
(06)
:213
-215+238
[7]
高校思想政治理论课教师应如何迎接新课程的改革
[J].
论文数:
引用数:
h-index:
机构:
陈文珍
.
清华大学学报(哲学社会科学版),
2006,
(哲学社会科学版)
:91
-94
[8]
文本分割综述
[J].
论文数:
引用数:
h-index:
机构:
石晶
.
计算机工程与应用 ,
2006,
(35)
:155
-159+171
[9]
自动文摘系统中的主题划分问题研究
[J].
傅间莲
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系智能技术与系统国家重点实验室,清华大学计算机系智能技术与系统国家重点实验室北京,北京
傅间莲
;
论文数:
引用数:
h-index:
机构:
陈群秀
.
中文信息学报,
2005,
(06)
[10]
基于连续段落相似度的主题划分算法
[J].
傅间莲
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华大学计算机科学与技术系智能技术与系统国家重点实验室北京,北京
傅间莲
;
论文数:
引用数:
h-index:
机构:
陈群秀
.
计算机应用,
2005,
(09)
:2022
-2024
←
1
2
→
共 12 条
[1]
Automatic text structuring and summarization
[J].
论文数:
引用数:
h-index:
机构:
Salton, G
;
Singhal, A
论文数:
0
引用数:
0
h-index:
0
机构:
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
Singhal, A
;
Mitra, M
论文数:
0
引用数:
0
h-index:
0
机构:
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
Mitra, M
;
Buckley, C
论文数:
0
引用数:
0
h-index:
0
机构:
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
CORNELL UNIV,DEPT COMP SCI,ITHACA,NY 14853
Buckley, C
.
INFORMATION PROCESSING & MANAGEMENT,
1997,
33
(02)
:193
-207
[2]
利用分割技术提高对话文本自动摘要的一致性
[J].
刘传汉
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
刘传汉
;
论文数:
引用数:
h-index:
机构:
王永成
;
刘德荣
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
刘德荣
;
王志琪
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机科学与工程系
王志琪
.
上海交通大学学报,
2007,
(08)
:1292
-1296+1300
[3]
计算机对文章意义段划分的研究
[J].
刘美茹
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨铁道职业技术学院基础部
刘美茹
.
计算机工程,
2007,
(13)
:205
-206
[4]
基于小世界模型的中文文本主题分析
[J].
论文数:
引用数:
h-index:
机构:
石晶
;
论文数:
引用数:
h-index:
机构:
胡明
;
论文数:
引用数:
h-index:
机构:
戴国忠
.
中文信息学报,
2007,
(03)
:69
-75
[5]
基于多元判别分析的文本分割模型
[J].
论文数:
引用数:
h-index:
机构:
朱靖波
;
论文数:
引用数:
h-index:
机构:
叶娜
;
罗海涛
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学计算机软件研究所
罗海涛
.
软件学报,
2007,
(03)
:555
-564
[6]
基于滑动窗口的动态摘要算法
[J].
蔡建山
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
蔡建山
;
迟呈英
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
迟呈英
;
战学刚
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
战学刚
;
王丫
论文数:
0
引用数:
0
h-index:
0
机构:
鞍山科技大学计算机科学与技术学院
王丫
.
计算机工程,
2007,
(06)
:213
-215+238
[7]
高校思想政治理论课教师应如何迎接新课程的改革
[J].
论文数:
引用数:
h-index:
机构:
陈文珍
.
清华大学学报(哲学社会科学版),
2006,
(哲学社会科学版)
:91
-94
[8]
文本分割综述
[J].
论文数:
引用数:
h-index:
机构:
石晶
.
计算机工程与应用 ,
2006,
(35)
:155
-159+171
[9]
自动文摘系统中的主题划分问题研究
[J].
傅间莲
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机系智能技术与系统国家重点实验室,清华大学计算机系智能技术与系统国家重点实验室北京,北京
傅间莲
;
论文数:
引用数:
h-index:
机构:
陈群秀
.
中文信息学报,
2005,
(06)
[10]
基于连续段落相似度的主题划分算法
[J].
傅间莲
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室,清华大学计算机科学与技术系智能技术与系统国家重点实验室北京,北京
傅间莲
;
论文数:
引用数:
h-index:
机构:
陈群秀
.
计算机应用,
2005,
(09)
:2022
-2024
←
1
2
→