面向自动文摘的文本结构划分

被引:6
作者
朱荷香 [1 ]
曲维光 [1 ]
卢俊之 [2 ]
李素建 [3 ]
邵艳秋 [3 ]
机构
[1] 南京师范大学计算机科学系
[2] 南京师范大学文学院
[3] 北京大学计算语言研究所
关键词
文本结构; 自动文摘; 向量空间模型; 段落相似度; 意义段划分;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
引用
收藏
页码:204 / 211
页数:8
相关论文
共 12 条
[1]
Automatic text structuring and summarization [J].
Salton, G ;
Singhal, A ;
Mitra, M ;
Buckley, C .
INFORMATION PROCESSING & MANAGEMENT, 1997, 33 (02) :193-207
[2]
利用分割技术提高对话文本自动摘要的一致性 [J].
刘传汉 ;
王永成 ;
刘德荣 ;
王志琪 .
上海交通大学学报, 2007, (08) :1292-1296+1300
[3]
计算机对文章意义段划分的研究 [J].
刘美茹 .
计算机工程, 2007, (13) :205-206
[4]
基于小世界模型的中文文本主题分析 [J].
石晶 ;
胡明 ;
戴国忠 .
中文信息学报, 2007, (03) :69-75
[5]
基于多元判别分析的文本分割模型 [J].
朱靖波 ;
叶娜 ;
罗海涛 .
软件学报, 2007, (03) :555-564
[6]
基于滑动窗口的动态摘要算法 [J].
蔡建山 ;
迟呈英 ;
战学刚 ;
王丫 .
计算机工程, 2007, (06) :213-215+238
[8]
文本分割综述 [J].
石晶 .
计算机工程与应用 , 2006, (35) :155-159+171
[9]
自动文摘系统中的主题划分问题研究 [J].
傅间莲 ;
陈群秀 .
中文信息学报, 2005, (06)
[10]
基于连续段落相似度的主题划分算法 [J].
傅间莲 ;
陈群秀 .
计算机应用, 2005, (09) :2022-2024