基于篇章结构的文本自动标引算法

被引:7
作者
张美娜
迟呈英
战学刚
亓超
机构
[1] 辽宁科技大学计算机科学与工程学院
关键词
篇章结构; 文本结构树; 标引算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
通过对输入文本分析,划分文本的篇章结构,分为依次存在包含关系的全文章节、段落、复句、分句五个层次,用文本结构树来表示。给出了标记方法,并在此基础上讨论并实现了文本篇章结构的自动标引,提出了两个标引算法并给出了比较结果,为自动文摘后续工作给予了很大帮助。
引用
收藏
页码:122 / 124
页数:3
相关论文
共 7 条
[1]   汉语文本形式结构分析及其标引算法 [J].
单永明 .
中文信息学报, 2002, (02) :14-19+26
[2]   一种混合型的汉语篇章结构自动分析方法 [J].
张益民 ;
陆汝占 ;
沈李斌 .
软件学报, 2000, (11) :1527-1533
[3]   基于潜在语义索引的文本分析方法 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
模式识别与人工智能, 2000, 13 (01) :47-51
[4]   基于篇章多级依存结构的自动文摘研究 [J].
刘挺 ;
王开铸 ;
不详 .
计算机研究与发展 , 1999, (04) :96-105
[5]   建立现代汉语依存关系的层次体系 [J].
刘伟权,王明会,钟义信 .
中文信息学报, 1996, (02) :32-46
[6]   自然语言篇章理解及基于理解的自动文摘研究 [J].
王建波 ;
王开铸 .
中文信息学报, 1992, (02) :1-7
[7]   Automatic text structuring and summarization [J].
Salton, G ;
Singhal, A ;
Mitra, M ;
Buckley, C .
INFORMATION PROCESSING & MANAGEMENT, 1997, 33 (02) :193-207