汉语文本形式结构分析及其标引算法

被引:3
作者
单永明
机构
[1] 山西大学计算机科学系太原
关键词
中文信息处理; 文本结构分析; 标引树; 自动标引算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念 ,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法 ,提出了规范的与准规范的文本等概念 ,并以此为基础讨论了文本形式结构的标引问题 ,给出了两个标引算法。本文阐明的方法和结果对汉语文本的全文文本标引及结构化分析具有直接的现实意义
引用
收藏
页码:14 / 19+26 +26
页数:7
相关论文
共 4 条
[1]   基于潜在语义索引的文本分析方法 [J].
林鸿飞 ;
战学刚 ;
姚天顺 .
模式识别与人工智能, 2000, 13 (01) :47-51
[2]   一类规范文本篇章结构的自动标引 [J].
单永明 .
中文信息学报, 1998, (04) :48-53
[3]   基于关系图的篇章分析方法 [J].
韦雄观 ;
吴立德 ;
王文欣 .
模式识别与人工智能, 1997, 10 (02) :112-117
[4]   自然语言篇章理解及基于理解的自动文摘研究 [J].
王建波 ;
王开铸 .
中文信息学报, 1992, (02) :1-7