共 4 条
汉语文本形式结构分析及其标引算法
被引:3
作者:
单永明
机构:
[1] 山西大学计算机科学系太原
来源:
关键词:
中文信息处理;
文本结构分析;
标引树;
自动标引算法;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
本文从形式化的角度讨论了汉语文本的形式结构及有关的基本概念 ,给出了文本的标题、子标题、段落及其层次结构的一种划分与标记方法 ,提出了规范的与准规范的文本等概念 ,并以此为基础讨论了文本形式结构的标引问题 ,给出了两个标引算法。本文阐明的方法和结果对汉语文本的全文文本标引及结构化分析具有直接的现实意义
引用
收藏
页码:14 / 19+26
+26
页数:7
相关论文