汉语基本块描述体系

被引:25
作者
周强
机构
[1] 清华信息科学与技术国家实验室计算机科学与人工智能研究部
关键词
计算机应用; 中文信息处理; 基本块; 部分分析; 语料库标注; 词汇知识获取;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
块分析是自然语言处理研究中的重要技术,其处理基础是设计一套合理有效的块描述体系。本文在吸收和总结前人研究成果和经验的基础上,提出了一套基于拓扑结构的汉语基本块描述体系。它通过引入词汇关联信息确定基本拓扑结构,形成了很好的基本块内聚性判定准则,建立了句法形式与语义内容的有机联系桥梁。这套描述体系大大简化了从现有的句法树库TCT中自动提取基本块标注语料库和相关词汇关联知识库的处理过程,为进一步进行汉语基本块自动分析和词汇关联知识获取互动进化研究打下了很好的基础。
引用
收藏
页码:21 / 27
页数:7
相关论文
共 3 条