汉语句子的组块分析体系

被引:30
作者
周强
孙茂松
黄昌宁
机构
[1] 清华大学计算机科学与技术系!北京
[2] 清华大学智能技术与系统国家重点实验室!北京
基金
中国博士后科学基金;
关键词
词界块; 成分组; 部分分析; 句法分析;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
介绍了一种描述能力介于线性词序列和完整句法树表示之间的浅层句法知识描述体系——组块分析体系,并详细讨论了其中两大部分:词界块和成分组的基本内容及其自动识别算法.在此基础上,提出了一种分阶段构造汉语树库的新设想,即先构造组块库,再构造树库,进行了一系列句法分析和知识获取实验,包括1)自动识别汉语最长名词短语;2)自动获取汉语句法知识等.所有这些工作都证明了这种知识描述体系的实用性和有效性.
引用
收藏
页码:1158 / 1165
页数:8
相关论文
共 4 条
[1]   汉语概率型上下文无关语法的自动推导 [J].
周强 ;
黄昌宁 .
计算机学报, 1998, (05) :385-392
[2]   汉语树库的构建 [J].
周强 ;
张伟 ;
俞士汶 .
中文信息学报, 1997, (04) :43-52
[3]   汉语短语标注标记集的确定 [J].
周强,俞士汶 .
中文信息学报, 1996, (04) :1-11
[4]  
现代汉语句法结构与分析[M]. 语文出版社 , 吴竞存, 1992