汉语功能块自动分析

被引:13
作者
周强
赵颖泽
机构
[1] 清华大学计算机系智能技术与系统国家重点实验室
关键词
计算机应用; 中文信息处理; 汉语功能块; 边界识别模型; 序列标记模型; 模型融合;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
汉语功能块描述了句子的基本骨架,是联结句法结构和语义描述的重要桥梁。本文提出了两种不同功能块分析模型:边界识别模型和序列标记模型,并使用不同的机器学习方法进行了计算模拟。通过两种模型分析结果的有机融合,充分利用了两者分析结果的互补性,对汉语句子的主谓宾状四个典型功能块的自动识别性能达到了80%以上。实验结果显示,基于局部词汇语境机器学习算法可以从不同侧面准确识别出大部分功能块,句子中复杂从句和多动词连用结构等是主要的识别难点。
引用
收藏
页码:18 / 24
页数:7
相关论文
共 1 条
  • [1] 自然语言理解与机器翻译.[M].黄昌宁;张普主编;.清华大学出版社.2001,