汉语概率型上下文无关语法的自动推导

被引:7
作者
周强
黄昌宁
机构
[1] 北京智能技术与系统国家重点实验室!北京
[2] 清华大学计算机科学与技术系!北京
基金
中国博士后科学基金;
关键词
概率型上下文无关语法; 期望-最大算法; 语法推导;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文提出了一种汉语概率型上下文无关语法(PCFG)的自动推导方法,它在匹配分析机制上实现了无指导的EM迭代训练算法,并通过对训练语料的自动短语界定预处理以及在集成不同知识源基础上构造合适的初始规则集,保证了训练算法能迅速收敛于符合语言事实的规则概率分布状态.初步的实验结果显示出目前的算法在训练效率和训练结果可信度方面都是令人满意的.
引用
收藏
页码:385 / 392
页数:8
相关论文
共 2 条
  • [1] 汉语短语标注标记集的确定
    周强,俞士汶
    [J]. 中文信息学报, 1996, (04) : 1 - 11
  • [2] The estimation of stochastic context-free grammars using the inside-outside algorithm .2 Lari K,Young S J. Computer Speech and Language . 1990