一种多知识源汉语语言模型的研究与实现

被引:7
作者
刘秉权
王晓龙
王宇颖
机构
[1] 哈尔滨工业大学计算机科学与工程系
关键词
语言模型; N-gram; 音字转换; 规则矩阵;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对汉语语言模型中知识获取不足的问题 ,提出了一种统计与多种形式规则信息结合的机制 ,将规则的表示量化 ,提出语法语义规则矩阵的概念 ,通过扩充词网格、对基于最大可能性的 n元概率值合理调整 ,将短语构成规则、二元语法语义规则、最少分词原则等融入统计模型框架 ,构成多知识源语言模型 ,模型应用于智能拼音汉字转换系统 ,明显提高了音字转换正确率 ,并适于处理长距离和递归语言现象
引用
收藏
页码:231 / 235
页数:5
相关论文
共 7 条