共 7 条
一种多知识源汉语语言模型的研究与实现
被引:7
作者:
刘秉权
王晓龙
王宇颖
机构:
[1] 哈尔滨工业大学计算机科学与工程系
来源:
关键词:
语言模型;
N-gram;
音字转换;
规则矩阵;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对汉语语言模型中知识获取不足的问题 ,提出了一种统计与多种形式规则信息结合的机制 ,将规则的表示量化 ,提出语法语义规则矩阵的概念 ,通过扩充词网格、对基于最大可能性的 n元概率值合理调整 ,将短语构成规则、二元语法语义规则、最少分词原则等融入统计模型框架 ,构成多知识源语言模型 ,模型应用于智能拼音汉字转换系统 ,明显提高了音字转换正确率 ,并适于处理长距离和递归语言现象
引用
收藏
页码:231 / 235
页数:5
相关论文