一种基于单字统计二元文法的自组词音字转换算法

被引:6
作者
赵以宝
孙圣和
机构
[1] 哈尔滨工业大学自动化测试与控制系!哈尔滨
[2] 不详
关键词
音字转换; 二元文法; 自组词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
音字转换在语音识别和汉字语句键盘输入方面都占有很重要的地位.现在比较流行的方法是基于大语料统计的Markov模型的音字转换方法其中基于单字N元文法的音字转换算法具有数据量少、算法简单的优点.但转换准确率却较低;而基于词N元文法的音字转换算法则正好相反本文在基于单字统计Bigram算法的基础上提出了一种自组词的音字转换方法,不仅具有单字Brgram方法的占空间少的优点.而且又可充分利用基于词Bigram算法的优点,实验表明该方法容易实现而且具有较高的转换准确率.
引用
收藏
页码:55 / 59
页数:5
相关论文
共 1 条
  • [1] Markov modeling of Mandarin Chinese for decoding the phonetic sequence into Chinese characters. Gu Huang-yan et al. Computer Speech and Language . 1991