大标记集汉语字(词)Markov 语言模型的建立

被引:4
作者
王轩
李巍
王晓龙
赵淑香
机构
[1] 哈尔滨工业大学计算机系应用软件教研室
关键词
Markov模型;统计语言模型;
D O I
暂无
中图分类号
TP317 [程序包(应用软件)];
学科分类号
1403 ;
摘要
给出了一种基于快速排序和归并排序的高阶汉语大标记集Markov统计语言模型的统计算法,并对算法的时间复杂性和空间复杂性进行了分析。依据这种统计算法,设计实现了一个汉语字(词)概率统计系统。通过对上千万字的汉语语料的统计,建立起了汉语字(词)一元、二元和三元Markov模型,并对统计结果进行了分析。
引用
收藏
页码:26 / 30
页数:5
相关论文
empty
未找到相关数据