基于改进的隐马尔科夫模型的词性标注方法

被引:15
作者
袁里驰
机构
[1] 江西财经大学信息学院数据与知识工程江西省重点实验室
关键词
隐马尔可夫模型; 马尔可夫族模型; 词性标注; Viterbi算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验。实验结果表明:与条件独立性假设相比,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程;在相同的测试条件下,马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。
引用
收藏
页码:3053 / 3057
页数:5
相关论文
共 12 条
[1]   基于条件随机场的汉语词性标注 [J].
于江德 ;
葛彦强 ;
余正涛 .
微电子学与计算机, 2011, 28 (10) :63-66
[2]   低频词的中文词性标注研究 [J].
仲其智 ;
姚建民 .
计算机应用与软件, 2011, 28 (03) :182-185
[3]   基于无向图序列标注模型的中文分词词性标注一体化系统 [J].
朱聪慧 ;
赵铁军 ;
郑德权 .
电子与信息学报, 2010, 32 (03) :700-704
[4]   中文分词和词性标注模型 [J].
刘遥峰 ;
王志良 ;
王传经 .
计算机工程, 2010, 36 (04) :17-19
[5]   SSD模型及其在汉语词性标注中的应用 [J].
邢富坤 ;
宋柔 ;
罗智勇 .
中文信息学报, 2010, (01) :20-24
[7]   基于实例的中文分词-词性标注方法的应用研究 [J].
姜涛 ;
姚天顺 ;
张俐 .
小型微型计算机系统, 2007, (11) :2090-2093
[8]   基于改进的隐马尔科夫模型的汉语词性标注 [J].
王敏 ;
郑家恒 .
计算机应用, 2006, (S2) :197-198+207
[9]   融合聚类触发对特征的最大熵词性标注模型 [J].
赵岩 ;
王晓龙 ;
刘秉权 ;
关毅 .
计算机研究与发展, 2006, (02) :268-274
[10]   基于完全二阶隐马尔可夫模型的汉语词性标注 [J].
梁以敏 ;
黄德根 .
计算机工程, 2005, (10) :177-179