基于特征的汉语词性标注模型

被引:6
作者
屈刚
陆汝占
机构
[1] 上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海
关键词
词性标注; 马尔可夫过程; 特征;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
在隐马尔可夫模型的基础上提出了基于词汇特征的汉语词性标注模型 此模型不但考虑系统t时刻的状态 (词类 )对t+1时刻的状态的影响 ,还把t时刻的观察 (词 )对t+1时刻的状态的影响考虑进去 ,使模型更加精确 由于观察的数目较大 ,构造观察 状态转移概率矩阵的方法难以实用 ,于是给观察标以特征 ,并训练特征 状态转移概率矩阵 ,使概率矩阵占用较少的存储空间 ,实现了模型的精确和实用性的统一
引用
收藏
页码:556 / 561
页数:6
相关论文
共 2 条
[1]  
计算语言学导论[M]. 中国社会科学出版社 , 翁富良, 1998
[2]  
Class-based ngram models of natural language .2 R F Brown,V J Della-Pietray,P V deSousa et al. Computational Linguistics . 1992