基于条件随机场的汉语词性标注

被引:6
作者
于江德 [1 ]
葛彦强 [1 ]
余正涛 [2 ]
机构
[1] 安阳师范学院计算机与信息工程学院
[2] 昆明理工大学信息工程与自动化学院
关键词
汉语词性标注; 条件随机场; 上下文; 特征模板集; 上下文特征;
D O I
10.19304/j.cnki.issn1000-7180.2011.10.017
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
近年来条件随机场广泛应用于各类序列数据标注中,汉语词性标注中应用条件随机场对上下文建模时会扩展出数以亿计的特征,在深入分析特征产生机理的基础上对特征模板集进行了优化,采用条件随机场进一步研究了汉语词性标注中设定的特征模板集、扩展出的特征数、训练后模型大小、词性标注精度等指标之间的关系.实验结果表明,优化后的特征模板集在模型训练时间、训练后模型大小、标注精度等指标上达到了整体最优.
引用
收藏
页码:63 / 66
页数:4
相关论文
共 6 条
[1]   基于字的词位标注汉语分词 [J].
于江德 ;
睢丹 ;
樊孝忠 .
山东大学学报(工学版), 2010, 40 (05) :117-122
[2]   基于条件随机场的古汉语词义消歧研究 [J].
于丽丽 ;
丁德鑫 ;
曲维光 ;
陈小荷 ;
李惠 .
微电子学与计算机, 2009, 26 (10) :45-48
[3]   基于多知识源的中文词法分析系统 [J].
姜维 ;
王晓龙 ;
关毅 ;
赵健 .
计算机学报, 2007, (01) :137-145
[4]   基于条件随机场(CRFs)的中文词性标注方法 [J].
洪铭材 ;
张阔 ;
唐杰 ;
李涓子 .
计算机科学, 2006, (10) :148-151+155
[5]   基于条件随机域的复杂最长名词短语识别 [J].
冯冲 ;
陈肇雄 ;
黄河燕 ;
张亮 ;
王江伟 .
小型微型计算机系统, 2006, (06) :1134-1139
[6]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809