共 6 条
基于条件随机场的汉语词性标注
被引:6
作者:
于江德
[1
]
葛彦强
[1
]
余正涛
[2
]
机构:
[1] 安阳师范学院计算机与信息工程学院
[2] 昆明理工大学信息工程与自动化学院
来源:
关键词:
汉语词性标注;
条件随机场;
上下文;
特征模板集;
上下文特征;
D O I:
10.19304/j.cnki.issn1000-7180.2011.10.017
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
近年来条件随机场广泛应用于各类序列数据标注中,汉语词性标注中应用条件随机场对上下文建模时会扩展出数以亿计的特征,在深入分析特征产生机理的基础上对特征模板集进行了优化,采用条件随机场进一步研究了汉语词性标注中设定的特征模板集、扩展出的特征数、训练后模型大小、词性标注精度等指标之间的关系.实验结果表明,优化后的特征模板集在模型训练时间、训练后模型大小、标注精度等指标上达到了整体最优.
引用
收藏
页码:63 / 66
页数:4
相关论文