统计与规则并举的汉语词性自动标注算法

被引:50
作者
张民
李生
赵铁军
张艳风
机构
[1] 哈尔滨工业大学计算机科学与工程系
关键词
汉语; 词性标注; 隐马尔可夫模型; 规则; 置信区间;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
本文提出并实现了一种基于定量统计分析优先的统计和规则并举的汉语词性自动标注算法.本算法引入置信区间的概念,优先采用高准确率的定量统计分析技术,然后利用规则标注剩余语料和校正部分统计标注错误.封闭和开放测试表明,在未考虑生词和汉语词错误切分的情况下,本算法的准确率为98.9%和98.1%.
引用
收藏
页数:5
相关论文
empty
未找到相关数据