汉语词性标注排歧方法探讨

被引:7
作者
王素格
张永奎
不详
机构
[1] 山西大学计算机科学系!太原
关键词
词性标注; 同现概率矩阵; 语料库; 统计模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文将概率统计的二元模型与三元模型用于汉语词性自动标注,在算法为线性阶的时间复杂度的情况下,对20万训练集和1万的测试集,分别进行封闭测试和开放测试,对稀疏矩阵零元素及词性标注的结果做了统计分析。
引用
收藏
页码:70 / 72
页数:3
相关论文
共 1 条
[1]   基于语料库和面向统计学的自然语言处理技术 [J].
周强 .
计算机科学, 1995, (04) :36-40