SSD模型及其在汉语词性标注中的应用

被引:4
作者
邢富坤 [1 ,2 ]
宋柔 [1 ]
罗智勇 [1 ]
机构
[1] 北京语言大学语言信息处理研究所
[2] 解放军外国语学院
关键词
计算机应用; 中文信息处理; SSD模型; HMM; 词性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
该文提出了一种以符号解码与数值解码并举的SSD(Symbol-and-Statistics Decoding Model)模型,该模型被用于汉语词性标注任务,其标注正确率在封闭测试中达到97.08%,开放测试中达到95.67%,较二阶HMM的95.56%和94.70%都有较为显著提高。SSD模型的正确率虽然不及最大熵模型和CRF模型,但它的训练时间远少于后者,说明SSD模型在处理自然语言中的特定任务时是一种较强的实用模型。
引用
收藏
页码:20 / 24
页数:5
相关论文
共 5 条
[1]   基于条件随机场(CRFs)的中文词性标注方法 [J].
洪铭材 ;
张阔 ;
唐杰 ;
李涓子 .
计算机科学, 2006, (10) :148-151+155
[2]   基于条件随机域的词性标注模型 [J].
姜维 ;
关毅 ;
王晓龙 .
计算机工程与应用 , 2006, (21) :13-16+42
[3]   基于完全二阶隐马尔可夫模型的汉语词性标注 [J].
梁以敏 ;
黄德根 .
计算机工程, 2005, (10) :177-179
[4]   一个改进的汉语词性标注系统 [J].
屈刚 ;
陆汝占 .
上海交通大学学报, 2003, (06) :897-900
[5]   北京大学现代汉语语料库基本加工规范(续) [J].
俞士汶 ;
段慧明 ;
朱学锋 ;
孙斌 .
中文信息学报, 2002, (06) :58-64