SSD模型及其在汉语词性标注中的应用

被引：4

作者：

邢富坤 ^{[1
,2
]}

宋柔 ^{[1
]}

罗智勇 ^{[1
]}

机构：

[1] 北京语言大学语言信息处理研究所

[2] 解放军外国语学院

来源：

中文信息学报 | 2010年 / 01期

关键词：

计算机应用; 中文信息处理; SSD模型; HMM; 词性标注;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

该文提出了一种以符号解码与数值解码并举的SSD(Symbol-and-Statistics Decoding Model)模型,该模型被用于汉语词性标注任务,其标注正确率在封闭测试中达到97.08%,开放测试中达到95.67%,较二阶HMM的95.56%和94.70%都有较为显著提高。SSD模型的正确率虽然不及最大熵模型和CRF模型,但它的训练时间远少于后者,说明SSD模型在处理自然语言中的特定任务时是一种较强的实用模型。

引用

页码：20 / 24

页数：5

共 5 条

[1] 基于条件随机场(CRFs)的中文词性标注方法 [J].