基于含边界词性特征的中文命名实体识别

被引:7
作者
邱莎 [1 ,2 ]
王付艳 [1 ]
申浩如 [1 ]
段玻 [1 ]
阿圆 [1 ]
丁海燕 [3 ]
机构
[1] 昆明学院信息技术学院
[2] 复旦大学计算机科学技术学院
[3] 云南大学信息学院
关键词
中文命名实体识别; 条件随机场; 特征模板; 词性; 词边界; 标注集;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
根据词性在任务中可能出现的特征表达,在字粒度一级,基于条件随机场模型,对词性特征在中文命名实体识别任务中的应用进行研究,提出一种将词性和词边界合成为一个特征项的方法。在相同实验环境下针对多种词性特征的应用情况,采用序列标注的方式在公共语料上进行多次中文命名实体识别实验。通过对多次实验结果的比较分析得出,二级词性与词边界合成的特征在系统执行性能和识别效果等方面均为最优。
引用
收藏
页码:128 / 130
页数:3
相关论文
共 5 条