学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
中文命名实体识别模型对比分析
被引:11
作者
:
论文数:
引用数:
h-index:
机构:
祖木然提古丽库尔班
[
1
]
论文数:
引用数:
h-index:
机构:
艾山吾买尔
[
2
]
机构
:
[1]
新疆大学信息科学与工程学院
[2]
新疆多语种信息技术重点实验室
来源
:
现代计算机
|
2019年
/ 14期
关键词
:
命名实体识别;
双向长短时记忆循环神经网络(BiLSTM);
语言技术平台(LTP);
CoreNLP;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
为了比较客观了解现有主要中文命名实体识别系统与开源系统的性能,基于字的双向长短时记忆循环神经网络(BiLSTM)接入条件随机场(CRF)的系统,利用微软亚洲研究院的MSRA数据集实现中文命名实体识别模型,然后使用MSRA测试数据对自建模型、哈工大的语言技术平台(LTP)和斯坦福大学CoreNLP自然语言处理工具进行对比测试与分析。实验表明:BiLSTM对地名实体的识别效果最佳,与地名和人名相比机构名识别效果与开源工具保持同等水平。实验在语料规模以及实验设计方面有提升空间。后续将实验模型作为重点,将特定领域实体与序列标注问题相结合进行开展研究。
引用
收藏
页码:3 / 7
页数:5
相关论文
共 5 条
[1]
基于CNN-BLSTM-CRF模型的生物医学命名实体识别
李丽双
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与技术学院
李丽双
论文数:
引用数:
h-index:
机构:
郭元凯
[J].
中文信息学报,
2018,
32
(01)
: 116
-
122
[2]
基于BLSTM的命名实体识别方法
冯艳红
论文数:
0
引用数:
0
h-index:
0
机构:
大连海洋大学信息工程学院
大连海洋大学辽宁省海洋信息技术重点实验室
大连海洋大学信息工程学院
冯艳红
于红
论文数:
0
引用数:
0
h-index:
0
机构:
大连海洋大学信息工程学院
大连海洋大学辽宁省海洋信息技术重点实验室
大连海洋大学信息工程学院
于红
论文数:
引用数:
h-index:
机构:
孙庚
论文数:
引用数:
h-index:
机构:
孙娟娟
[J].
计算机科学,
2018,
45
(02)
: 261
-
268
[3]
先秦古汉语典籍中的人名自动识别研究
论文数:
引用数:
h-index:
机构:
汤亚芬
[J].
现代图书情报技术,
2013,
(Z1)
: 63
-
68
[4]
基于层叠条件随机场模型的中文机构名自动识别
周俊生
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
周俊生
戴新宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
戴新宇
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
电子学报,
2006,
(05)
: 804
-
809
[5]
Recognizing Unregistered Names for Mandarin Word Identification .2 Wang L J,Chang H,Chang C. Conference on Computational Linguistics . 1992
←
1
→
共 5 条
[1]
基于CNN-BLSTM-CRF模型的生物医学命名实体识别
李丽双
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与技术学院
李丽双
论文数:
引用数:
h-index:
机构:
郭元凯
[J].
中文信息学报,
2018,
32
(01)
: 116
-
122
[2]
基于BLSTM的命名实体识别方法
冯艳红
论文数:
0
引用数:
0
h-index:
0
机构:
大连海洋大学信息工程学院
大连海洋大学辽宁省海洋信息技术重点实验室
大连海洋大学信息工程学院
冯艳红
于红
论文数:
0
引用数:
0
h-index:
0
机构:
大连海洋大学信息工程学院
大连海洋大学辽宁省海洋信息技术重点实验室
大连海洋大学信息工程学院
于红
论文数:
引用数:
h-index:
机构:
孙庚
论文数:
引用数:
h-index:
机构:
孙娟娟
[J].
计算机科学,
2018,
45
(02)
: 261
-
268
[3]
先秦古汉语典籍中的人名自动识别研究
论文数:
引用数:
h-index:
机构:
汤亚芬
[J].
现代图书情报技术,
2013,
(Z1)
: 63
-
68
[4]
基于层叠条件随机场模型的中文机构名自动识别
周俊生
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
周俊生
戴新宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
戴新宇
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
电子学报,
2006,
(05)
: 804
-
809
[5]
Recognizing Unregistered Names for Mandarin Word Identification .2 Wang L J,Chang H,Chang C. Conference on Computational Linguistics . 1992
←
1
→