基于联合模型的藏文实体关系抽取方法研究

被引:25
作者
夏天赐 [1 ,2 ]
孙媛 [1 ,2 ]
机构
[1] 中央民族大学信息工程学院
[2] 中央民族大学国家语言资源监测与研究中心少数民族语言分中心
关键词
联合模型; 藏文实体关系; 词性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏、实体识别准确率不高等问题,提出了基于联合模型抽取藏文实体关系的方法。基于藏文实体关系抽取任务,提出以下方案:(1)针对藏文分词准确率不高的问题,对藏文进行字级和词级两种方式进行预处理,并给出对比实验,结果表明采用字级处理方式较词级处理方式效果有所提高。(2)藏文是一种语法规则比较强的语言,名词、格助词等能明确指示句子各组块之间的语法和语义结构关系,因此该文将藏文的词性标注特征加入到藏文的字词向量中,实验结果证明了方法的有效性。(3)该文借鉴了联合模型处理的优势,提出基于联合模型处理方式,采用端到端的BiLSTM框架将藏文实体关系抽取任务转变为藏文序列标注的问题,实验结果表明,该文的方法较传统的基于藏文处理方式,如SVM算法和LR算法,准确率提高了30%~40%。
引用
收藏
页码:76 / 83
页数:8
相关论文
共 8 条
[1]
结合词性特征与卷积神经网络的文本情感分析 [J].
何鸿业 ;
郑瑾 ;
张祖平 .
计算机工程, 2018, 44 (11) :209-214+221
[2]
基于层次特征的藏文人名识别研究 [J].
刘飞飞 ;
王志娟 .
计算机应用研究, 2018, 35 (09) :2583-2587+2596
[3]
面向互联网的藏文实体关系模板获取技术研究 [J].
马宁 ;
李亚超 ;
于槐 ;
加羊吉 .
中央民族大学学报(自然科学版), 2015, 24 (01) :35-39
[4]
基于感知机模型藏文命名实体识别 [J].
华却才让 ;
姜文斌 ;
赵海兴 ;
刘群 .
计算机工程与应用, 2014, 50 (15) :172-176
[5]
藏语命名实体识别研究 [J].
金明 ;
杨欢欢 ;
单广荣 .
西北民族大学学报(自然科学版), 2010, 31 (03) :49-52
[6]
藏族人名汉译名识别研究[J] 罗智勇;宋柔;朱小杰; 情报学报 2009,
[7]
藏语名词语义关系研究 龙从军;周学文; 全国少数民族青年自然语言处理学术研讨会 2008,
[8]
Bidirectional lstm-crf models for sequence tagging Zhiheng Huang;Wei Xu;Kai Yu; ,