面向企业知识图谱构建的中文实体关系抽取

被引:38
作者
孙晨
付英男
程文亮
钱卫宁
机构
[1] 华东师范大学数据科学与工程学院
基金
国家重点研发计划;
关键词
企业知识图谱; 实体关系抽取; 最大熵模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
企业知识图谱是针对金融领域为描述企业间商业往来关系而构建的一类垂直领域知识库.尽管垂直领域知识图谱在领域覆盖的广度上不如开放知识图谱,但是它对知识准确率的要求却远远高于开放知识图谱,因此虽然近些年开放知识图谱取得了很大的进展,但在垂直领域中却并未得到深入应用,尤其是商业领域,其对企业知识图谱提出了很大的需求.针对企业知识图谱目前在关系抽取效果上的局限性,在分析了实体关系抽取研究现状的基础上,提出了一种基于分类的中文实体关系抽取方法.该方法使用最大熵模型,通过对上市公司公报数据进行实验分析,从而寻找到该关系抽取的最优特征模板,并使在企业公报这一数据集上的准确率普遍达到85%以上.
引用
收藏
页码:55 / 66
页数:12
相关论文
共 4 条
[1]
基于句法语义特征的中文实体关系抽取 [J].
郭喜跃 ;
何婷婷 ;
胡小华 ;
陈前军 .
中文信息学报, 2014, (06) :183-189
[2]
基于句法结构特征分析及分类技术的答案提取算法 [J].
胡宝顺 ;
王大玲 ;
于戈 ;
马婷 .
计算机学报, 2008, (04) :662-676
[3]
条件随机场模型研究及应用 [D]. 
薛俊欣 .
山东大学,
2014
[4]
基于朴素贝叶斯方法的中文文本分类研究 [D]. 
李丹 .
河北大学,
2011