基于LM算法的领域概念实体属性关系抽取

被引:13
作者
刘丽佳 [1 ,2 ]
郭剑毅 [1 ,2 ]
周兰江 [1 ,2 ]
余正涛 [1 ,2 ]
邵发 [1 ,2 ]
张金鹏 [1 ,2 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 昆明理工大学智能信息处理重点实验室
关键词
BP神经网络; LM算法; 属性关系抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对非结构化自由文本中关系模式比较复杂,关系抽取性能不高的问题,该文提出了利用BP神经网络的优化算法-LM算法,对非结构化自由文本信息中的领域概念实体属性关系进行抽取。首先对语料进行预处理,然后利用CRFs模型对领域概念的实例、属性和属性值进行实体识别,然后根据领域中各类关系的特点分别进行特征提取,构造BP神经网络模型,利用LM算法抽取相应关系。和适用于二分类问题的SVM相比,人工神经网络优化算法自主学习能力强,识别精度高,更适用于多分类的问题。通过几组实验表明,该方法在领域概念实体属性关系抽取方面取得了良好的效果,F值提高了12.8%。
引用
收藏
页码:216 / 222
页数:7
相关论文
共 9 条
[1]
基于弱监督的属性关系抽取方法 [J].
杨宇飞 ;
戴齐 ;
贾真 ;
尹红风 .
计算机应用, 2014, 34 (01) :64-68
[2]
网页中商品“属性—值”关系的自动抽取方法研究 [J].
唐伟 ;
洪宇 ;
冯艳卉 ;
姚建民 ;
朱巧明 .
中文信息学报, 2013, (01) :21-29+38
[3]
未定义类型的关系抽取的半监督学习框架研究 [J].
程显毅 ;
朱倩 .
南京大学学报(自然科学版), 2012, 48 (04) :466-474
[4]
基于并列结构的概念实例和属性的同步提取方法 [J].
李文杰 ;
穗志方 .
中文信息学报, 2012, (02) :82-87
[5]
一种基于遗传算法和LM算法的混合学习算法 [J].
张长胜 ;
欧阳丹彤 ;
岳娜 ;
张永刚 .
吉林大学学报(理学版), 2008, (04) :675-680
[6]
中文实体关系抽取中的特征选择研究 [J].
董静 ;
孙乐 ;
冯元勇 ;
黄瑞红 .
中文信息学报, 2007, (04) :80-85+91
[7]
基于L-M算法的BP神经网络分类器 [J].
王建梅 ;
覃文忠 .
武汉大学学报(信息科学版), 2005, (10) :928-931
[8]
实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[9]
A methodology to learn ontological attributes from the Web [J].
Sanchez, David .
DATA & KNOWLEDGE ENGINEERING, 2010, 69 (06) :573-597