领域本体概念实例、属性和属性值的抽取及关系预测

被引:33
作者
郭剑毅 [1 ,2 ]
李真 [1 ,2 ]
余正涛 [1 ,2 ]
张志坤 [1 ,2 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 昆明理工大学智能信息处理重点实验室
关键词
领域本体; 概念实例抽取; 属性抽取; 属性值抽取; 条件随机场; 支持向量机;
D O I
10.13232/j.cnki.jnju.2012.04.015
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
研究了如何使用协作分类器(协作使用条件随机场(CRFs)和支持向量机(SVM))解决领域概念实例、属性及属性值的抽取以及它们三者之间对应关系预测的问题.首先将概念实例、属性及属性值看作三类实体,把概念实例、属性及属性值的抽取问题转化为命名实体识别问题,利用条件随机场建模进行命名实体识别;在此基础上定义实体间对应关系,对概念实例、属性及属性值三者的对应关系做预测,把概念实例、属性与属性值三者之间存在关系的向量标记为1,否则标记为0,利用支持向量机建模进行关系的预测.且以云南旅游景点概念实例、属性及属性值进行六组相关的实验.实验表明,在开放测试中协作分类器精确度达到84.4%、召回率达到82.7%及F值达到为83.6%,相比于词语共现F值提高了20个百分点.
引用
收藏
页码:383 / 389
页数:7
相关论文
共 8 条
[1]   基于Web弱指导的本体概念实例及属性的同步提取 [J].
康为 ;
穗志方 .
中文信息学报, 2010, (01) :54-59
[2]   支持向量回归多参数的同时调节 [J].
廖士中 ;
丁立中 ;
贾磊 .
南京大学学报(自然科学版), 2009, 45 (05) :585-592
[3]   基于层叠条件随机场的旅游领域命名实体识别 [J].
郭剑毅 ;
薛征山 ;
余正涛 ;
张志坤 ;
张宜浩 ;
姚贤明 .
中文信息学报, 2009, (05) :47-52
[4]   一种基于词共现图的文档主题词自动抽取方法 [J].
耿焕同 ;
蔡庆生 ;
于琨 ;
赵鹏 .
南京大学学报(自然科学版), 2006, (02) :156-162
[5]   利用词语共现进行Ontology的概念获取 [J].
耿骞 ;
耿崇 .
现代图书情报技术, 2006, (02) :43-45+49
[6]   A methodology to learn ontological attributes from the Web [J].
Sanchez, David .
DATA & KNOWLEDGE ENGINEERING, 2010, 69 (06) :573-597
[7]   MARKOV-FIELDS AND LOG-LINEAR INTERACTION MODELS FOR CONTINGENCY-TABLES [J].
DARROCH, JN ;
LAURITZEN, SL ;
SPEED, TP .
ANNALS OF STATISTICS, 1980, 8 (03) :522-539
[8]  
A New Algorithm Based on Word Co-occurrence and Its Application in Domain Concept Extraction. Yao Xianming,Guo JianYi,Yu ZhengTao,Zhang YiHao,Zhang ZhiKun,Mao CunLi. 2009 IEEE International Conference on Intelligent Computing and Intelligent Systems . 2009