当前知识抽取的主要技术方法解析

被引:19
作者
张智雄 [1 ]
吴振新 [1 ]
刘建华 [1 ,2 ]
徐健 [1 ,2 ,3 ]
洪娜 [1 ,2 ]
赵琦 [1 ,2 ]
机构
[1] 中国科学院国家科学图书馆
[2] 中国科学院研究生院
[3] 中山大学资讯管理系
关键词
知识抽取; 机器学习; 自然语言分析; 本体;
D O I
暂无
中图分类号
G250.7 [图书馆自动化、网络化];
学科分类号
摘要
对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。
引用
收藏
页码:2 / 11
页数:10
相关论文
共 18 条
  • [1] Discovering significant patterns
    Webb, Geoffrey I.
    [J]. MACHINE LEARNING, 2007, 68 (01) : 1 - 33
  • [2] Armadillo. http://www.dcs.shef.ac.uk/sam/armadillo.html . 2008
  • [3] PowerMagpie. http://powermagpie.open.ac.uk . 2008
  • [4] Know ledge Space of Semantic Inference ofAuto-matic Annotation and Retrieval ofMu ltim ed ia Content. K-space Project. http://kspace.qmu l.net:8080/kspace/index.jsp . 2008
  • [5] MnM:Ontology D riven Sem i-Automatic and AutomaticSupport for Semantic Markup. Vargas-Vera M,Motta E,Dom ingue J,Lanzon iM,StuttA,C ir-avegna F. The13th International Con-ference on Knowledge EngineeringandManagement(EKAW2002) . 2002
  • [6] Open Information Extraction from the Web. Banko M,Cafarella M J,Soderland S,Broadhead M,Etzioni O. Proceedings ofthe20th International Joint Conference on Artificial Intelligence(IJ-CAI2007) .
  • [7] Text2Onto-A Framework for OntologyLearning and Date-driven Change Discovery. Cimiano P,V lker J. ProceedingsofNLDB05 . 2005
  • [8] Towards the Self-AnnotatingWeb. Cimiano P,Handschuh S,Staab S. Proceedings ofthe13th WWW Conference . 2004
  • [9] Extracting patterns and relations from the World Wide Web. Sergey Brin. WebDB Workshop at 6th International Conference on Extending Database Technology . 1998
  • [10] Ontology-basedInformation Extraction for Business Intelligence. Saggion H,Funk A,Maynard D,Bontcheva K. http://iswc2007.semanticweb.org/papers/837.pdf . 2008