基于同义扩展的在线百科中实体属性抽取

被引:1
作者
刘倩 [1 ,2 ]
刘冰洋 [1 ,2 ]
贺敏 [3 ]
伍大勇 [1 ]
刘悦 [1 ]
程学旗 [1 ]
机构
[1] 中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室
[2] 中国科学院大学
[3] 国家计算机网络应急技术处理协调中心
基金
国家自然科学基金重点项目;
关键词
实体属性; 同义属性; 命名实体; 信息抽取词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
实体属性抽取是信息抽取、知识库构建等任务的重要基础。该文提出了一种利用在线百科获取实体属性的方法,该方法首先通过在线百科的结构特征和领域独立的抽取模式捕获可能的属性短语,然后根据同义扩展获取尽可能多的属性表述形式,并同时得到对应实体类别的同义属性集合。实验表明,该方法在保证属性抽取准确率不变的情况下,获得了比仅使用频率的方法覆盖范围更广的实体属性集合。
引用
收藏
页码:16 / 23+29 +29
页数:9
相关论文
共 16 条
  • [1] http://ictclas.nlpir.org/ .
  • [2] The role of documents vs.queries in extracting class attributes from text. Pasca M,Van Durme B,Garera N. Proceedings of CIKM . 2007
  • [3] Automatic discovery of attribute words from Web documents. Tokunaga K,Kazama J,Torisawa K. Proceedings of the Natural Language Processing-IJC-NLP 2005 . 2005
  • [4] Yago:a core of semantic knowl-edge. SUCHANEK F M,KASNECI G,WEIKUM G. WWW . 2007
  • [5] Structural Semantic Relatedness:A Knowledge-Based Method to Named Entity Disambiguation. Xianpei Han,J. Z. ACL2010 . 2010
  • [6] Identifying Synonyms among Distributionally Similar Words. Lin Dekang,Zhao Shaojun,Qin Lijuan,et al. Proceedings of IJCAI-03 . 2003
  • [7] Using structured text for large-scale attribute extraction. S.Ravi,M.Pasca. Proceedings of the 17thCIKM(CIKM 2008) . 2008
  • [8] Class-driven attribute extraction. Durme B V,Qian Ting,Schubert L. Proceedings of the 22nd International Conference on Computational Linguistics . 2008
  • [9] An Unsupervised Approach to Product Attribute Extraction. Raju S,Pingali P,Varma V. Advances in Information Retrieval . 2009
  • [10] An effective,low-cost measure of seman-tic relatedness obtained from Wikipedia links. Milne D,Witten I. TheWorkshop on Wikipedia and Artificial Intelligence at AAAI . 2008