面向中文自然语言文档的自动知识抽取方法

被引:17
作者
车海燕
冯铁
张家晨
陈伟
李大利
机构
[1] 符号计算与知识工程教育部重点实验室(吉林大学)
[2] 吉林大学计算机科学与技术学院
关键词
自动知识抽取; 中文自然语言文档; AKE; 语义Web; 聚集体知识概念; N元关系;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自动知识抽取方法可以自动识别并抽取Web文档中与本体匹配的事实知识。利用这些事实知识既可以构建基于知识的服务,也能够为语义Web的实现提供必要的语义数据。但面向自然语言特别是中文自然语言的自动知识抽取非常困难.提出了基于语义Web理论和中文自然语言处理(natural language processing,NLP)技术的自动知识抽取新方法AKE,用聚集体知识概念刻画N元关系知识,能够在不使用大规模语言知识库和同义词表的情况下自动识别中文自然语言文档内容中显式和隐含的简单事实知识和N元关系复杂事实知识.实验结果表明该方法优于目前已知的其他方法.
引用
收藏
页码:834 / 842
页数:9
相关论文
共 7 条
[1]   基于卷积树核的无指导中文实体关系抽取研究 [J].
黄晨 ;
钱龙华 ;
周国栋 ;
朱巧明 .
中文信息学报, 2010, (04) :11-17
[2]   基于子词的双层CRFs中文分词 [J].
黄德根 ;
焦世斗 ;
周惠巍 .
计算机研究与发展, 2010, 47 (05) :962-968
[3]   基于M3N的中文分词与命名实体识别一体化 [J].
乔维 ;
孙茂松 .
清华大学学报(自然科学版), 2010, 50 (05) :758-762+767
[4]   基于统计与正文特征的中文网页正文抽取研究 [J].
周佳颖 ;
朱珍民 ;
高晓芳 .
中文信息学报, 2009, (05) :80-85
[5]   中文网页语义标注:由句子到RDF表示 [J].
荆涛 ;
左万利 ;
孙吉贵 ;
车海燕 .
计算机研究与发展, 2008, (07) :1221-1231
[6]  
面向领域网页的语义标注若干问题研究[D]. 荆涛.吉林大学. 2011
[7]   Labeling Chinese predicates with semantic roles [J].
Xue, Nianwen .
COMPUTATIONAL LINGUISTICS, 2008, 34 (02) :225-255