基于本体知识库的自动语义标注

被引:32
作者
戚欣
肖敏
孙建鹏
机构
[1] 武汉理工大学计算机科学与技术学院
基金
中央高校基本科研业务费专项资金资助;
关键词
语义标注; N-gram; 语义消歧; 有向图; 知识库;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为了产生语义Web中的元数据,需要提取Web文档中的语义信息;面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法;语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于N-gram的语义消歧方法。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。
引用
收藏
页码:1742 / 1744+1747 +1747
页数:4
相关论文
共 5 条
[1]
基于本体的文档语义标注改进方法 [J].
陈叶旺 ;
李文 ;
彭鑫 ;
赵文耘 .
东南大学学报(自然科学版), 2009, 39 (06) :1109-1113
[2]
自然语言处理在信息检索中的应用综述 [J].
王灿辉 ;
张敏 ;
马少平 .
中文信息学报, 2007, (02) :35-45
[3]
基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7
[4]
N-gram语言模型的数据平滑技术 [J].
徐志明 ;
王晓龙 ;
关毅 .
计算机应用研究, 1999, (07) :37-39+44
[5]
Semantic annotation; indexing; and retrieval.[J].Atanas Kiryakov;Borislav Popov;Ivan Terziev;Dimitar Manov;Damyan Ognyanoff.Web Semantics: Science; Services and Agents on the World Wide Web.2004, 1