基于RDF句子的语义网文档搜索

被引:20
作者
吴鸿汉
瞿裕忠
李慧颖
机构
[1] 东南大学计算机科学与工程学院
关键词
语义网; 搜索引擎; 语义网文档搜索; RDF句子; 片段提取;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
语义网文档搜索是发现语义网数据的重要手段.针对传统信息检索方法的不足,提出基于RDF句子的文档词向量构建方法.首先,文档被看作RDF句子的集合,从而在文档分析和索引时能够保留基于RDF句子的结构信息.其次,引入资源的权威描述的定义,能够跨越文档边界搜索到语义网中互连的数据.此外,扩展了传统的倒排索引结构,使得系统能够提取出更加便于阅读和理解的片段.在大规模真实数据集上的实验表明,该方法可以显著地提高文档检索的效率,在可用性上具有明显的提升.
引用
收藏
页码:255 / 263
页数:9
相关论文
共 3 条
[1]
一种求解集合覆盖问题的启发式算法 [J].
陈端兵 ;
黄文奇 .
计算机科学, 2007, (04) :133-136
[2]
细粒度语义网检索 [J].
吴刚 ;
唐杰 ;
李涓子 ;
王克宏 .
清华大学学报(自然科学版), 2005, (自然科学版) :1865-1872
[3]
SOLVING HARD SET COVERING PROBLEMS [J].
MANNINO, C ;
SASSANO, A .
OPERATIONS RESEARCH LETTERS, 1995, 18 (01) :1-5