XML搜索引擎研究

被引:79
作者
王海波
姜吉发
耿晖
白硕
祝明发
机构
[1] 中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京,中国科学院计算技术研究所!北京,中国国家智能信息中心!北京
关键词
XML; 搜索引擎; 采集器; 倒排表;
D O I
暂无
中图分类号
TP393.07 [];
学科分类号
摘要
WWW上大量信息的涌现,对信息的查询提出了严峻的挑战.XML作为一种扩展标记语言,具有许多HTML所不具备的优点,使得开展WWW上的深层应用成为可能.对基于XML的搜索引擎中涉及的关键技术进行了研究,并提出了对XML这种半结构化文档建立索引和查询时采用的数据结构和算法.它在不丢失文档中结构信息的情况下,充分利用XML的标签所带来的上下文信息,能够大幅度提高查询的准确率.
引用
收藏
页码:68 / 71
页数:4
相关论文
empty
未找到相关数据