XML数据的查询技术

被引:66
作者
孔令波
唐世渭
杨冬青
王腾蛟
高军
机构
[1] 北京大学计算机科学技术系
基金
北京市自然科学基金;
关键词
XML查询; XML IR查询; XPath; XQuery; XML关键字查询; XQuery FT; Twig查询模式; 结构连接; SLCA节点; Dewey编码; 相似性度量; 树编辑距离; 向量空间模型; TF*IDF;
D O I
暂无
中图分类号
TP312.2 [];
学科分类号
081202 ; 0835 ;
摘要
XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询模式描述的不同,将当前XML查询技术归入两大类:XML Query方式和XML IR方式.后者又进而可分以为3个子类:XML IR/keyword方式、XML IR/fragment和XMLIR/query方式,并从中挑选出3个研究者关注的问题进行了简述,它们是:Twig查询模式的处理、SLCA(smallest lowest common ancestor)节点的获取以及对所获取的XML片段相似性的度量.以方便普通用户使用为准则探讨了相关XML查询技术的优、缺点,将如下4个问题作为需要进一步关注的研究内容:结构化关键字查询及相应的结构相似性度量方法,如何消除XML Query查询处理模式(包含XML IR/query)和XML IR/keyword查询处理模式间数据冗余的问题,XML Query查询方式的理论探讨及其实现以及针对特定应用的XML数据的有效管理.
引用
收藏
页码:1400 / 1418
页数:19
相关论文
共 8 条
[1]   XML查询优化研究 [J].
孟小峰 ;
王宇 ;
王小锋 .
软件学报, 2006, (10) :2069-2086
[2]   XML数据索引技术 [J].
孔令波 ;
唐世渭 ;
杨冬青 ;
王腾蛟 ;
高军 .
软件学报, 2005, (12) :2063-2079
[3]   以目标节点为导向的XML路径查询处理 [J].
王静 ;
孟小峰 ;
王宇 ;
王珊 .
软件学报, 2005, (05) :827-837
[4]   基于区间编码的XML索引结构的有效结构连接 [J].
万常选 ;
刘云生 ;
徐升华 ;
刘喜平 ;
林大海 .
计算机学报, 2005, (01) :113-127
[5]   数据库技术发展趋势 [J].
孟小峰 ;
周龙骧 ;
王珊 .
软件学报, 2004, (12) :1822-1836
[6]   基于区域划分的XML结构连接 [J].
王静 ;
孟小峰 ;
王珊 .
软件学报, 2004, (05) :720-729
[7]  
TIMBER: A native XML database[J] . H.V. Jagadish,S. Al-Khalifa,A. Chapman,L.V.S. Lakshmanan,A. Nierman,S. Paparizos,J.M. Patel,D. Srivastava,N. Wiwatwattana,Y. Wu,C. Yu.The VLDB Journal . 2002 (4)
[8]   The Lorel query language for semistructured data [J].
Serge Abiteboul ;
Dallan Quass ;
Jason McHugh ;
Jennifer Widom ;
Janet L. Wiener .
International Journal on Digital Libraries, 1997, 1 (1) :68-88