XML文档的相似测度和结构索引研究

被引:23
作者
郑仕辉
周傲英
张龙
机构
[1] 复旦大学计算机科学与工程系
关键词
编辑距离; XED距离; 结构索引树;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出了一个可用于定量度量XML文档间差异的方法 (称为XED距离 ) .利用结点间的模拟关系 ,一个XML文档可以表示为一棵精简的、带权重的结构索引树 .两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定 .利用索引树可以大大提高判定两个XML文档结构相似度的效率 .XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等 .
引用
收藏
页码:1116 / 1122
页数:7
相关论文
共 1 条
[1]   A constrained edit distance between unordered labeled trees [J].
Zhang, KZ .
ALGORITHMICA, 1996, 15 (03) :205-222