基于部分匹配的XML文本文档向量检索模型

被引:5
作者
吴劲
陈泽琳
机构
[1] 广州华南理工大学计算机科学与工程学院
[2] 广州华南理工大学计算机科学与工程学院 广东 广州
[3] 广东 广州
关键词
XML文本文档; 向量检索模型; 信息检索; 部分匹配模式; 查询;
D O I
暂无
中图分类号
TP312 [程序语言、算法语言];
学科分类号
摘要
本文提出了部分匹配模式的XML文本文档向量检索模型,给出了XML文本文档树以及子文档树的向量表示和查询以及子查询的向量表示,并由此提出了查询中的祖先-后代关系映射到文档中的祖先-后代关系的部分匹配模式的检索方式,给出了基于此匹配处理过程的相似度计算,以判断文档与查询的相关程度.在构造的检索原型系统中的实验表明,该检索模型具有较好的查全率和查准率.
引用
收藏
页码:2169 / 2171
页数:3
相关论文
共 7 条
[1]  
OHSUMED: An interactive re-trieval evaluation and new large test collection for research. Hersh WR,Buckley C and Leone TJ. Pro-ceedings of the 17th Annual ACM SIGIR Conference . 1994
[2]  
Adding relevance to XML. A Theobald,G Weikum. In proceedingsof 3rd International Workshop on Web and Databases . 2000
[3]  
http://www.dcs. gla. ac.uk/idom/ir_resources/linguistic_utils/ stop_ words .
[4]  
Similarity search in XML data using cost-based querytransformations. Torsten Schlieder. In Proceedings of the Fourth International Work-shop on the Web and Databases ( WebDB) . 2001
[5]  
Combining multiple evidence from different properties ofweighting schemes. Lee,J H. Proceedings of the 18th Annual InternationalACM SIGIR Conference on Research and Development in InformationRetrieval . 1995
[6]  
XIRQL: A query language for informa-tion retrieval in XML documents. Norbert Fuhr,Kai Grobjohann. In Proceedings of the 24th Annu-al International Conference on Research and development in Informa-tion Retrieval . 2001
[7]  
Searching text-rich XML docu-ments with relevance ranking. Yoshihiko Hayashi,Junji Tomita,et al. ACM SIGIR 2000 Workshop on XMLand Information Retrieval . 2000