基于XML的信息抽取和多层向量空间技术研究

被引：5

作者：

仲华

崔志明

机构：

[1] 苏州大学计算机科学与技术学院

来源：

计算机技术与发展 | 2007年 / 07期

关键词：

XML架构; 信息抽取; N层向量空间模型;

D O I：

暂无

中图分类号：

TP312.2 []; TP393.092 [];

学科分类号：

摘要：

在分析了传统索引技术的缺陷的基础上,提出了一种基于XML架构信息抽取的多层向量空间的模型,重点阐述了如何建立一个基于XML的Web信息抽取平台,从构造知识库、网页优化和信息抽取这三方面进行研究,并阐述了基于XML的多层向量空间模型及其形成。通过这种技术不仅使网页内容得到了清晰的剖析和抽取,更能大大提高对Web网页文档检索效率和准确率。目的在于寻求一种更为高效简洁的检索方法。

引用

页码：49 / 52

页数：4

共 6 条

[1]

一种基于XML的Web信息抽取方法 [J].