<正> 1.引言万维网WWW(World Wide Web)是一个巨大的、分布全球的信息服务中心,正在以飞快的速度扩展。1998年WWW上拥有约3.5亿个文档,每天增加约1百万的文档,不到9个月的时间文档总数就会翻一番。Web上的文档和传统的文档比较,有很多新的特点,它们是分布的、异构的、无结构或者半结构的,这就对传统信息检索技术提出了新的挑战。传统的Web搜索引擎大多数是基于关键字匹配的,返回的结果是包含查询项的文档,也有基于目录分类的搜索引擎。这些搜索引擎的结果并不令人满意。有些站点有意提高关键