<正> 1.引言我们生活在所谓的信息时代。尤其是随着互联网的出现,计算机用户越来越被庞大芜杂的信息淹没,变得无所适从。Nature上的统计数据表明,Web上约有超过800,000,000个页面。数据量达到15TB,散布于大约2,800,000台Web服务器上。到2002年,仅Google(www.google.com)就索引了2,073,418,204个页面,而一般搜索引擎的覆盖率不会超过34%。这样的现象即是所谓的信息过载。在互联网这一不断增长的数据流中,不是所有的信息都是用户感兴趣的,但似乎只有通览所有的信息用户才能找到真正感兴趣的东西。为了减轻用户的检索负担,信息过滤系统应运而生。