基于K-近邻算法的网页自动分类系统的研究及实现

被引:4
作者
张高胤
谭成翔
汪海航
机构
[1] 同济大学
关键词
K-近邻算法; 机器学习; 网页分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着网络信息量的爆炸式增长,人们查找信息越来越难。Web搜索引擎的出现在一定程度上解决了这种矛盾。然而现行的搜索引擎无法根据用户所指定的主题进行针对性的搜索,因此,必须在搜索后对结果是否属于目标主题进行判断,以提高搜索的准确性,文中提出了一种基于K-近邻机器学习算法的信息自动分类的方法,能够对搜索到的网页自动地判定是否属于目标主题,并在实验的基础上验证了其在提高搜索准确性上的作用。
引用
收藏
页码:21 / 23
页数:3
相关论文
共 2 条
[1]   基于机器学习的自动文本分类模型研究 [J].
陈立孚 ;
周宁 ;
李丹 .
现代图书情报技术, 2005, (10) :23-27
[2]   基于本体的异构文本分类系统 [J].
赵国涛 ;
何钦铭 .
计算机工程, 2004, (21) :123-125