共 5 条
基于投影寻踪的中文网页分类算法
被引:10
作者:
万中英
王明文
廖海波
机构:
[1] 江西师范大学物理与通信电子学院
[2] 江西师范大学计算机信息工程学院
[3] 江西师范大学计算机信息工程学院 江西南昌
[4] 江西南昌
来源:
关键词:
计算机应用;
中文信息处理;
投影寻踪;
网页分类;
遗传算法;
KNN算法;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
随着Web信息迅猛发展,网络用户对网页自动分类器的需求日益增长。为了提高分类精度,本文提出了一种新的基于投影寻踪(ProjectionPursuit,简称PP)的中文网页分类算法。我们首先利用遗传算法找到一个最好的投影方向,然后将已被表示成为n维向量的网页投影到一维空间。最后采用KNN分类算法对其进行分类。此方法能解决“维数灾难”问题。实验结果表明,我们提出的算法是可行而且是有效的。
引用
收藏
页码:60 / 67
页数:8
相关论文