基于支持向量机与无监督聚类相结合的中文网页分类器

被引:98
作者
李晓黎
刘继敏
史忠植
机构
[1] 中国科学院计算技术研究所!北京
关键词
支持向量机; 聚类; 网页分类;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
提出了一种将支持向量机与无监督聚类相结合的新分类算法 ,给出了一种新的网页表示方法并应用于网页分类问题 .该算法首先利用无监督聚类分别对训练集中正例和反例聚类 ,然后挑选一些例子训练 SVM并获得 SVM分类器 .任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或 SVM分类器进行分类 .该算法充分利用了 SVM准确率高与无监督聚类速度快的优点 .实验表明它不仅具有较高的训练效率 ,而且有很高的精确度 .
引用
收藏
页码:62 / 68
页数:7
相关论文
共 1 条