共 5 条
基于SVM的中文网页分类方法的研究
被引:24
作者:
牛强
王志晓
陈岱
夏士雄
机构:
[1] 中国矿业大学计算机科学与技术学院
来源:
关键词:
支持向量机;
特征提取;
核函数;
网页;
文本分类;
D O I:
10.16208/j.issn1000-7024.2007.08.049
中图分类号:
TP18 [人工智能理论];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
中文网页分类技术是数据挖掘中一个研究热点领域,而支持向量机(SVM)是一种高效的分类识别方法,在解决高维模式识别问题中表现出许多特有的优势。提出了基于支持向量机的中文网页分类方法,其中包括对该过程中的网页文本预处理、特征提取和多分类算法等关键技术的介绍。实验表明,该方法训练数据规模大大减少,训练效率较高,同时具有较好的精确率和召回率。
引用
收藏
页码:1893 / 1895
页数:3
相关论文