K-means聚类和支持向量机结合的文本分类研究

被引:6
作者
贾燕花
徐蔚鸿
机构
[1] 长沙理工大学计算机与通信工程学院
基金
湖南省自然科学基金;
关键词
文本分类; k-means算法; 聚类; 支持向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对数据挖掘中文本自动分类问题,提出了一种基于k-means聚类算法和支持向量机相结合的文本分类方法。该方法先将文本大致聚为k类,然后对每一类用支持向量机进行细分。构造了可用于多个模式类识别的多层SVM模型,该模型可完成对多个模式的分类识别。给出了该模型的构造及应用的方法,并验证了该方法的有效性。
引用
收藏
页码:172 / 174
页数:3
相关论文
共 6 条
[1]   多类支持向量机在文本分类中的应用 [J].
张苗 ;
张德贤 .
计算机与现代化, 2008, (05) :104-106+110
[2]   文本自动分类研究进展 [J].
牛延莉 ;
张化 .
软件导刊, 2008, (04) :24-26
[3]   一种用于文本聚类的改进的K均值算法 [J].
任江涛 ;
孙婧昊 ;
施潇潇 ;
黄焕宇 ;
印鉴 .
计算机应用, 2006, (S1) :73-75
[4]   基于支持向量机的Web文本分类方法 [J].
牛强 ;
王志晓 ;
陈岱 ;
夏士雄 .
微电子学与计算机, 2006, (09) :102-104
[5]   一种改进的模糊C-均值(FCM)聚类算法 [J].
安良 ;
胡勇 ;
胡良梅 ;
孟玲玲 .
合肥工业大学学报(自然科学版), 2003, (03) :354-358
[6]  
支持向量机在文本自动分类中的应用研究[J]. 田晓宇,梁静国.情报学报. 2006 (02)