基于大众分类法的中文博客分类方法

被引:6
作者
丛鲁丽
机构
[1] 山东理工大学图书馆
关键词
文本分类; Folksonomy; 支持向量机; 标签代理; 博客;
D O I
暂无
中图分类号
G203 [信息资源及其管理];
学科分类号
1204 ; 1402 ;
摘要
大众分类法(Folksonomy)的灵活性比传统的机器分类方法高,但是它不能处理大量的数据资源。为了解决这个问题,结合Folksonomy和传统机器学习算法的优点我们提出了一种新的算法FSVMC(Folisonomy and Sup-port Vector Machine Classifier)。在FSVMC中,支持向量机算法作为一个TAG代理,决定一个标签是否应该标注在某个资源上,而Folksonomy致力于网页文档的分类。此外还提出了一种创建可以标注网页标签数据库的方法。实验结果表明我们的方法比传统的机器学习方法更加有效和具有柔性。
引用
收藏
页码:50 / 52+40 +40
页数:4
相关论文
共 1 条
[1]  
BoosTexter: A Boosting-based System for Text Categorization[J] . Robert E. Schapire,Yoram Singer.Machine Learning . 2000 (2-3)