一种基于随机游走模型的多标签分类算法

被引:56
作者
郑伟
王朝坤
刘璋
王建民
机构
[1] 清华大学软件学院
[2] 清华信息科学与技术国家实验室
[3] 信息系统安全教育部重点实验室
关键词
多标签; 分类算法; 随机游走; 阈值学习;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在数据挖掘领域,传统的单分类和多分类问题已经得到了广泛的研究.但是多标签数据的普遍存在性和重要性直到近些年来才逐渐得到人们的关注.在多标签分类问题中,由于标签相关性的存在,传统的单分类和多分类问题的解决方法,无法简单地应用于多标签分类问题.文中提出了一种基于随机游走模型的多标签分类算法,称为多标签随机游走算法.首先,将多标签数据映射成为多标签随机游走图.当输入一个未分类数据时,建立一个多标签随机游走图系列.而后,对图系列中的每个图应用随机游走模型,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布.最后,基于多标签随机游走算法,文中给出了一种新的阈值学习算法.真实数据集上的实验表明,多标签随机游走算法可以有效地解决多标签分类问题.
引用
收藏
页码:1418 / 1426
页数:9
相关论文
共 2 条
[1]  
Label ranking by learning pairwise preferences[J] . Eyke Hüllermeier,Johannes Fürnkranz,Weiwei Cheng,Klaus Brinker.Artificial Intelligence . 2008 (16)
[2]  
BoosTexter: A Boosting-based System for Text Categorization[J] . Robert E. Schapire,Yoram Singer.Machine Learning . 2000 (2-3)