基于PLSI的标签聚类研究

被引:11
作者
吴志媛
钱雪忠
机构
[1] 江南大学物联网工程学院
关键词
大众分类; 概率潜在语义索引; 语义标签; 回火期望最大化算法; 凝聚式层次k中心点聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对现有的大众分类中标签模糊导致影响用户搜索效率的问题,使用概率潜在语义索引(probabilistic latent semantic indexing,PLSI)模型对标签进行潜在语义分析,经回火期望最大化(tempered exception maximization,TEM)算法训练得到在潜在语义下的条件概率,生成概率向量;在此基础上,提出凝聚式层次k中心点(hierarchical agglomerative K-mediods,HAK-mediods)聚类算法对概率向量进行聚类,并进行了相关对比实验。实验结果表明,HAK-mediods算法的聚类效果要好于传统的聚类算法,从而验证了该算法的可行性和有效性。
引用
收藏
页码:1316 / 1319
页数:4
相关论文
共 9 条
[1]
一种基于差分演化的K-medoids聚类算法 [J].
孟颖 ;
罗可 ;
刘建华 ;
石爽 .
计算机应用研究, 2012, 29 (05) :1651-1653
[2]
引入信息增益的层次聚类算法 [J].
刘一鸣 ;
张化祥 .
计算机工程与应用, 2012, 48 (01) :142-144
[4]
基于代表点的快速聚类算法 [J].
贾瑞玉 ;
耿锦威 ;
宁再早 ;
何成刚 .
计算机工程与应用, 2010, 46 (33) :121-123+126
[5]
结合LSA的中文谱聚类算法研究 [J].
熊忠阳 ;
暴自强 ;
李智星 ;
张玉芳 .
计算机应用研究, 2010, 27 (03) :917-918
[6]
贝叶斯概率LSA模型权重更新算法 [J].
曾广平 .
计算机工程与应用, 2009, (21) :88-90+102
[7]
Web2.0环境下走向语义标注的Folksonomy研究 [J].
高彧 ;
郭利伟 .
中国科技信息, 2009, (14) :112+123
[8]
基于凝聚式层次聚类算法的标签聚类研究 [J].
曹高辉 ;
焦玉英 ;
成全 .
现代图书情报技术, 2008, (04) :23-28
[9]
基于LSA降维的KNN文本分类算法 [J].
李良俊 ;
张斌 ;
杨明 .
东北师大学报(自然科学版), 2007, (02) :33-36