社交网络用户兴趣挖掘研究

被引:10
作者
何炎祥 [1 ,2 ]
刘续乐 [1 ]
陈强 [1 ,2 ]
梁伟 [1 ]
孙松涛 [1 ,2 ]
机构
[1] 武汉大学计算机学院
[2] 武汉大学软件国家重点实验室
关键词
用户兴趣挖掘; 社交网络; 关键词抽取; 概率潜在语义分析; 话题模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
面向消费者的公司或者企业都希望了解他们用户的需求,而大量的用户产生的数据在很大程度上就体现了用户的兴趣和需求.提出一种用于社交网站上,针对用户生成内容(User Generate Content UGC)和用户关注信息的用户兴趣发掘方法.首先通过启发式初始化的PLSA模型训练得到贴近兴趣类别的话题模型,然后从训练结果中抽取可靠的话题并以此构建分类器,对用户的分享数据进行分类,最后根据用户的分享数据分类结果来识别用户的兴趣类别.在初始化PLSA模型时,用关键词抽取算法抽取每个分类的关键词,并给这些关键词赋予较高的PLSA初始权重,以此来引导PLSA模型的训练.实验的结果表明:本文方法可以有效的构建用户兴趣类别,并对用户兴趣的挖掘比较理想.
引用
收藏
页码:2385 / 2389
页数:5
相关论文
共 3 条
[1]   Web2.0的研究与应用综述 [J].
王伟军 ;
孙晶 .
情报科学, 2007, (12) :1907-1913
[2]  
Age differences in online social networking – A study of user profiles and the social capital divide among teenagers and older users in MySpace[J] . Ulrike Pfeil,Raj Arjan,Panayiotis Zaphiris.Computers in Human Behavior . 2008 (3)
[3]  
You are who you know:inferring user profiles in online social networks. Mislove, A,Viswanath, B,Gummadi, K.P,Druschel, P. Proceedings of the third ACM international conference on Web search and data mining . 2010