基于在线百科全书的群体兴趣及其关联性挖掘

被引:10
作者
张海粟 [1 ,2 ]
陈桂生 [3 ]
马于涛 [3 ,4 ]
刘玉超 [3 ]
机构
[1] 中国人民解放军理工大学指挥自动化学院
[2] 中国人民解放军国防信息学院
[3] 中国电子系统工程研究所
[4] 武汉大学软件工程国家重点实验室
基金
中国博士后科学基金;
关键词
群体兴趣; 兴趣点泛树结构; 协同推荐; 维基百科; 社会网挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对协同过滤、基于内容过滤等个性化推荐方法所存在的用户隐私数据收集、冷启动等问题,提出一种群体兴趣及其关联性的挖掘方法,并应用于推荐领域.以维基百科作为数据源,获取用户社团及其编辑的词条,设计了以词条及其所属类别为基础的泛树结构生长策略,使用泛树结构表征用户社团所对应的兴趣点.结合用户社团的结构特征和兴趣点的语义特征给出了用户社团对兴趣点的关注度及兴趣点间关联性的定义,用此群体兴趣取代个性化推荐方法中的个体兴趣,进行了人工直观评价、测试集对比以及视频点播中的新闻推荐等三种实验.结果表明,测试集上群体兴趣关联性的准确度达到了50%,高于基准协同推荐方法的准确度;新闻推荐实验中,本方法比按热度推荐方法获得了高出近一倍的点击率,验证了群体兴趣及其关联性的合理性.
引用
收藏
页码:2234 / 2242
页数:9
相关论文
共 6 条
[1]   互联网推荐系统比较研究 [J].
许海玲 ;
吴潇 ;
李晓东 ;
阎保平 .
软件学报, 2009, 20 (02) :350-362
[2]   网络日志规模分析和用户兴趣挖掘 [J].
郭岩 ;
白硕 ;
杨志峰 ;
张凯 .
计算机学报, 2005, (09) :1483-1496
[3]  
Research and Implementation on Personalized Search Engine[J] . Zeng Qing Wei,Jiang Jie.Key Engineering Materials . 2011 (467)
[4]   An analysis of topical coverage of Wikipedia [J].
Halavais, Alexander ;
Lackaff, Derek .
JOURNAL OF COMPUTER-MEDIATED COMMUNICATION, 2008, 13 (02) :429-440
[5]   MODELING USERS INTERESTS IN INFORMATION FILTERS [J].
STADNYK, I ;
KASS, R .
COMMUNICATIONS OF THE ACM, 1992, 35 (12) :49-50
[6]  
Programming collective intelligence: building smart web2.0applications. Segaran T. O’’Reilly Media . 2007