基于多维特征的开源项目个性化推荐方法

被引:23
作者
杨程 [1 ,2 ]
范强 [1 ,2 ]
王涛 [1 ,2 ]
尹刚 [1 ,2 ]
王怀民 [1 ,2 ]
机构
[1] 并行与分布处理国家重点实验室(国防科学技术大学)
[2] 国防科学技术大学计算机学院
基金
国家重点研发计划;
关键词
社交化编程; 开源项目; 个性化推荐; Learning to Rank; GitHub;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
随着软件协同开发技术与社交网络的深度融合,社交化开发范式已成为当前软件创作与生产的重要方式.这一软件开发模型的灵活性与开放性,吸引了大规模的外围贡献者加入到开源社区中,形成了巨大的软件生产力.在开源社区中,这些分布广泛、规模巨大的外围贡献者,主要以一种无组织的松散方式进行协同.他们需要花费大量的时间和精力,在海量的开源项目中寻找到自己真正感兴趣的项目并进行长期贡献.为了提高大规模群体协同的效率,提出一种基于多维特征的开源项目个性化推荐方法(即Repo Like).该方法从开源项目自身流行度、关联项目技术相关度以及大众贡献者之间的社交关联度这3个维度度量开发者和开源项目之间的关联关系,并利用线性组合和Learning To Rank方法构建推荐模型,从而为开发者提供个性化的项目推荐服务.通过大规模的实验,其结果表明:Repo Like在推荐20个候选项目时的推荐命中率超过25%,能够有效地为开发人员提供有价值的推荐服务.
引用
收藏
页码:1357 / 1372
页数:16
相关论文
共 6 条
[1]
基于网络的可信软件大规模协同开发与演化 [J].
王怀民 ;
尹刚 ;
谢冰 ;
刘旭东 ;
魏峻 ;
刘江宁 .
中国科学:信息科学, 2014, 44 (01) :1-19
[2]
Reviewer recommendation for pull-requests in GitHub: What can we learn from code review and bug assignment?[J] Yue Yu;Huaimin Wang;Gang Yin;Tao Wang Information and Software Technology 2016,
[3]
Social Network Sites: Definition; History; and Scholarship[J] Danah M. Boyd;Nicole B. Ellison Journal of Computer‐Mediated Communication 2008,
[4]
Fine-grained incremental learning and multi-feature tossing graph-s to improve bug triaging Pamela Bhattacharya;Iulian Neamtiu; 2010 IEEE International Conference on Software Maintenance (ICSM) 2010,
[5]
Improving automated documentation to code traceability by combining retrieval techniques Chen X;Grundy J; Proc.of the26th IEEE/ACM Int''l Conf.on Automated Software Engineering 2011,
[6]
Information Delivery in Support of Learning Reusable Software Components on Demand Yunwen Y;Fischer G; Proceedings of the 7th International Conference on Intelligent User Interfaces 2002,