大数据哈希学习:现状与趋势

被引:44
作者
李武军 [1 ,2 ]
周志华 [1 ,2 ]
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 软件新技术与产业化协同创新中心
关键词
大数据; 机器学习; 哈希学习; 大数据学习;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
随着信息技术的迅速发展,各行各业积累的数据都呈现出爆炸式增长趋势,我们已经进入大数据时代.大数据在很多领域都具有广阔的应用前景,已经成为国家重要的战略资源,对大数据的存储、管理和分析也已经成为学术界和工业界高度关注的热点.收集、存储、传输、处理大数据的目的是为了利用大数据,而要有效地利用大数据,机器学习技术必不可少.因此,大数据机器学习(简称大数据学习)是大数据研究的关键内容之一.哈希学习通过将数据表示成二进制码的形式,不仅能显著减少数据的存储和通信开销,还能降低数据维度,从而显著提高大数据学习系统的效率.因此,哈希学习近年来成为大数据学习中的一个研究热点.本文对这方面的工作进行介绍.
引用
收藏
页码:485 / 490
页数:6
相关论文
共 5 条
  • [1] Semantic hashing[J] . Ruslan Salakhutdinov,Geoffrey Hinton.International Journal of Approximate Reasoning . 2008 (7)
  • [2] Near-optimal hashing algorithms for approximate nearest neighbor in high dimensions
    Andoni, Alexandr
    Indyk, Piotr
    [J]. COMMUNICATIONS OF THE ACM, 2008, 51 (01) : 117 - 122
  • [3] 机器学习与数据挖掘 .2 周志华. 中国计算机学会通讯 . 2007
  • [4] Feature hashing for large scale multitask learning .2 Weinberger K Q,Dasgupta A,Langford J,et al. Proceedings of the 26th International Conference on Machine Learning (ICML) . 2009
  • [5] M inimal loss hashing for compact binary codes .2 Norouzi M,Fleet D. Proceedings of the 28th International Conference on Machine Learning . 2011