基于语义的网络大数据组织与搜索

被引:28
作者
吴纯青
任沛阁
王小峰
机构
[1] 国防科学技术大学计算机学院
关键词
语义空间; 高维索引; 降维; 相似性查询; P2P; 大数据;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着信息技术的飞速发展,网络空间中出现海量异构的数据资源,网络大数据逐渐引起了人们的关注.从网络大数据中发现并获取用户所需的数据资源,需要对网络大数据进行有效地组织管理并进行基于数据语义的相似搜索.为此,需要从网络数据资源中抽取其特征/属性构造高维语义空间,并将数据资源及用户查询信息抽象为语义空间中的特征向量或高维点,进而通过比较特征向量间夹角余弦值或高维点之间的距离来衡量语义相似性.高维索引技术可以对高维语义空间中的数据资源进行有效组织管理,实现基于数据语义的相似性搜索;而降维技术可以消除语义空间维数过高所引发的"维灾"影响.文中对现有的高维数据索引及降维技术进行了系统的综述,然后介绍了现有的基于分布式技术实现高维数据语义相似性搜索的研究工作,最后并展望了未来工作.
引用
收藏
页码:1 / 17
页数:17
相关论文
共 32 条
[1]   网络大数据:现状与展望 [J].
王元卓 ;
靳小龙 ;
程学旗 .
计算机学报, 2013, 36 (06) :1125-1138
[2]   大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考 [J].
李国杰 ;
程学旗 .
中国科学院院刊, 2012, 27 (06) :647-657
[3]   PCPF:一种面向多媒体数据库中高维向量匹配的并行索引结构 [J].
陈慧中 ;
陈永光 ;
景宁 ;
陈荦 .
计算机学报, 2011, 34 (10) :2009-2017
[4]   基于查询采样的高维数据混合索引 [J].
张军旗 ;
周向东 ;
施伯乐 .
软件学报, 2008, (08) :2054-2065
[5]   基于聚类分解的高维度量空间索引B+-Tree [J].
张军旗 ;
周向东 ;
王梅 ;
施伯乐 .
软件学报, 2008, (06) :1401-1412
[6]   BC-iDistance:基于位码的优化高维索引 [J].
梁俊杰 ;
冯玉才 .
小型微型计算机系统, 2007, (09) :1647-1651
[7]   基于最大间隙空间映射的高维数据索引技术 [J].
王国仁 ;
黄健美 ;
王斌 ;
韩东红 ;
乔百友 ;
于戈 .
软件学报, 2007, (06) :1419-1428
[8]  
Principal Manifolds and Nonlinear Dimensionality Reduction via Tangent Space Alignment[J]. 张振跃,查宏远.Journal of Shanghai University. 2004(04)
[9]   基于关键维的高维空间划分策略 [J].
周项敏 ;
王国仁 .
软件学报, 2004, (09) :1361-1374
[10]   基于矢量量化的快速图像检索 [J].
叶航军 ;
徐光祐 .
软件学报, 2004, (05) :712-719