一种图文组合相似度算法的设计与优化附视频

被引:5
作者
鲜翠琼
秦学
朱道恒
操淑敏
机构
[1] 贵州大学大数据与信息工程学院
关键词
余弦相似度算法; Jaccard相似系数; 感知哈希算法; 文本相似度;
D O I
10.19644/j.cnki.issn2096-1472.2020.08.003
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
包含文字和图片的文档作为信息的一种载体,能够极大地丰富信息的表现形式。针对传统计算图文相似度的算法效率不高的问题,提出一种图文组合相似度算法。将Jaccard相似系数引入余弦相似度,通过加权计算两文本的相似度,然后用感知哈希算法计算文档中图片相似度并找出最大值,再计算单个文档中所有图片相似度均值,与文本相似度加权求得文档的图文相似度。最后通过一个文档相似度查重系统验证了该算法能准确高效地完成文档之间相似度的量化,且优化后的相似度算法能够极大提高该系统的运行效率。
引用
收藏
页码:9 / 12+4 +4
页数:5
相关论文
共 11 条
[1]   基于改进的Jaccard相似系数矩阵的社团划分算法 [J].
张猛 ;
李玲娟 .
南京邮电大学学报(自然科学版), 2018, 38 (06) :96-102
[2]   基于Java的相似图片搜索 [J].
龚成清 .
电脑开发与应用, 2012, 25 (10) :13-15
[3]   基于CFN的相似度计算在实例机器翻译中的应用 [J].
杨立波 .
电脑开发与应用, 2011, 24 (06) :58-60
[4]  
短文本相似度计算在用户交互式问答系统中的应用[D]. 宋万鹏.中国科学技术大学. 2010
[5]  
基于短文本处理算法优化的文本信息推荐系统的设计与实现[D]. 田军霞.北京交通大学. 2017
[6]  
基于常规水质参数的供水管网特征污染物分类方法研究[D]. 金宇.浙江大学. 2017
[7]  
基于VC-1视频标准的离散余弦变换实现及验证[D]. 唐菲骏.西安科技大学. 2012
[8]  
基于语义相似度的中文文本相似度算法研究[D]. 金希茜.浙江工业大学. 2009
[9]  
方向离散余弦变换和方向离散小波变换及其在超声图像中的应用[D]. 文心灵.北京交通大学. 2008
[10]  
基于语义相似度的文本聚类算法的研究[D]. 孙爽.南京航空航天大学. 2007