基于动态权值的关联数据语义相似度算法研究

被引:8
作者
贾丽梅
郑志蕴
李钝
王振飞
机构
[1] 郑州大学信息工程学院
关键词
关联数据; 语义相似度; 实例属性; 动态权值;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
语义相似度计算对关联数据的信息检索有重要作用,直接影响数据的语义挖掘效果。实例的属性信息是关联数据语义相似度计算的一个重要因素。针对传统的关联数据语义相似度算法未考虑属性的重要性和取值类型导致计算精度较低的问题,提出基于动态权值的关联数据语义相似度计算方法,即根据待匹配的数据集中属性不同取值的数量、属性值的分布以及属性的有效性3个因素动态计算属性的权值,然后依据属性取值类型选用匹配相似度算法,最后结合属性的动态权值对概念进行实例的相似度计算。实验表明,基于动态权值的相似度计算方法与传统方法相比,实例相似度的计算精度得到了一定的提高。
引用
收藏
页码:263 / 266+273 +273
页数:5
相关论文
共 4 条
[1]   基于属性权重的链接数据共指关系构建 [J].
张晓辉 ;
蒋海华 ;
邸瑞华 .
计算机科学, 2013, 40 (02) :40-43
[2]   基于本体的语义相似度和相关度计算研究综述 [J].
刘宏哲 ;
须德 .
计算机科学, 2012, 39 (02) :8-13
[3]   基于属性与对象关系信息的综合差异度计算 [J].
高学东 ;
吴玲玉 ;
武森 ;
谷淑娟 .
计算机工程, 2011, 37 (22) :35-38
[4]  
Iterative record linkage for cleaning and integration .2 Indrajit Bhattacharya,Lise Getoor. Proceedings of the 9th ACM SIGMOD workshop on Research issues in data mining and knowledge discovery . 2004