基于多维相似度的整体式实体统一算法研究

被引:1
作者
范威振
陈占芳
刘燕龙
机构
[1] 长春理工大学计算机科学技术学院
关键词
多维相似度; 相似团; 实体统一; 迭代聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
多源异构的数据在融合的过程中,不可避免的会呈现多个实体表象指向同一个实体的现象。传统的实体统一算法多采用两两匹配、传递闭包的方式,只考虑了表象的属性相似度,在一次比较后就需要做出匹配决定,在当下属性值普遍缺失、表象间存在关联的大环境下有些不太适用,因此提出了一种基于多维相似度的整体式实体统一算法。本算法采用一种基于图的迭代聚类的整体式实体统一算法,实体统一的过程是各匹配对相互影响、循环往复不断迭代的整体式的过程;在匹配的过程中,综合使用了属性、"上下文"、"关系"等信息来进行了相似度的度量,进一步提高了实体统一的准确度;通过在多个数据集上进行对比实验,验证算法在实体统一方面的性能优势。
引用
收藏
页码:114 / 119
页数:6
相关论文
共 8 条
[1]   大数据环境下一种基于模式匹配的实体统一方法 [J].
熊安萍 ;
詹妮 ;
邹毅 ;
龙林波 .
计算机应用与软件, 2018, 35 (08) :87-92+97
[2]   多源数据集成的视觉传达设计仿真研究 [J].
曲兴卫 ;
王自珍 .
现代电子技术, 2018, 41 (13) :172-176
[3]   多源异构地质数据集成方法应用研究 [J].
潘婷婷 ;
陈建平 ;
吴永亮 ;
王恩瑞 .
地质学刊, 2018, 42 (01) :122-126
[4]   基于图的半监督模糊聚类方法研究 [J].
董志强 ;
刘永年 ;
魏丽华 .
数字技术与应用, 2017, (12) :97-98
[5]   一种基于特征的实体统一算法在数据集成中的应用研究 [J].
何鹏 ;
陈豫 .
情报理论与实践 , 2015, (07) :119-122
[6]   基于云计算及数据挖掘技术的海量数据处理研究 [J].
王鹏 ;
王健安 ;
郭畅 ;
巴济慈 .
长春理工大学学报(自然科学版), 2013, 36 (06) :157-160
[7]   社区健康档案管理系统的数据集成方案设计 [J].
徐洪华 ;
王艳春 ;
董光 ;
师为礼 .
长春理工大学学报(自然科学版), 2011, 34 (01) :122-125
[8]   机载复合探测器信息融合方法研究 [J].
时继庆 ;
高冰 ;
王书宁 .
长春理工大学学报(自然科学版), 2008, (02) :23-26