基于扩展范式距离的纵向数据相似性度量

被引:8
作者
李会民
方丽英
闫健卓
王普
赵辉
机构
[1] 北京工业大学电子信息与控制工程学院
关键词
纵向数据; 扩展范式距离; 粗糙集; 核约简; 相似性度量;
D O I
10.16866/j.com.app.chem2012.10.005
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
为解决纵向数据相似性比较问题,对基于扩展范式距离的纵向数据相似性度量方法进行了研究。使用基于粗糙集理论的核约简对属性变量进行选择,移去数据集中的冗余属性;用扩展范式距离进行数据项问的度量。为计算两数据项之间的相似性,把相关度特征值当作权重,通过扩展范数距离比较项与项相应主元之间的相似性。与其它3种度最方法的对比实验显示,所提出的纵向数据相似度测量方法是有效可行的,且在信息检索时的Recall与Precision优于其它同类方法。
引用
收藏
页码:1176 / 1180
页数:5
相关论文
共 8 条
[2]
不完备目标信息系统中基于差异关系的粗糙集 [J].
魏利华 ;
唐振民 ;
丁辉 ;
吴刚 .
南京理工大学学报(自然科学版), 2010, 34 (04) :415-419
[3]
多维时序数据中的相似子序列搜索研究 [J].
程文聪 ;
邹鹏 ;
贾焰 .
计算机研究与发展, 2010, 47 (03) :416-425
[4]
一种基于一致性准则的属性约简算法 [J].
杨明 .
计算机学报, 2010, 33 (02) :231-239
[5]
基于点分布特征的多元时间序列模式匹配方法 [J].
管河山 ;
姜青山 ;
王声瑞 .
软件学报, 2009, 20 (01) :67-79
[6]
聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[7]
基于形状特征k-d树的多维时间序列相似搜索 [J].
黄河 ;
史忠植 ;
郑征 .
软件学报, 2006, (10) :2048-2056
[8]
部分数据缺失环境下的知识发现方法 [J].
王清毅 ;
蔡智 ;
邹翔 ;
蔡庆生 .
软件学报, 2001, (10) :1516-1524