一种基于层次距离计算的聚类算法

被引:12
作者
彭京 [1 ]
唐常杰 [2 ]
程温泉 [3 ]
石葆梅 [3 ]
乔少杰 [2 ]
机构
[1] 北京大学信息科学技术学院
[2] 四川大学计算机学院
[3] 成都市公安局科技处
基金
北京市自然科学基金; 中国博士后科学基金;
关键词
聚类; 层次距离; 层次编码变量; k-中心; 数据挖掘;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果.
引用
收藏
页码:5786 / 5795
页数:10
相关论文
共 2 条
  • [1] DIRM:基于动态信息路由的数据检索模型
    彭京
    唐常杰
    胡建军
    陈安龙
    李川
    [J]. 四川大学学报(工程科学版), 2005, (01) : 108 - 115
  • [2] 一种基于UD-Tree的分布式数据库新型复制架构
    彭京
    唐常杰
    李川
    陈安龙
    胡建军
    [J]. 小型微型计算机系统, 2004, (12) : 2065 - 2069