共 2 条
一种基于层次距离计算的聚类算法
被引:12
作者:
彭京
[1
]
唐常杰
[2
]
程温泉
[3
]
石葆梅
[3
]
乔少杰
[2
]
机构:
[1] 北京大学信息科学技术学院
[2] 四川大学计算机学院
[3] 成都市公安局科技处
来源:
基金:
北京市自然科学基金;
中国博士后科学基金;
关键词:
聚类;
层次距离;
层次编码变量;
k-中心;
数据挖掘;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
学科分类号:
摘要:
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果.
引用
收藏
页码:5786 / 5795
页数:10
相关论文