面向信息检索的快速聚类算法

被引:25
作者
刘铭
刘秉权
刘远超
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 语言语音教育部-微软重点实验室(哈尔滨工业大学)
基金
中国博士后科学基金;
关键词
信息检索聚类技术; 权值调整; 极大极小理论; 快速聚类; 自组织映射;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确;同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理.
引用
收藏
页码:1452 / 1463
页数:12
相关论文
共 2 条
[1]
k-LDCHD——高维空间k邻域局部密度聚类算法 [J].
倪巍伟 ;
孙志挥 ;
陆介平 .
计算机研究与发展, 2005, (05) :784-791
[2]
结构自适应自组织神经网络的研究 [J].
吴郢 ;
阎平凡 .
电子学报, 1999, (07)