基于分级神经网络的Web文档模糊聚类技术

被引:11
作者
雷景生 [1 ]
马军 [2 ]
靳婷 [1 ]
机构
[1] 海南大学信息科学技术学院
[2] 山东大学计算机科学与技术学院
基金
海南省自然科学基金;
关键词
向量空间模型; 文档聚类; 自组织网络; 模糊C-Means;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
给出了一种多层向量空间模型,该模型将一篇文档的相关信息从逻辑上划分为多个相对独立的文本段,按照不同位置的文本段确定相应的索引项权重.然后提出了一种简明而有效的基于分级神经网络的模糊聚类算法.与现有方法不同,该模糊聚类方法采用自组织神经网络和模糊聚类网络两部分组成的3层神经网络来实现.首先采用自组织神经网络从原始数据产生一个初始聚类结果,然后运用FCM方法对初始聚类的数目进行优化.实验结果表明,提出的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的Web文档较完全和准确地聚成一类.
引用
收藏
页码:1695 / 1699
页数:5
相关论文
共 2 条
[1]
论模糊C均值算法的模糊指标[J] 于剑 计算机学报 2003, 08
[2]
概念推理网及其在文本分类中的应用 [J].
李晓黎 ;
刘继敏 ;
史忠植 .
计算机研究与发展, 2000, (09) :1032-1038