网页多词元快速聚类算法

被引:17
作者
李振星
徐泽平
唐卫清
唐荣锡
机构
[1] 北京航空航天大学机械工程及自动化学院,中国科学院计算所,中国科学院计算所,北京航空航天大学机械工程及自动化学院北京,北京,北京,北京
关键词
网页聚类; 相似度; 向量空间模型;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
在对网页相似度分析的基础上,提出网页多词元快速聚类算法。这种算法针对中文,采用词元相似度聚类方法,利用一元组相似度判断对网页进行快速初步聚类,然后在此结果中利用二元组相似度判断进行精确聚类,兼顾了聚类精度和速度的要求。
引用
收藏
页码:20 / 22
页数:3
相关论文
empty
未找到相关数据