基于ontology抽取优化初始选择的检索结果聚类

被引:7
作者
陈毅恒
秦兵
宋凡
刘挺
李生
机构
[1] 哈尔滨工业大学计算机科学与技术学院信息检索研究室
基金
国家自然科学基金重点项目;
关键词
检索结果聚类; ontology; 标签;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高.
引用
收藏
页码:166 / 170+156 +156
页数:6
相关论文
共 2 条
[1]  
同义词词林[M]. 上海辞书出版社 , 梅家驹等编, 1996
[2]  
WISE:Hierarchical soft clusteringof web page search results based on web content mining tech-niques .2 Campos R,Dias G,Nunes C. Proceeding of the2006WIC/ACMInternationalConference on Web Intelligence . 2006