基于模糊概念图的文档聚类及其在Web中的应用

被引:10
作者
陈宁
陈安
周龙骧
贾维嘉
罗三定
机构
[1] 中国科学院研究生院信息学院
[2] 中国科学院科技政策与管理科学研究所
[3] 中国科学院数学与系统科学研究院
[4] 香港城市大学计算机科学系
[5] 香港城市大学计算机科学系 北京
[6] 北京
[7] 中国科学院软件研究所软件工程技术研究开发中心
[8] 香港九龙
关键词
模糊概念图; 文档聚类; 兴趣模式; 用户化智能搜索;
D O I
10.13328/j.cnki.jos.2002.08.036
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查询的用户化.首先提出了模糊概念图的模型来描述词语间的关系,然后在聚类过程中引入概念知识,提出了基于模糊概念图的文档聚类算法,通过分析用户的浏览行为发现兴趣模式.在上述技术的基础上,给出了一种用户化的智能搜索系统的实现策略,通过分析概念间的关系和用户的兴趣模式,评价超链/文档和查询的相关程度,从而帮助用户得到更准确的信息.
引用
收藏
页码:1598 / 1605
页数:8
相关论文
共 3 条
[1]  
PatternRecognition withFuzzyObjectiveFunctionAlgorithms. Bezedek,J.C. . 1981
[2]  
Clustering web documents: a phrase-based method for grouping search engine results[Ph.D.Thesis]. Oren,Z. . 1999
[3]  
Information control[P]. 英国专利:GB0422473D0,2004-11-10