一种基于语言概念空间聚类的信息检索方法

被引:5
作者
吴晨 [1 ]
张全 [2 ]
机构
[1] 中国科学院研究生院
[2] 中国科学院声学研究所
关键词
信息检索; 语言概念空间; 聚类; 自动阈值下的聚类划分;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
提出了一种以语言概念空间中的概念为聚类对象的信息检索方法以及适合于该方法的聚类算法。该聚类算法通过曲线拟合技术来实现文本的自动阈值确定和聚类划分,并最终通过聚类间的迭代和结果修正来完成整个聚类过程。概念的引入为解决词语的同义、多义问题提供了有力保障。实验表明,采用该方法的信息检索系统,与Jelinek-Mercer、k-means模型相比有较高的准确率和召回率,效果理想。
引用
收藏
页码:51 / 53+56 +56
页数:4
相关论文
共 1 条
[1]
Similarity-Based Models of Word Cooccurrence Probabilities.[J].Ido Dagan;Lillian Lee;Fernando C. N. Pereira.Machine Learning.1999, 1