信息检索的概率模型

被引:11
作者
邢永康
马少平
机构
[1] 清华大学计算机系智能技术与系统国家重点实验室
[2] 清华大学计算机系智能技术与系统国家重点实验室 北京
[3] 北京
关键词
Information retrieval; Probability models; Classical models;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
<正> 1 引言信息检索是以文档为主要的处理对象,对其结构化和非结构化数据包括多媒体信息进行储存、索引、查询和管理的方法和技术。给定一批文档D={d|d1,d2,…,dj,…,dm}及用户的检索要求q(简称检索)。我们将构成文档的基本项,如构成文本文档的单词、短语等,构成图像文档的纹理特征项、图像内容标注的单词等,统称为索引项,用集合表示为T={t|t∈T}={t1,t2,…,t_n}。同理,将构成检索的基本项统称为检索项。一般情况下,检索项和索引项是同一个集合。信息检索的目标是快速而准确地找出满足检索的q文档(称这些文档与检索q相关)。在大多数情况下,还需要根据相关程度对这些
引用
收藏
页码:13 / 17
页数:5
相关论文
empty
未找到相关数据