学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于用户日志的查询扩展统计模型
被引:58
作者
:
崔航
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学系统工程研究所
崔航
论文数:
引用数:
h-index:
机构:
文继荣
李敏强
论文数:
0
引用数:
0
h-index:
0
机构:
天津大学系统工程研究所
李敏强
机构
:
[1]
天津大学系统工程研究所
[2]
微软亚洲研究院
来源
:
软件学报
|
2003年
/ 09期
关键词
:
信息检索;
查询扩展;
用户日志;
日志挖掘;
D O I
:
10.13328/j.cnki.jos.2003.09.013
中图分类号
:
TP393.09 [];
学科分类号
:
080402 ;
摘要
:
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度.
引用
收藏
页码:1593 / 1599
页数:7
相关论文
共 2 条
[1]
Improving the effectiveness of information retrieval with local context analysis
Xu, JX
论文数:
0
引用数:
0
h-index:
0
机构:
BBN Technol, Cambridge, MA 02138 USA
Xu, JX
Croft, WB
论文数:
0
引用数:
0
h-index:
0
机构:
BBN Technol, Cambridge, MA 02138 USA
Croft, WB
[J].
ACM TRANSACTIONS ON INFORMATION SYSTEMS,
2000,
18
(01)
: 79
-
112
[2]
THE VOCABULARY PROBLEM IN HUMAN SYSTEM COMMUNICATION
FURNAS, GW
论文数:
0
引用数:
0
h-index:
0
FURNAS, GW
LANDAUER, TK
论文数:
0
引用数:
0
h-index:
0
LANDAUER, TK
GOMEZ, LM
论文数:
0
引用数:
0
h-index:
0
GOMEZ, LM
DUMAIS, ST
论文数:
0
引用数:
0
h-index:
0
DUMAIS, ST
[J].
COMMUNICATIONS OF THE ACM,
1987,
30
(11)
: 964
-
971
←
1
→
共 2 条
[1]
Improving the effectiveness of information retrieval with local context analysis
Xu, JX
论文数:
0
引用数:
0
h-index:
0
机构:
BBN Technol, Cambridge, MA 02138 USA
Xu, JX
Croft, WB
论文数:
0
引用数:
0
h-index:
0
机构:
BBN Technol, Cambridge, MA 02138 USA
Croft, WB
[J].
ACM TRANSACTIONS ON INFORMATION SYSTEMS,
2000,
18
(01)
: 79
-
112
[2]
THE VOCABULARY PROBLEM IN HUMAN SYSTEM COMMUNICATION
FURNAS, GW
论文数:
0
引用数:
0
h-index:
0
FURNAS, GW
LANDAUER, TK
论文数:
0
引用数:
0
h-index:
0
LANDAUER, TK
GOMEZ, LM
论文数:
0
引用数:
0
h-index:
0
GOMEZ, LM
DUMAIS, ST
论文数:
0
引用数:
0
h-index:
0
DUMAIS, ST
[J].
COMMUNICATIONS OF THE ACM,
1987,
30
(11)
: 964
-
971
←
1
→