融合多类特征的Web查询意图识别

被引:11
作者
伍大勇 [1 ]
赵世奇 [1 ,2 ]
刘挺 [1 ]
张宇 [1 ]
机构
[1] 哈尔滨工业大学社会计算与信息检索研究中心
[2] 百度在线网络技术有限公司
关键词
搜索引擎; 查询意图; 特征融合;
D O I
10.16451/j.cnki.issn1003-6059.2012.03.013
中图分类号
TP391.3 [检索机];
学科分类号
摘要
识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容.文中提出一种融合多类特征识别Web查询意图的方法.将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的分类特征.在人工标注的真实Web查询语料上采用文中方法进行查询意图识别实验,实验结果显示文中采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征进行查询意图识别,88.5%的测试查询获得准确的意图识别结果.
引用
收藏
页码:500 / 505
页数:6
相关论文
共 3 条
[2]   Web检索查询意图分类技术综述 [J].
张森 ;
王斌 .
中文信息学报, 2008, (04) :75-82
[3]  
A taxonomy of web search[J] . Andrei Broder. ACM SIGIR Forum . 2002 (2)