基于用户评价的查询串与搜索结果特征权重计算

被引:3
作者
吴春尧
曲文龙
杨炳儒
机构
[1] 北京科技大学信息工程学院
关键词
网页排名; 特征权重; EM算法; 模拟退火算法;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
081102 [检测技术与自动化装置];
摘要
提出了利用大量用户评价结果来进行特征权重的计算方法,用于解决搜索引擎中查询串与搜索结果的相似度分析。该方法完全利用用户对搜索结果的“潜在评价”来进行。用户对输入查询串所做的点击反映了其内部的关联性,该文提出的方法可获取这种关联性,对该问题建立了数学模型,利用EM算法解决了特征权重的计算。由于模型的函数比较复杂,难于计算其收敛性,因此,使用了模拟退火算法作为EM算法的补充,用于验证算法的收敛性。实验使用百度搜索引擎在竞价广告上进行,提取的测试数据样本为100个广告和144 132个query,获得的数据结果显示,所有特征收敛到全局最优解,抽样部分数据获得检索相似准确率为93.32%,召回率为87.43%。
引用
收藏
页码:152 / 154
页数:3
相关论文
共 2 条
[1]
基于EM算法的汉语自动分词方法 [J].
李家福 ;
张亚非 .
情报学报, 2002, (03) :269-272
[2]
一种基于EM非监督训练的自组织分词歧义解决方案 [J].
王伟 ;
钟义信 ;
孙建 ;
杨力 .
中文信息学报, 2001, (02) :38-44