基于日志挖掘的检索推荐系统

被引:3
作者
朱鲲鹏 [1 ]
刘文涵 [2 ]
王晓龙 [1 ]
刘远超 [1 ]
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 沈阳建筑大学研究生学院
关键词
网页推荐; 信息检索; 日志挖掘; 文档相关度;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域.
引用
收藏
页码:366 / 370
页数:5
相关论文
共 5 条
[1]   基于大规模日志分析的搜索引擎用户行为分析 [J].
余慧佳 ;
刘奕群 ;
张敏 ;
茹立云 ;
马少平 .
中文信息学报, 2007, (01) :109-114
[2]   基于Web-Log Mining的N元预测模型 [J].
苏中 ;
马少平 ;
杨强 ;
张宏江 .
软件学报, 2002, (01) :136-141
[3]  
搜索引擎用户点击行为分析[J]. 王继民,彭波.情报学报. 2006 (02)
[4]  
Incremental click-stream tree model: Learning from new users for web page prediction[J] . Distributed and Parallel Databases . 2006 (1)
[5]  
数据资源 .2 搜狗实验室. http://www.sogou.com/labs/resources.html . 2008