网络日志规模分析和用户兴趣挖掘

被引:63
作者
郭岩
白硕
杨志峰
张凯
机构
[1] 中国科学院计算技术研究所软件研究室
关键词
Web日志挖掘; 日志规模; 兴趣; 用户行为;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数.
引用
收藏
页码:1483 / 1496
页数:14
相关论文
共 5 条