基于带权语义距离的网页预取方法

被引:2
作者
赵欣欣
索红光
刘玉树
张利萍
机构
[1] 北京理工大学计算机科学技术学院
关键词
网页预取; 带权语义距离; 用户兴趣森林;
D O I
10.15918/j.tbit1001-0645.2006.08.014
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
为了体现词条之间的关系,更好地为用户提供个性化服务,提出了在语义网络下对用户兴趣建模的思想.根据用户的访问历史,利用知网建立基于概念关系的用户兴趣森林模型.通过计算机链接描述文字的平均带权语义距离,预取用户将来可能访问的Web页.基于带权语义距离的网页预取方法对用户兴趣进行归纳,用带权语义距离反映词与词之间的概念关系.实验结果表明,此方法的命中率较高,漏取率较低,平均命中率可以达到61%左右.
引用
收藏
页码:708 / 711
页数:4
相关论文
共 3 条
[1]   数据挖掘技术在Web预取中的应用研究 [J].
徐宝文 ;
张卫丰 .
计算机学报, 2001, (04) :430-436
[2]   语义关系的表达和知识系统的建造 [J].
董振东 .
语言文字应用, 1998, (03) :79-85
[3]  
概念空间——定义、意义和局限[J]. 邓珞华.情报学报. 2003 (04)