基于Web挖掘的个性化用户兴趣模型的研究

被引:0
作者
教巍巍
机构
[1] 东北师范大学
关键词
个性化用户模型; Web挖掘; 网页兴趣度; 文本聚类; 向量空间模型; 个性化服务;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
随着信息技术的发展,特别是因特网应用的普及,出现了“信息爆炸”的问题,即信息非常丰富而知识相对匮乏。如何管理WWW上的大量信息,以满足用户不断增长的个性化的信息需求,是研究人员面临的新课题,个性化服务技术已经成为当前信息服务领域的研究热点之一。所谓个性化服务就是指对不同的用户采取不同的服务策略,提供不同的服务内容,其关键在于必须知道用户的兴趣,并准确地建立用户兴趣模型。用户兴趣模型能否准确地反映用户的兴趣决定了系统提供个性化服务的质量。 本文首先对当前主要的Web挖掘技术和用户兴趣建模技术进行了分析,提出了一种把Web用户浏览内容和浏览行为相结合的方法来构建用户兴趣模型。然后,对文本页面的表示技术进行了初步的探讨和研究,包括:文本的向量空间模型表示,特征项的选择和抽取算法,将文本页面表示为结构化的向量空间模型格式等。 接着,本文重点探讨了文本页面的聚类分析和用户兴趣模型的建立两个方面。在分析了现有聚类算法和实际应用环境后,提出了采用比较新的CLOPE聚类算法,实现了CLOPE算法在用户聚类方面的应用,并对关键技术进行了探讨和改进,丰富了智能化推荐页面的深度。在聚类结果的基础上,采用二层树状用户兴趣模型来表示每一个用户的兴趣:表示为(I1,InterestDegree(I1)),(I2,InterestDegree(I2)),…,(Ik,InterestDegree(Ik))的加权矢量格式。 最后,对上述改进方法做了较为全面的模拟试验。根据模拟试验分析表明,本文提出的用户兴趣模型能较准确地描述用户兴趣所在,在个性化推荐服务中具有实际应用价值。 本文进一步工作将致力于用户兴趣模型准确性的提高,并将得到的用户兴趣模型应用于个性化系统的推荐服务中。
引用
收藏
页数:56
共 13 条
[1]
用户兴趣空间的Web页面聚类 [J].
郭岩 .
微电子学与计算机, 2003, (08) :10-14+68
[2]
基于向量空间模型的中文信息检索技术研究 [J].
杨小平 ;
丁浩 ;
黄都培 ;
不详 .
计算机工程与应用 , 2003, (15) :109-111
[3]
基于智能Agent的用户兴趣发现和更新 [J].
白丽君 ;
张永奎 ;
李荣陆 .
计算机工程, 2003, (02) :236-237
[4]
个性化服务技术综述 [J].
曾春 ;
邢春晓 ;
周立柱 .
软件学报, 2002, (10) :1952-1961
[5]
用户兴趣模型的表示和更新机制 [J].
林鸿飞 ;
杨元生 .
计算机研究与发展, 2002, (07) :843-847
[6]
一个个性化的信息搜集Agent的设计与实现 [J].
潘金贵 ;
胡学联 ;
李俊 ;
张灵玲 .
软件学报, 2001, (07) :1074-1079
[7]
Web挖掘研究 [J].
韩家炜 ;
孟小峰 ;
王静 ;
李盛恩 .
计算机研究与发展, 2001, (04) :405-414
[8]
智能用户接口Agent的用户模型与系统构建方法 [J].
孙铁利 ;
邓安生 .
东北师大学报(自然科学版), 2000, (03) :115-119
[9]
Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520
[10]
Internet上的文本数据挖掘 [J].
王伟强 ;
高文 ;
段立娟 .
计算机科学, 2000, (04) :32-36