Web上的信息过滤问题研究

被引:0
作者
曲建华
机构
[1] 山东师范大学
关键词
Web,信息过滤,个性化模式,智能Agent,神经网络;
D O I
暂无
年度学位
2003
学位类型
硕士
导师
摘要
随着Internet的飞速发展,网络上的信息呈指数增长,其内容之丰富,种类之繁多,堪称世界上最大的信息资源,如何能够更有效、更准确地找到自己感兴趣的内容,滤除与自己的需求无关的信息,真正做到“各取所需”,关系到我们能否充分利用这个巨大的信息资源的问题,这已成为基于Internet的网络信息获取的热点问题,也是本文的研究目标。 近年来,在信息查询领域中兴起了信息过滤(information filtering)技术,它是一种系统化的方法,用来从动态的信息流中抽取出符合用户个性化需求的信息。相比于传统的信息检索模式,信息过滤技术具有较高的可扩展性,能适应大规模用户群和海量信息;可以为用户提供及时、个性化的信息服务;具有了一定的智能和较高的自动化程度。 文本将介绍Web上的信息过滤的基本问题,包括:信息过滤的体系结构,过滤系统的特点及分类,检索和过滤的关系,过滤系统常用的模型以及过滤系统的性能评价指标等,从总体上对过滤问题进行一定的讲述,指出现存的信息过滤系统中存在的问题。 针对过滤系统中存在的部分问题,在现有的信息过滤技术的基础上,结合机器学习中的神经网络方法和智能体Agent的技术,对现有的过滤算法进行了一定的改进,并给出了具有智能性、主动性和扩充性的基于多Agents的个性化过滤系统的模型。本文的主要研究内容为以下三个部分:个性化模式库的表示、建立和维护;改进的过滤匹配算法;基于多Agents的智能过滤系统模型。 对于个性化模式库的表示,本文给出了一种多用户多主题的分类表示方式,使得每个Profile文件只表达一个用户的一个主题,可以更清晰的表达用户的兴趣;对于个性化模式库的建立,本文采用了机器学习中的Hopfield神经网络模型,Hopfield网络具有丰富的联想记忆功能,可以用来对用户兴趣进行联想,建立用户的初始个性化模式库;对于个性化模式库的维护,采用了基于用户反馈的学习方法。 在改进的过滤匹配算法当中,本文结合了布尔模型和向量空间模型的优点,综合考虑了过滤过程中的匹配度和相似度,给出了新的过滤匹配算法,并通过对比模拟实 山东师范大学硕士学位论文 验证明了算法的有效性。 结合智能Agent的特性,本文提出了基于多Agents的个性化智能过滤系统模型, 对系统中Agent的关系、功能、结构以及系统实现的关键技术和流程进行了详细介绍。 该模型充分利用了Agent智能体的特性,将从智能性、主动性、扩充性、易维护性等 方面弥补了现有信息过滤系统中的不足,提高速度和精度,帮助人们最大限度的发现 自己感兴趣的问题。
引用
收藏
页数:58
共 8 条
[1]
基于Internet的旅游散客管理系统 [J].
曲建华 ;
王化雨 ;
孟强 .
计算机应用研究, 2002, (04) :122-124
[2]
查全率与查准率之间关系的理论研究 [J].
邓汉成 ;
王敏芳 ;
王瑛 .
情报学报, 2000, (04) :359-362
[3]
面向Internet的个性化智能信息检索 [J].
汪晓岩 ;
胡庆生 ;
李斌 ;
庄镇泉 .
计算机研究与发展, 1999, (09) :1039-1046
[4]
网络信息搜寻技术与发展 [J].
邹涛 ;
张福炎 .
计算机工程与科学, 1998, (04)
[5]
一种面向Agent的设计过程模型 [J].
刘弘 ;
曾广周 ;
林宗楷 .
小型微型计算机系统, 1998, (06)
[6]
软件Agent的构筑 [J].
刘弘 ;
曾广周 ;
林宗楷 .
计算机科学, 1998, (02) :24-28+48
[7]
The Info Finder Agent: L earning user interests through heuristic phrase extraction..Krulwieh B; Burkoy C;.IEEE Expert.1997,
[8]
人工智能及其应用.[M].蔡自兴;徐光〓[编著];.清华大学出版社.1996,