个性化网络信息检索系统的研究与实现

被引:0
作者
李广建
机构
[1] 中国科学院研究生院(文献情报中心)
关键词
信息检索; 个性化服务; 用户模型; 搜索引擎; 主题挖掘; 相关反馈;
D O I
暂无
年度学位
2002
学位类型
博士
导师
摘要
提出了一种个性化网络信息检索系统(Personalized Internet Information Retrieval System,以下简称PIIRS),将网络信息查询与收集有机结合起来,建立面向用户兴趣的新型信息服务系统。PIIRS系统实现自动识别用户兴趣,自动生成用户角色模型,帮助用户生成检索请求,向用户推送信息等。同时,系统能根据用户兴趣模型判断返回结果和用户兴趣的匹配程度,并且实现全文提供功能。 论文分三个部分,共十一章。第一部分(第一章和第二章)为总论,首先论述了因特网信息资源开发利用的现状,分析了其中存在问题(第一章)。在此基础上分析了个性化信息检索的业务流程,给出了PIIRS系统的设计思想和原则,提出了PIIRS系统的整体结构,并对可行性进行了分析。第二部分(第三章至第六章)为关键技术研究,对用户建模技术、机器学习、搜索引擎技术、智能代理技术、WEB网页识别技术、信息过滤技术、数据挖掘技术、人机交互技术等相关技术进行研究和分析。第三部分(第七章至第十一章)为具体实现部分,详细地介绍了PIIRS系统的五个子系统的结构与技术实现,五个子系统分别为:用户需求与兴趣描述子系统、信息采集子系统、信息呈现与反馈子系统、主题挖掘子系统以及管理和调度子系统。 PIIRS系统分析与设计过程中所做的创新性的尝试主要有以下几个方面:①实现了基于用户兴趣的用户模型,该模型通过与用户的交互(主动交互和被动交互),不断地接收用户的兴趣和推测用户的兴趣,积累用户信息需求的偏好,实现自适应的检索;②提供了一种基于人机交互的反馈方法,对用户在结果呈现界面上的操作进行了归纳总结,设计了用户操作捕获算法,“隐性地”学习用户兴趣和偏好的变化;③提供了一种用户需求挖掘的方法,对用户已确定的信息做进一步的主题挖掘,由此推测或预测用户同一兴趣的不同表述方式或者挖掘出用户新的或未表达出来的兴趣;④在上述工作基础上提出了一套完整的基于用户兴趣的个性化网络信息检索的解决方案,该方案以用户兴趣模型为中心,以机器学习(主动学习和被动学习)和数据挖掘为手段,辅以网络机器人,具有很强的可行性和实用性。 论文的最后总结了PIIRS系统的特色,并指出了不足之处。
引用
收藏
页数:153
共 46 条
[1]
人工智能及其应用.[M].蔡自兴;徐光〓[编著];.清华大学出版社.1996,
[2]
计算机情报检索.[M].赖茂生等编著;.北京大学出版社.1993,
[3]
Agent在智能信息检索中的应用研究 [J].
冯永杰 ;
孟宾 ;
翟玉庆 .
计算机应用研究, 2002, (02) :35-37
[4]
元搜索引擎及其主要技术 [J].
李广建 ;
黄崑 ;
不详 .
情报科学 , 2002, (02) :175-179
[5]
面向内容的信息服务研究 [J].
史田华 ;
甘利人 .
图书情报工作, 2002, (02) :86-88+22
[6]
基于Web挖掘的智能门户搜索引擎的研究 [J].
李岩 ;
陈新中 ;
杨炳儒 ;
不详 .
计算机工程与应用 , 2002, (04) :34-36
[7]
智能网站Agents的研究 [J].
殷信义 ;
刘锦高 ;
吴添华 ;
何炜丽 ;
Mohammed .
计算机应用研究, 2002, (01) :42-43
[8]
基于内容的网页特征提取 [J].
张义忠 ;
赵明生 ;
朱精南 .
计算机工程与应用, 2001, (10) :1-3
[9]
无词典高频字串快速提取和统计算法研究 [J].
韩客松 ;
王永成 ;
陈桂林 .
中文信息学报, 2001, (02) :23-30
[10]
Web网页识别算法研究 [J].
韩彬斌 ;
王培康 .
情报学报, 2001, (01) :77-81