提出了一种个性化网络信息检索系统(Personalized Internet Information Retrieval System,以下简称PIIRS),将网络信息查询与收集有机结合起来,建立面向用户兴趣的新型信息服务系统。PIIRS系统实现自动识别用户兴趣,自动生成用户角色模型,帮助用户生成检索请求,向用户推送信息等。同时,系统能根据用户兴趣模型判断返回结果和用户兴趣的匹配程度,并且实现全文提供功能。
论文分三个部分,共十一章。第一部分(第一章和第二章)为总论,首先论述了因特网信息资源开发利用的现状,分析了其中存在问题(第一章)。在此基础上分析了个性化信息检索的业务流程,给出了PIIRS系统的设计思想和原则,提出了PIIRS系统的整体结构,并对可行性进行了分析。第二部分(第三章至第六章)为关键技术研究,对用户建模技术、机器学习、搜索引擎技术、智能代理技术、WEB网页识别技术、信息过滤技术、数据挖掘技术、人机交互技术等相关技术进行研究和分析。第三部分(第七章至第十一章)为具体实现部分,详细地介绍了PIIRS系统的五个子系统的结构与技术实现,五个子系统分别为:用户需求与兴趣描述子系统、信息采集子系统、信息呈现与反馈子系统、主题挖掘子系统以及管理和调度子系统。
PIIRS系统分析与设计过程中所做的创新性的尝试主要有以下几个方面:①实现了基于用户兴趣的用户模型,该模型通过与用户的交互(主动交互和被动交互),不断地接收用户的兴趣和推测用户的兴趣,积累用户信息需求的偏好,实现自适应的检索;②提供了一种基于人机交互的反馈方法,对用户在结果呈现界面上的操作进行了归纳总结,设计了用户操作捕获算法,“隐性地”学习用户兴趣和偏好的变化;③提供了一种用户需求挖掘的方法,对用户已确定的信息做进一步的主题挖掘,由此推测或预测用户同一兴趣的不同表述方式或者挖掘出用户新的或未表达出来的兴趣;④在上述工作基础上提出了一套完整的基于用户兴趣的个性化网络信息检索的解决方案,该方案以用户兴趣模型为中心,以机器学习(主动学习和被动学习)和数据挖掘为手段,辅以网络机器人,具有很强的可行性和实用性。
论文的最后总结了PIIRS系统的特色,并指出了不足之处。