个性化信息获取方法的研究

被引:0
作者
杨震
机构
[1] 大连理工大学
关键词
个性化; 数据挖掘; 模式识别; 信息获取; 文本分类算法; 奇异值分解;
D O I
暂无
年度学位
2004
学位类型
博士
导师
摘要
随着Internet技术的发展,信息获取对于人们的工作生活越来越重要。目前,针对极度膨胀的信息资源,人们主要使用搜索引擎(Search engine)或是一些智能代理软件(Information retrieval system and filtering system or Agent)来获取网上的信息资源。但是由于传统查询模型的限制,信息搜索的精度不高是人们经常遇到的问题,因此使用“用户特征信息”进行个性化信息搜索是今后信息获取工具的发展方向。但是目前不论是个性化信息需求特征的研究、个性化信息挖掘算法的研究、还是个性化信息获取系统的研究都存在很大的不足。 本文针对个性化信息获取的问题,从几个方面对其相应的理论与算法进行了研究,主要研究工作如下: (1) 个性化信息获取特点和方法的研究。 首先研究了个性的概念,然后分析了个性化信息获取的特点和方法,探讨了在个性化信息获取过程中个性化知识的运用,提出了用户特征模板的概念,进行了模板基本结构及应用分析,并给出了模板的示例。 (2) 个性化信息获取实证方法的研究。 对个性化信息获取系统的实验方法进行研究,充分考虑由于个性信息的差异带来的干扰因素,给出一个通用的、无实验者偏见的,对个性化信息获取系统和算法进行检验的实验方法。从查询结果的个性化评价角度,建立了对个性化信息服务系统性能及算法效率进行评价的指标体系。 (3) 基于奇异值分解的个性化信息挖掘算法的研究。 本文在研究了数据挖掘和模式识别技术在个性信息挖掘中的应用之后,提出了基于奇异值分解的个性化信息挖掘算法,并应用此算法进行了个性化信息挖掘实验,分析及提出了算法改进的方向。 (4) 奇异值分解算法和神经元网络法相结合的模式识别算法的研究。 研究了神经网络法,并结合SVD算法,提出一个使用用户信息需求特征构造个性化空间,同时改良样本空间和搜索空间,进行个性化信息检索的算法。 (5) 应用遗传算法进行个性特征提取算法的研究。 个性化信息获取方法的研究 研究了特征提取算法和遗传算法,提出了两种基于用户特征文档集合的用户 个性特征提取算法,并通过实验验证了算法的效率。 本文通过对个性化信息获取的评价方式、实验方法和挖掘算法等几方面的研 究,为今后个性化信息服务打下了基础。 关键词:个性化;数据挖掘;模式识别;信息获取;文本分类算法;奇异值分解;
引用
收藏
页数:118
共 48 条
[1]
现代模式识别.[M].孙即祥等编著;.国防科技大学出版社.2002,
[2]
模式识别.[M].杨光正等编著;.中国科学技术大学出版社.2001,
[3]
数据挖掘.[M].(美)R.格罗思(R.Groth)[著];侯迪;宋擒豹译;.西安交通大学出版社.2001,
[4]
知识工程与知识发现.[M].杨炳儒主编;.冶金工业出版社.2000,
[5]
模式识别.[M].边肇祺等编著;.清华大学出版社.2000,
[6]
高级人工智能.[M].史忠植编著;.科学出版社.1998,
[7]
面向MATLAB工具箱的神经网络理论与应用.[M].丛爽编著;.中国科学技术大学出版社.1998,
[8]
科技文献检索.[M].赖茂生;徐克敏等编著;.北京大学出版社.1994,
[9]
多准则决策引论.[M].齐寅峰著;.兵器工业出版社.1989,
[10]
学科分类与代码.[S].国家技术监督局中国标准化与信息分类编码研究所;西安交通大学;中国社会科学院文献情报中心..1992,