基于量子免疫算法的文本分类算法的研究

被引:0
作者
张征杰
机构
[1] 河南工业大学
关键词
文本分类; 免疫算法; 量子免疫算法; 量子计算;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
文本分类是一种集合机器学习、统计分析、模式识别和信息检索等技术为于一体的文本挖掘方法。它的分类过程一般包括文本的表示、分类器的建立与训练和分类结果的评价,其中文本的表示又可以分为文本预处理、特征选择和权值的计算。通过文本分类,我们可以将大量的文本信息进行自动归类,然后根据划分为不同的类别,可以方便对文本进行使用和管理。另外,文本分类是数据挖掘和自然语言处理的一部分,加深对于文本分类的研究对于它们亦有非同一般的意义。所以,对于文本分类进行研究和探讨是一项极具实用价值和理论意义的事情。 文本分类问题是自然语言处理领域涉及较多的学科和专业知识的一个复杂问题,大量的学者进行深入的研究,但是仍存在许多的问题有待解决。本论文是针对由基于空间向量模型文本对象的高维性和稀疏性的缺陷,并且由此导致文本分类的时间复杂度加大和文本分类的性能受到极大的降低的问题出发,获得一种能够充分利用它的高维性和稀疏性的特点的文本分类算法。于是,本论文将量子免疫算法应用到文本分类中,不仅大大减少文本分类的稀疏性,并且起到了更好地利用文本向量高维性的作用。 本文首先介绍了量子计算方面的知识;其次,对免疫算法进行了一些知识探讨;然后,对量子免疫算法进行了比较深入的研究,对它做了适当的调整并验证了它优于免疫算法和量子遗传方法;最后,将量子免疫算法具体地应用于文本分类中,并且用实验证明此种基于量子免疫算法的文本分类算法在某些方面的分类性能上的确优于其它常见的文本分类算法。
引用
收藏
页数:72
共 18 条
[1]
基于统计方法的中文文本自动分类研究 [D]. 
骆昌日 .
华中师范大学,
2004
[2]
基于概念的文本表示模型 [J].
陈龙 ;
范瑞霞 ;
高琪 .
计算机工程与应用, 2008, (20) :162-164
[3]
文本的图表示初探 [J].
周昭涛 ;
卜东波 ;
程学旗 .
中文信息学报, 2005, (02) :36-43
[4]
人工免疫系统进展与展望 [J].
焦李成 ;
杜海峰 .
电子学报, 2003, (10) :1540-1548
[5]
Learning and optimization using the clonal selection principle [J].
de Castro, LN ;
Von Zuben, FJ .
IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION, 2002, 6 (03) :239-251
[6]
An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90
[7]
GENETIC ALGORITHMS IN CONTROLLER-DESIGN AND TUNING [J].
VARSEK, A ;
URBANCIC, T ;
FILIPIC, B .
IEEE TRANSACTIONS ON SYSTEMS MAN AND CYBERNETICS, 1993, 23 (05) :1330-1339
[8]
Modeling genetic algorithms with Markov chains.[J].Allen E. Nix;Michael D. Vose.Annals of Mathematics and Artificial Intelligence.1992, 1
[9]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
[10]
A Comparative Study on Feature Selection in Text Categorization..Yang Y; Pedersen J O;.The Fourteenth International Conference on Machine Learning.1997,