用于文本分类和文本聚类的特征抽取方法的研究

被引:12
作者
孟春艳 [1 ,2 ]
机构
[1] 山东大学计算机科学与技术学院
[2] 山东电子职业技术学院计算机系
关键词
文本分类; 文本聚类; 特征抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本信息处理已成为一门日趋成熟、应用面日趋广泛的学科。文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。面对急速膨胀的各种文本信息,通过使用文本分类和聚类技术,人们能对这些信息进行高效地组织和整理,以便于实现信息的准确定位和分流,从而提高用户查询和检索的效率。本文针对文本信息处理中最重要的研究方向——文本分类和聚类技术展开了研究,分析了特征抽取法在文本分类和文本聚类中应用的重要性,以及论证了为何要对文本进行特征抽取,最后分别阐述了用于文本分类和文本聚类的特征抽取方法。
引用
收藏
页码:149 / 150
页数:2
相关论文
共 4 条
[1]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[2]   一种基于参考点和密度的快速聚类算法 [J].
马帅 ;
王腾蛟 ;
唐世渭 ;
杨冬青 ;
高军 .
软件学报, 2003, (06) :1089-1095
[3]   文本自动分类关键技术研究 [J].
张冬慧 ;
孙波 ;
徐照财 ;
程显毅 .
微计算机信息, 2008, (06) :197-199
[4]  
文本分类中的特征降维方法综述[J]. 陈涛,谢阳群.情报学报. 2005 (06)