基于粗糙集的文本分类方法在网络科技资源应用集成环境中的应用

被引:2
作者
侯凡 [1 ]
周明全 [2 ]
耿国华 [1 ]
李杰 [1 ]
机构
[1] 西北大学信息科学与技术学院
[2] 北京师范大学信息科学与技术学院
关键词
文本分类; 权重函数; 粗糙集; 属性约简;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
网络科技资源应用集成环境所汇集到的信息纷繁复杂,使得用户对信息的浏览、检索造成了一定的困难。首先对所有汇集到的信息向量化,然后通过对IF-IDF权重构造函数进行了改良,使其更加适合本项目的实际情况,接着利用粗糙集理论进行属性约简,生成最终的决策表对科技信息进行分类。最终结果证明,提出的分类系统比传统人工分类的效率有较大提高,取得了良好的效果。
引用
收藏
页码:88 / 91
页数:4
相关论文
共 5 条
[1]  
Flash MX 2004 ActionScript 2.0 与RIA应用程序开发.[M].颜金桫; 编著.电子工业出版社.2005,
[2]  
Rough集理论与知识获取.[M].王国胤编著;.西安交通大学出版社.2001,
[3]   基于权值调整的文本分类改进方法 [J].
鲁明羽 ;
李凡 ;
庞淑英 ;
陆玉昌 ;
周立柱 .
清华大学学报(自然科学版), 2003, (04) :513-515+520
[4]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[5]   Web网页识别中的特征选择问题研究 [J].
朱明 ;
王军 ;
王俊普 .
计算机工程, 2000, (08) :35-37