基于粗糙集理论的文本分类算法研究

被引:7
作者
林珣 [1 ,2 ]
李志蜀 [2 ]
周勇 [3 ]
机构
[1] 西南财经大学经济信息工程学院
[2] 四川大学计算机学院
[3] 华兴职业技术学院
关键词
文本分类; 粗糙集; 约简;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类。实验表明,该方法的查准率和查全率都有所提高。
引用
收藏
页码:239 / 240+263 +263
页数:3
相关论文
共 9 条
[1]  
粗糙集理论与方法.[M].张文修等编著;.科学出版社.2001,
[2]   A support vector machine classifier with rough set-based feature selection for breast cancer diagnosis [J].
Chen, Hui-Ling ;
Yang, Bo ;
Liu, Jie ;
Liu, Da-You .
EXPERT SYSTEMS WITH APPLICATIONS, 2011, 38 (07) :9014-9022
[3]   信息检索的粗糙集方法 [J].
何薇 ;
徐伟华 .
重庆理工大学学报(自然科学版), 2010, 24 (09) :84-88
[4]   基于粗糙集的文本分类特征选择算法 [J].
张志飞 ;
苗夺谦 .
智能系统学报, 2009, 4 (05) :453-457
[5]   基于粗糙集的文本分类方法在网络科技资源应用集成环境中的应用 [J].
侯凡 ;
周明全 ;
耿国华 ;
李杰 .
计算机应用与软件, 2009, 26 (03) :88-91
[6]   基于粗糙集和模糊聚类理论的文本分类系统的研究与实现 [J].
郑丽英 ;
王海涌 ;
刘丽艳 .
铁道学报, 2007, (01) :45-49
[7]   基于粗糙集的文本分类方法研究 [J].
卢娇丽 ;
郑家恒 .
中文信息学报, 2005, (02) :66-70
[8]   基于粗糙集的文本自动分类方法的研究 [J].
王汉萍 ;
孟庆春 ;
张继军 ;
李占斌 ;
殷波 .
信息技术, 2003, (08) :46-48
[9]   粗糙集理论中的离散化问题 [J].
侯利娟 ;
王国胤 ;
聂能 ;
吴渝 .
计算机科学, 2000, (12) :89-94