基于关联规则的中文文本分类算法的改进

被引:6
作者
张玉芳
杨柯
熊忠阳
机构
[1] 重庆大学计算机学院
关键词
关联规则挖掘; 中文文本; 文本自动分类算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
随着中文电子刊物和Web文档数量的飞速增加,中文文本自动分类工作变得日益重要.将文档视为事务,将关键词视为项,文本预处理时提出特征权重阈值,用构造的分类器对未知文档分类时,采用了CDD(Class Differen-tiate Degree)改进算法,对基于关联规则挖掘的中文文本自动分类方法进行了改进.实验结果表明,该算法能较快地获得可理解的规则并且具有较好的宏平均和微平均值.
引用
收藏
页码:114 / 117
页数:4
相关论文
共 2 条
[1]   基于关联规则挖掘的中文文本自动分类 [J].
王元珍 ;
钱铁云 ;
冯小年 .
小型微型计算机系统, 2005, (08) :1380-1383
[2]   多数据源关联规则挖掘算法研究 [J].
唐懿芳 ;
牛力 ;
张师超 .
广西师范大学学报(自然科学版), 2002, (04) :27-31