基于模糊-粗糙集的文本分类方法

被引:6
作者
付雪峰
王明文
机构
[1] 江西师范大学计算机信息工程学院
[2] 江西师范大学计算机信息工程学院 江西 南昌 330027
关键词
模糊-粗糙集; 模糊-粗糙隶属函数; k-近邻方法; 文本分类; 邻域空间;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在文本分类过程中,类别之间的重叠以及标志类别属性的不足会导致类别的边界之间出现模糊不确定性和粗糙不确定性,而传统的k-近邻方法无法解决这一问题;同时,在传统的k-近邻方法以及其他一些改进的k-近邻方法中,最优七值的选取需要通过训练得到.文中借助模糊-粗糙集理论来改进传统的k-近邻方法,并使用基于距离的邻城空间,以不经训练地确定适宜每个待分类文本的k-值,最后将所提方法和其他一些k-近邻方法进行了实验比较,结果表明模糊-粗糙集方法能够在一定程度上提高分类的精度和召回率.
引用
收藏
页码:73 / 76
页数:4
相关论文
共 1 条
[1]   几种典型特征选取方法在中文网页分类上的效果比较 [J].
单松巍 ;
冯是聪 ;
李晓明 ;
不详 .
计算机工程与应用 , 2003, (22) :146-148