一种基于粗糙集增量式规则学习的问题分类方法研究

被引:8
作者
李鹏
王晓龙
关毅
机构
[1] 哈尔滨工业大学计算机学院
基金
国家自然科学基金重点项目;
关键词
粗糙集; 问题分类; 增量式学习; 决策表; 特征选择;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
该文提出一种基于粗糙集增量式规则自动学习来实现问题分类的方法,通过深入提取问句特征并采用决策表形式构建训练语料,利用机器学习的方法自动获取分类规则。与其他方法相比优势在于,用于分类的规则自动生成,并采用粗糙集理论的简约方法获得优化的最小规则集;首次在问题分类中引入增量式学习理念,不但提高了分类精度,而且避免了繁琐的重新训练过程,大大提高了学习速度,并且提高了分类的可扩展性和适应性。对比实验表明,该方法分类精度高,适应性好。在国际TREC2005Q/A实际评测中表现良好。
引用
收藏
页码:1127 / 1130
页数:4
相关论文
共 5 条
[1]   基于改进贝叶斯模型的问题分类 [J].
张宇 ;
刘挺 ;
文勖 .
中文信息学报, 2005, (02) :100-105
[2]   基于Rough set理论的增量式规则获取算法 [J].
于洪 ;
杨大春 ;
吴中福 .
小型微型计算机系统, 2005, (01) :36-41
[3]   基于条件信息熵的决策表约简 [J].
王国胤 ;
于洪 ;
杨大春 .
计算机学报, 2002, (07) :759-766
[4]  
Rough集理论与知识获取.[M].王国胤编著;.西安交通大学出版社.2001,
[5]   Scaling question answering to the Web [J].
Kwok, C ;
Etzioni, O ;
Weld, D .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2001, 19 (03) :242-262