基于规则置信度调整的关联文本分类

被引:3
作者
林堃
白清源
谢丽聪
谢伙生
张莹
机构
[1] 福州大学数学与计算机科学学院
关键词
文本分类; 关联规则; 置信度; 调整;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
基于关联规则的文本分类方法ARC-BC是目前已知的分类效果最好的关联规则分类算法。本文提出了利用ARC-BC分类器的封闭测试的结果对分类器进行调整规则置信度的算法RCA(Rules Confidence Adjustment),参与正确分类行为次数多于参与错误分类行为次数(即"威信"较高)的规则应该拥有更高的置信度,反之,就赋予更低的置信度。实验结果表明,经过RCA算法调整的关联文本分类器的分类效果得到显著提高。
引用
收藏
页码:173 / 176
页数:4
相关论文
共 1 条
[1]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47