一个基于朴素贝叶斯方法的web文本分类系统:WebCAT

被引:41
作者
余芳
机构
[1] 暨南大学计算机科学与技术系 广州
关键词
朴素贝叶斯分类; 特征选择; 互信息; TFIDF;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
摘要
如果缺乏好的对文本自动进行索引及摘要的工具,要从Internet浩瀚的文本中检索有用信息是很困难的。因此,文本分类成为信息检索(InformationRetrieval)的重要组成部分。朴素贝叶斯分类是应用统计理论进行文本分类的有效方法之一。该文结合web文本的特点使用朴素贝叶斯分类器实现了一个web文本分类系统WebCAT,并获得了很好的分类结果。
引用
收藏
页码:195 / 197
页数:3
相关论文
共 1 条
[1]
机器学习[M] (美)TomM.Mitchell著;曾华军;张银奎等译; 机械工业出版社 2003,