一个网页自动分类系统的设计

被引:2
作者
谭立球
谷士文
费耀平
机构
[1] 中南大学铁道校区信息技术研究中心
[2] 中南大学铁道校区信息技术研究中心 长沙
[3] 长沙
关键词
网页分类; 简单贝叶斯; 信息增益; 监督学习;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
本文介绍了设计的一个网页自动分类系统。介绍了预处理 ,批量训练 ,特征选择 ,在线测试和重归档等模块的设计过程。系统采用有指导的学习方法 ,选取 Naive Bayes作分类模型和信息增益作为特征提取方法。测试结果表明 ,系统获得了较好的精度
引用
收藏
页码:58 / 61
页数:4
相关论文
共 2 条
[1]  
Building Doman - Specific Search Engines with Machine Learning Techniques. Andrew McCallum,Kammal Nigam,Janson Rennie,etc. Proc AAAI -II Spring System on Intelligne Agents in Cyberspace . 1999
[2]  
Prdersen, A Comparative Study on Feature Selection in Text Categorization. Y,Yang. In Internatonal Conference on Machine Learning(ICML) . 1997