中文网页分类的研究与实现

被引:12
作者
程传鹏
机构
[1] 中原工学院
关键词
网页分类; 网页净化; 特征加权; KNN分类;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
描述了一个完整的中文网页分类系统的设计和实现过程,重点介绍了网页分类中的网页净化、特征加权、KNN分类等关键技术.并结合网页的特征,对分类中的特征加权公式进行了一定的改进.实验结果表明改进后的特征加权公式取得了较高的分类准确率.
引用
收藏
页码:61 / 64
页数:4
相关论文
共 1 条
  • [1] Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)