基于深度学习的网页分类算法研究

被引:3
作者
陈芊希
范磊
机构
[1] 上海交通大学电子信息与电气工程学院
关键词
网页分类; 深度学习; 栈式自动编码器; TFIDF;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
网页分类可将信息准确筛选与呈现给用户,提高信息检索的准确率。深度学习是机器学习中一个全新的领域,其本质是一种多层的神经网络学习算法,通过逐层初始化的方法来达到极高的准确率,被多次使用在图像识别、语音识别、文本分类中。提出了基于深度学习的网页分类算法,实验数据证明该方法可有效提高网页分类的准确率。
引用
收藏
页码:25 / 28
页数:4
相关论文
共 5 条
[1]   基于TFIDF的特征选择方法 [J].
王美方 ;
刘培玉 ;
朱振方 .
计算机工程与设计, 2007, (23) :5795-5796+5799
[2]   网页分类技术 [J].
孙建涛 ;
沈抖 ;
陆玉昌 ;
石纯一 .
清华大学学报(自然科学版), 2004, (01) :65-68
[3]   几种典型特征选取方法在中文网页分类上的效果比较 [J].
单松巍 ;
冯是聪 ;
李晓明 ;
不详 .
计算机工程与应用 , 2003, (22) :146-148
[4]  
基于视觉特征中文网页分类方法的研究.[D].段昕.山东大学.2007, 03
[5]  
Web page classification.[J].Xiaoguang Qi;Brian D. Davison.ACM Computing Surveys (CSUR).2009, 2