基于机器学习的网页暗链检测方法

被引:26
作者
周文怡 [1 ]
顾徐波 [2 ]
施勇 [1 ]
薛质 [1 ]
机构
[1] 上海交通大学网络空间安全学院
[2] 上海交通大学机械与动力工程学院
基金
国家自然科学基金重点项目;
关键词
暗链; 特征提取; 交叉验证; 分类与回归树; 随机森林; 梯度提升决策树;
D O I
10.19678/j.issn.1000-3428.0051189
中图分类号
TP18 [人工智能理论]; TP393.092 [];
学科分类号
140502 [人工智能];
摘要
在大数据时代下,传统暗链检测技术无法在海量网页中快速准确地识别出遭遇"暗链攻击"的网站。为此,提出一种引入机器学习的方法研究网页的暗链检测。该方法结合暗链的域名、相关文本及隐藏结构3种特征,分别采用分类与回归树、梯度提升决策树及随机森林3种算法来构建检测模型并对比其的性能。实验结果表明,该方法具有较高的准确性和可靠性,其中随机森林构建的检测模型分类准确率可以达到0. 984。
引用
收藏
页码:22 / 27
页数:6
相关论文
共 5 条
[1]
基于概率提升树的虹膜分割算法 [J].
周恺 ;
苏娟 .
计算机工程, 2017, 43 (08) :249-252+257
[2]
基于深度学习与随机森林的人脸年龄与性别分类研究 [J].
董兰芳 ;
张军挺 .
计算机工程, 2018, 44 (05) :246-251
[3]
基于机器学习的日志函数自动识别方法 [J].
贾周阳 ;
廖湘科 ;
刘晓东 ;
李姗姗 ;
周书林 ;
谢欣伟 .
计算机工程与科学, 2017, 39 (01) :111-117
[4]
基于统计机器学习的互联网暗链检测方法 [J].
孟池洁 ;
王伟 ;
耿光刚 .
计算机应用研究, 2015, 32 (09) :2779-2783
[5]
Bias and stability of single variable classifiers for feature ranking and selection [J].
Fakhraei, Shobeir ;
Soltanian-Zadeh, Hamid ;
Fotouhi, Farshad .
EXPERT SYSTEMS WITH APPLICATIONS, 2014, 41 (15) :6945-6958