基于匈牙利匹配算法的钓鱼网页检测方法

被引:12
作者
张卫丰 [1 ]
周毓明 [2 ]
许蕾 [2 ]
徐宝文 [2 ]
机构
[1] 南京邮电大学计算机学院
[2] 南京大学计算机科学与工程系
关键词
钓鱼网页; 网页特征; 匈牙利匹配算法; 相似性; 网页签名;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果.一系列的仿真实验表明文中方法可行,并具有较高的准确率和召回率.
引用
收藏
页码:1963 / 1975
页数:13
相关论文
共 4 条
[1]   基于嵌套EMD的钓鱼网页检测算法 [J].
曹玖新 ;
毛波 ;
罗军舟 ;
刘波 .
计算机学报, 2009, 32 (05) :922-929
[2]   Teaching Johnny Not to Fall for Phish [J].
Kumaraguru, Ponnurangam ;
Sheng, Steve ;
Acquisti, Alessandro ;
Cranor, Lorrie Faith ;
Hong, Jason .
ACM TRANSACTIONS ON INTERNET TECHNOLOGY, 2010, 10 (02)
[3]   Techniques for evaluating fault prediction models [J].
Jiang, Yue ;
Cukic, Bojan ;
Ma, Yan .
EMPIRICAL SOFTWARE ENGINEERING, 2008, 13 (05) :561-595
[4]  
The battle against phishing: Dynamic security skins. RACHNA DHAMIJA,TYGAR J D. SOUPS’05: Proceedings of the 2005 symposium on Usable privacy and security . 2005