基于词素特征的轻量级域名检测算法

被引:37
作者
张维维 [1 ,2 ]
龚俭 [1 ,2 ]
刘茜 [1 ,2 ]
刘尚东 [1 ,2 ]
胡晓艳 [1 ,2 ]
机构
[1] 东南大学计算机科学与工程学院
[2] 江苏省计算机网络重点实验室
关键词
网络安全监测; 域名检测; 词素; 字符串切分; C4.5分类器;
D O I
10.13328/j.cnki.jos.004913
中图分类号
TP393.08 [];
学科分类号
0839 ; 1402 ;
摘要
对网络中DNS交互报文进行检测以发现恶意服务,是网络安全监测的一个重要手段,这种检测往往要求系统能够实时或准实时地发现监测域名中的可疑对象.面对庞大的域名集合,若对所有域名使用同样强度的监测通常开销过大.通过挖掘域名字面蕴含的词素(词根、词缀、拼音及缩写)特征,提出一种轻量级检测算法,能够快速锁定可疑域名,以便后续有针对性地进行DPI检测.实验结果表明:基于词素特征的检测算法比统计n元组频率分布的方法虽然略微增加了58.3%的内存开销,但却具备抗逃避能力以及更高的准确率(相对提高35.2%);与基于单词特征的方法相比,极大地降低了计算复杂度(相对降低64.8%),并减少了2.6%的内存开销,而准确率仅下降2.5%.
引用
收藏
页码:2348 / 2364
页数:17
相关论文
共 5 条
  • [1] Detecting Algorithmically Generated Domain-Flux Attacks With DNS Traffic Analysis
    Yadav, Sandeep
    Reddy, Ashwath Kumar Krishna
    Reddy, A. L. Narasimha
    Ranjan, Supranamaya
    [J]. IEEE-ACM TRANSACTIONS ON NETWORKING, 2012, 20 (05) : 1663 - 1677
  • [2] Identifying botnets by capturing group activities in DNS traffic[J] . Hyunsang Choi,Heejo Lee.Computer Networks . 2011 (1)
  • [3] Learning to Detect Malicious URLs
    Ma, Justin
    Saul, Lawrence K.
    Savage, Stefan
    Voelker, Geoffrey M.
    [J]. ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, 2011, 2 (03)
  • [4] Working Memory and Executive Control[and Discussion][J] . Alan Baddeley,Sergio Della Sala,T. W. Robbins,A. Baddeley.Philosophical Transactions of the Royal Society B: Biological Sciences . 1996 (1346)
  • [5] Alexa. http://www.alexa.com/topsites . 2014