信息安全中的变形关键词的识别

被引:16
作者
李钝
曹元大
万月亮
机构
[1] 北京理工大学计算机科学技术学院
关键词
关联规则; 安全过滤; 关键词识别; 变形文本;
D O I
暂无
中图分类号
TP309 [安全保密];
学科分类号
081206 [计算机网络与安全];
摘要
互联网中的不法分子为了逃避安全过滤,将不良信息中的文本进行变形,并在在网络中散布。为了识别和过滤这些不良文本,该文分析了其变形的特征,根据词同现和字符编码规则的不同对文本进行预处理,从文本中抽出包含有变形特征的有害词串。针对这些有害词串中各字符相邻、有序频繁出现的特点,提出采用基于关联规则自学习算法提取具有安全特色的关键词。实验表明,该方法可以改善传统方法在安全过滤过程中无法识别变形关键词的现状,对主题过滤提供补充,提高基于内容的安全过滤的效率。
引用
收藏
页码:155 / 156+159 +159
页数:3
相关论文
共 3 条
[1]
用于中文色情文本过滤的近邻法构造算法 [J].
苏贵洋 ;
李建华 ;
马颖华 ;
李生红 .
上海交通大学学报, 2004, (S1) :76-79
[2]
一种基于字同现频率的汉语文本主题抽取方法 [J].
马颖华 ;
王永成 ;
苏贵洋 ;
张宇萌 .
计算机研究与发展, 2003, (06) :874-878
[3]
基于关联规则的Web文档聚类算法 [J].
宋擒豹 ;
沈钧毅 .
软件学报, 2002, (03) :417-423