互联网中非法文本特征分析及其属性预选取新方法

被引:7
作者
张永奎
李东艳
机构
[1] 山西大学计算机科学系
关键词
内容过滤; 信息安全; 非法文本; 属性预选取;
D O I
暂无
中图分类号
TP393.08 [];
学科分类号
0839 ; 1402 ;
摘要
针对互联网中含不良内容的文本带来的信息安全问题,分析总结它们出现的特征,结合内容过滤技术,提出对此类文本的预处理方法,即带标点符号属性预选取方法。方法充分利用此类信息中词出现的特征,在属性预选取中,将标点符号作为潜在特征词的触发信息,进行文本预选属性集的提取。实验结果表明,该方法对增加合法文本与非法文本的区分度有较明显的效果。
引用
收藏
页码:113 / 115
页数:3
相关论文
共 3 条
[1]   网络内容安全分析与对策 [J].
赵仲孟 ;
陈剑 ;
张选平 ;
翁莉萍 .
计算机工程, 2002, (05) :41-43
[2]   基于内容过滤的网络监控技术研究 [J].
孙春来 ;
段米毅 ;
毛克峰 .
高技术通讯, 2001, (11) :36-38
[3]  
A Tutorial on Automated Text Categorisation .2 Sebastiani F. The 1st Argentinian Symposium on Artificial Intelligence . 1999