一种不良信息过滤的文本预处理方法研究

被引:3
作者
吴慧玲
耿西伟
沈建京
贺广生
机构
[1] 河南郑州信息工程大学理学院
关键词
信息安全; 信息过滤; 文本预处理; 敏感词识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
目前互联网上含有不良内容的文本信息形式多变,本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的敏感信息的识别及解决的方法。研究表明在文本的分词处理前,对不良信息形式的变化进行预处理,能够提高过滤的效率。
引用
收藏
页码:58 / 60
页数:3
相关论文
共 3 条
[1]   一种基于PCA和RS的文本过滤方法 [J].
林琛 ;
李弼程 ;
宋辉 .
微计算机信息, 2005, (23) :161-163
[2]   基于内容的信息安全过滤技术 [J].
杨晓懿 ;
刘嘉勇 .
信息网络安全, 2004, (04) :47-49
[3]  
计算机自然语言处理.[M].王晓龙;关毅等编著;.清华大学出版社.2005,