学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种针对不良主题的文本过滤方法
被引:4
作者
:
孙登林
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学内容安全实验室
孙登林
论文数:
引用数:
h-index:
机构:
李生红
荆涛
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学内容安全实验室
荆涛
论文数:
引用数:
h-index:
机构:
刘功申
机构
:
[1]
上海交通大学内容安全实验室
来源
:
信息安全与通信保密
|
2008年
/ 02期
关键词
:
SVM;
文本过滤;
VSM N-gram;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
针对不良文本的过滤问题,文章提出了一种基于SVM分类器改进的文本过滤方法。该方法将传统的基于词语的分类方法改为基于词语元组的分类,增强了特征项的分辨率,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率。
引用
收藏
页码:92 / 93+96 +96
页数:3
相关论文
共 2 条
[1]
一种高性能的两类中文文本分类方法
[J].
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
樊兴华
;
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
孙茂松
.
计算机学报,
2006,
(01)
:124
-131
[2]
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
←
1
→
共 2 条
[1]
一种高性能的两类中文文本分类方法
[J].
樊兴华
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
樊兴华
;
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系智能技术与系统国家重点实验室
孙茂松
.
计算机学报,
2006,
(01)
:124
-131
[2]
A vector space model for automatic indexing[J] . G. Salton,A. Wong,C. S. Yang.Communications of the ACM . 1975 (11)
←
1
→