学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
实时文本分类系统的研究与实现
被引:5
作者
:
论文数:
引用数:
h-index:
机构:
黄旭
论文数:
引用数:
h-index:
机构:
朱艳琴
罗喜召
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院
罗喜召
机构
:
[1]
苏州大学计算机科学与技术学院
来源
:
计算机工程
|
2008年
/ 18期
关键词
:
信息安全;
内容安全;
文本分类;
D O I
:
暂无
中图分类号
:
TP311.52 [];
学科分类号
:
摘要
:
分析文本分类过程中影响实时性的因素,即分词处理高耗时和特征空间维数过高问题。结合网页过滤的实时应用提出一种实时文本分类方法,弱化分词处理过程,降低特征空间维数,以提高分类速度。通过优化特征项选取维持分类效果,基于贝叶斯理论实现实时文本分类系统。实验结果表明,该方法在维持精确率和召回率分别为85%,94%的情况下,显著提高了分类速度。
引用
收藏
页码:87 / 88+92 +92
页数:3
相关论文
共 7 条
[1]
文档聚类综述
刘远超
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
刘远超
论文数:
引用数:
h-index:
机构:
王晓龙
徐志明
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
徐志明
论文数:
引用数:
h-index:
机构:
关毅
[J].
中文信息学报,
2006,
(03)
: 55
-
62
[2]
基于后缀树模型的文本实时分类系统的研究和实现
论文数:
引用数:
h-index:
机构:
郭莉
张吉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张吉
论文数:
引用数:
h-index:
机构:
谭建龙
[J].
中文信息学报,
2005,
(05)
: 16
-
23
[3]
基于内容的垃圾邮件过滤技术综述
王斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
王斌
潘文锋
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
潘文锋
[J].
中文信息学报,
2005,
(05)
: 1
-
10
[4]
一种中文网页自动分类方法的实现及应用
冯是聪
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
冯是聪
张志刚
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
张志刚
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
李晓明
[J].
计算机工程,
2004,
(05)
: 19
-
20+108
[5]
汉语自动分词系统的研究与实现[D]. 代建英.重庆大学. 2005
[6]
互联网信息内容安全过滤方法研究[D]. 李东艳.山西大学. 2004
[7]
机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003
←
1
→
共 7 条
[1]
文档聚类综述
刘远超
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
刘远超
论文数:
引用数:
h-index:
机构:
王晓龙
徐志明
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院
徐志明
论文数:
引用数:
h-index:
机构:
关毅
[J].
中文信息学报,
2006,
(03)
: 55
-
62
[2]
基于后缀树模型的文本实时分类系统的研究和实现
论文数:
引用数:
h-index:
机构:
郭莉
张吉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张吉
论文数:
引用数:
h-index:
机构:
谭建龙
[J].
中文信息学报,
2005,
(05)
: 16
-
23
[3]
基于内容的垃圾邮件过滤技术综述
王斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
王斌
潘文锋
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
潘文锋
[J].
中文信息学报,
2005,
(05)
: 1
-
10
[4]
一种中文网页自动分类方法的实现及应用
冯是聪
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
冯是聪
张志刚
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
张志刚
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学技术系
李晓明
[J].
计算机工程,
2004,
(05)
: 19
-
20+108
[5]
汉语自动分词系统的研究与实现[D]. 代建英.重庆大学. 2005
[6]
互联网信息内容安全过滤方法研究[D]. 李东艳.山西大学. 2004
[7]
机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003
←
1
→