实时文本分类系统的研究与实现

被引:5
作者
黄旭
朱艳琴
罗喜召
机构
[1] 苏州大学计算机科学与技术学院
关键词
信息安全; 内容安全; 文本分类;
D O I
暂无
中图分类号
TP311.52 [];
学科分类号
摘要
分析文本分类过程中影响实时性的因素,即分词处理高耗时和特征空间维数过高问题。结合网页过滤的实时应用提出一种实时文本分类方法,弱化分词处理过程,降低特征空间维数,以提高分类速度。通过优化特征项选取维持分类效果,基于贝叶斯理论实现实时文本分类系统。实验结果表明,该方法在维持精确率和召回率分别为85%,94%的情况下,显著提高了分类速度。
引用
收藏
页码:87 / 88+92 +92
页数:3
相关论文
共 7 条
  • [1] 文档聚类综述
    刘远超
    王晓龙
    徐志明
    关毅
    [J]. 中文信息学报, 2006, (03) : 55 - 62
  • [2] 基于后缀树模型的文本实时分类系统的研究和实现
    郭莉
    张吉
    谭建龙
    [J]. 中文信息学报, 2005, (05) : 16 - 23
  • [3] 基于内容的垃圾邮件过滤技术综述
    王斌
    潘文锋
    [J]. 中文信息学报, 2005, (05) : 1 - 10
  • [4] 一种中文网页自动分类方法的实现及应用
    冯是聪
    张志刚
    李晓明
    [J]. 计算机工程, 2004, (05) : 19 - 20+108
  • [5] 汉语自动分词系统的研究与实现[D]. 代建英.重庆大学. 2005
  • [6] 互联网信息内容安全过滤方法研究[D]. 李东艳.山西大学. 2004
  • [7] 机器学习[M]. 机械工业出版社 , (美)TomM.Mitchell著, 2003