基于向量空间模型的文本自动分类系统的研究与实现

被引:278
作者
庞剑锋
卜东波
白硕
机构
[1] 中国科学院计算技术研究所!北京
关键词
文本分类; 中文信息处理; 向量空间模型;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
随着网络信息的迅猛发展 ,信息处理已经成为人们获取有用信息不可缺少的工具。文本自动分类系统是信息处理的重要研究方向 ,它是指在给定的分类体系下 ,根据文本的内容自动判别文本类别的过程。对文本分类中所涉及的关键技术 ,包括向量空间模型、特征提取、机器学习方法等进行了研究和探讨 ,并且提出了基于向量空间模型的文本分类系统的结构 ,并给出了评估方法和实验结果
引用
收藏
页码:23 / 26
页数:4
相关论文
共 2 条
  • [1] AnEvaluationofStatisticalApproachestoTextCategorization[J].YimingYang. InformationRetrieval.1999(1)
  • [2] 文本中词语权重计算方法的改进.2鲁松,白硕.2000InternationalConferenceonMultilingualInformationProcessing.2000