一个基于向量空间模型的中文文本自动分类系统

被引:40
作者
朱华宇
孙正兴
张福炎
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 南京大学多媒体技术研究所!南京
基金
高等学校骨干教师资助计划;
关键词
文本分类; 中文文本; 向量空间模型; 特征提取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
介绍了一个基于向量空间模型的中文文本自动分类系统,重点阐述了特征提取、空间降维、层次分类和分类器训练等技术的实现方法。实践表明:该系统对文本分类具有较高的平均查全率和平均精度。
引用
收藏
页码:15 / 17+63 +63
页数:4
相关论文
共 4 条
  • [1] 人工智能与知识工程[M]. 南京大学出版社 , 陈世福等编著, 1997
  • [2] An Evaluation of Statistical Approaches to Text Categorization
    Yiming Yang
    [J]. Information Retrieval, 1999, 1 (1-2): : 69 - 90
  • [3] SUPPORT-VECTOR NETWORKS
    CORTES, C
    VAPNIK, V
    [J]. MACHINE LEARNING, 1995, 20 (03) : 273 - 297
  • [4] Automatic Text Processing:The Transformation,Analysis,and Retrieval of Information by Computer .2 Salton. Addison-Wesley,Reading,Mass . 1989