基于特征相关性的汉语文本自动分类模型的研究

被引:20
作者
张月杰
姚天顺
机构
[1] 东北大学计算机系
关键词
信息检索,自动分类,关键词抽取,相关性;
D O I
暂无
中图分类号
TP387, [];
学科分类号
摘要
本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测试分类模型实现性能,建立具有12类别的分类体系,并构造包含近500篇汉语新闻语料的测试集。实验结果表明,评价自动分类算法的两个重要指标:查全率和查准率,都比较令人满意。
引用
收藏
页码:50 / 56
页数:7
相关论文
共 4 条
  • [1] 汉语语料的自动分类
    吴军,王作英,禹锋,王侠
    [J]. 中文信息学报, 1995, (04) : 25 - 32
  • [2] 自然语言理解[M]. 清华大学出版社 , 姚天顺等编著, 2002
  • [3] 中国分类主题词表[M]. 华艺出版社 , 《中国图书馆图书分类法》编委会编, 1994
  • [4] 同义词词林[M]. 上海辞书出版社 , 梅家驹, 1983