一种基于层次结构的科技论文分类模型

被引:1
作者
姚力群
吴高巍
机构
[1] 中国科学院自动化研究所复杂系统与智能科学重点实验室
[2] 中国科学院计算技术研究所
关键词
科技论文; 文本分类; 层次结构; 精度; 泛化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
互联网和科学研究的高速发展导致可利用的科技文献的数量急剧增加,为了更有效地利用这些文献、特别是英文文献,迫切需要对它们进行机器自动分类。传统的文本分类算法没有考虑科技文本具有明显层次结构的这一特征,在进行分类时无法达到满意的效果。论文针对这一特征提出了一种基于层次结构的文本分类模型,并对环境类科技论文进行了分类研究。结果表明,该模型能够稳定并有效地提高分类的精度,提高的幅度在1%到24%之间;同时,该模型还具有良好的泛化能力。
引用
收藏
页码:18 / 22
页数:5
相关论文
empty
未找到相关数据