数字图书馆多种类型文献混合自动分类研究

被引:7
作者
李湘东 [1 ,2 ]
胡逸泉 [1 ]
巴志超 [1 ]
黄莉 [3 ]
机构
[1] 武汉大学信息管理学院
[2] 武汉大学信息资源研究中心
[3] 武汉大学图书馆
关键词
数字图书馆; 自动分类; 文献类型; 文献特征;
D O I
10.13663/j.cnki.lj.2014.11.009
中图分类号
G250.76 [电子图书馆、数字图书馆]; G254.1 [分类法];
学科分类号
1205 ; 120501 ;
摘要
探索数字图书馆的图书、期刊、网页等不同类型的馆藏文献进行分类组织时,多种类型文献单独及混合自动分类的特点。采用KNN等分类算法对多种类型文献进行分类实验并分析比较。仿真实验表明:随着实验文本数增加,各种类型文献的单独自动分类准确率有2%至7.8%不等的提升。图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达到85%以上;对多种类型文献实现基于自动分类的统一组织具有较高的可行性。
引用
收藏
页码:42 / 48
页数:7
相关论文
共 16 条
[1]   大数据对图书馆的启示 [J].
姜山 ;
王刚 .
图书馆工作与研究, 2013, (04) :52-54+79
[2]   大数据时代的图书馆服务浅析 [J].
杨海燕 .
图书与情报 , 2012, (04) :120-122
[3]   基于SVM的中文书目自动分类及应用研究 [J].
杨敏 ;
谷俊 .
图书情报工作, 2012, 56 (09) :114-119
[4]   基于SUMO本体的图书自动分类模型研究 [J].
马范玲 ;
胡泽文 .
情报杂志, 2011, (01) :168-173
[5]   基于机器学习的中文书目自动分类研究 [J].
王昊 ;
严明 ;
苏新宁 .
中国图书馆学报, 2010, 36 (06) :28-39
[6]   一种基于Bayes分类器的中文期刊自动分类系统 [J].
萧莉明 ;
于宽 ;
蔡珣 .
现代情报 , 2007, (04) :146-147+150
[7]   对数字化科技论文的自动分类研究 [J].
李森 ;
马军 ;
赵嫣 ;
雷景生 .
山东大学学报(理学版), 2006, (03) :81-84
[8]   基于语料和基于标引经验的自动分类模式比较 [J].
薛春香 ;
夏祖奇 ;
侯汉清 .
南京农业大学学报(社会科学版), 2005, (04) :85-92
[9]   中文Web概念挖掘系统设计与测评 [J].
章成志 ;
侯汉清 ;
丁璇 .
上海交通大学学报, 2003, (S1) :207-211
[10]  
基于标引经验和机器学习相结合的多层自动分类[J]. 何琳,侯汉清,白振田,张雪英. 情报学报. 2006 (06)