基于全文内容的学术论文研究方法自动分类研究

被引:27
作者
章成志 [1 ]
李卓 [1 ]
储荷婷 [2 ]
机构
[1] 南京理工大学经济管理学院信息管理系
[2] Palmer School of Library and Information Science, Long Island University
关键词
研究方法分类; 文本分类; 全文内容; 多标签分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; G353.1 [情报资料的分析和研究];
学科分类号
081203 ; 0835 ; 1205 ;
摘要
对学术论文所采用的研究方法进行自动分类,有助于研究方法使用行为的分析与研究方法的评估,进而为科研人员推荐或选择合适的研究方法提供依据。相比于摘要信息,全文内容包含更多关于研究方法的上下文信息,因此探索基于全文内容的学术论文研究方法自动分类具有重要的意义。本研究以图书情报领域的820篇学术论文全文为研究对象,邀请专家对其研究方法进行标注得到研究方法训练语料;采用多标签分类任务中问题转换法和算法自适应法,将朴素贝叶斯与支持向量机作为问题转换法的底层分类器,构建6种不同的分类模型,同时选用算法自适应法中的ML-KNN模型,分别对论文中使用的研究方法进行自动分类。实验结果表明,相较于学术论文的摘要信息,全文内容在研究方法分类的性能上有较大的提升;朴素贝叶斯算法在问题转换法的分类器链策略中表现最佳,F1值达到0.705;另外结果也表明不同的学术论文研究方法的特征表征能力不同,训练集的规模较少会导致分类的泛化效果差。
引用
收藏
页码:852 / 862
页数:11
相关论文
共 18 条
[2]   基于论文自动分类的社科类学科跨学科性研究 [J].
刘浏 ;
王东波 .
数据分析与知识发现 , 2018, (03) :30-38
[3]   基于内容分析的国内图书情报学研究方法创新研究——以共词分析方法为例 [J].
魏瑞斌 .
图书情报工作, 2016, (24) :107-114
[4]   学术论文中方法知识元的类型与描述规则研究 [J].
化柏林 .
中国图书馆学报, 2016, 42 (01) :30-40
[5]   机器学习在中文期刊论文自动分类研究中的应用 [J].
王昊 ;
叶鹏 ;
邓三鸿 .
现代图书情报技术, 2014, (03) :80-87
[6]   图书馆情报学界的研究方法:实践与发展 [J].
储荷婷 .
国家图书馆学刊 , 2014, (03) :3-14
[7]   针对中文学术文献的情报方法术语抽取 [J].
化柏林 .
现代图书情报技术, 2013, (06) :68-75
[8]   多标签数据挖掘技术:研究综述 [J].
李思男 ;
李宁 ;
李战怀 .
计算机科学, 2013, 40 (04) :14-21
[9]   使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[10]   中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32