科技论文的研究设计指纹自动识别方法构建与实现

被引:7
作者
钱力 [1 ]
张晓林 [1 ]
王茜 [2 ]
机构
[1] 中国科学院文献情报中心
[2] 中国医学科学院医学信息研究所图书馆
关键词
研究设计指纹; 语义标注知识抽取; 机器学习;
D O I
10.13266/j.issn.0252-3116.2018.02.018
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
[目的 /意义]从科技论文中自动识别与抽取研究设计指纹,能够为科研人员项目设计、研究方法的有效性评估、研究过程问题诊断、研究结果鉴别与评价提供重要的方法论和研究操作支撑。[方法 /过程]基于科技论文研究设计指纹的概念模型,提出基于多规则模式混合机器学习方法,设计并实现指纹识别算法,并以数据挖掘领域的期刊文献数据为例,对识别算法的可行性与有效性进行分析验证。[结果 /结论]除研究数据与研究趋势外,其他研究设计指纹识别准确率的认可度都基本达到80%以上,覆盖率的认可度,除研究工具与研究数据外,基本达到80%以上。
引用
收藏
页码:135 / 143
页数:9
相关论文
共 12 条
[1]   基于科技文献的研究设计指纹描述框架研究 [J].
钱力 ;
张晓林 ;
王茜 .
大学图书馆学报, 2015, 33 (01) :14-20
[2]   面向外文科技文献信息的知识组织体系建设思路 [J].
孙坦 ;
刘峥 .
图书与情报, 2013, (01) :2-7
[3]   学术定义抽取系统实现及实验分析 [J].
刘一宁 ;
郑彦宁 ;
化柏林 .
情报理论与实践, 2011, 34 (12) :15-19
[4]   基于规则的学术概念属性抽取 [J].
丁君军 ;
郑彦宁 ;
化柏林 .
情报理论与实践, 2011, 34 (12) :10-14+33
[5]   当前知识抽取的主要技术方法解析 [J].
张智雄 ;
吴振新 ;
刘建华 ;
徐健 ;
洪娜 ;
赵琦 .
现代图书情报技术, 2008, (08) :2-11
[6]   基于HMM的百科辞典文本中句子的知识点分类 [J].
许勇 ;
宋柔 .
计算机工程与应用, 2005, (04) :35-37+133
[7]   作战文书自动生成系统中内容规划的设计 [J].
郭忠伟 ;
周献中 ;
黄志同 .
火力与指挥控制, 2002, (04) :51-54
[8]   基于语句聚类识别的知识动态提取方法研究 [J].
苏牧 ;
肖人彬 .
计算机学报, 2001, (05) :487-495
[9]  
A novel framework for semantic entity identification and relationship integration in large scale text data[J] . Dingxian Wang,Xiao Liu,Hangzai Luo,Jianping Fan. Future Generation Computer Systems . 2015
[10]  
A knowledge-rich approach to identifying semantic relations between nominals[J] . R. Girju,B. Beamer,A. Rozovskaya,A. Fister,S. Bhat. Information Processing and Management . 2009 (5)