一种基于齐普夫定律的确定语料中高低词频分界点的新方法——以科学计量研究为例

被引:28
作者
叶飞 [1 ,2 ]
宋志强 [1 ]
机构
[1] 南开大学商学院信息资源管理系
[2] 农业部环境保护科研监测所
关键词
齐普夫定律; 科学计量; 研究热点; 高频词; 低频词; 分界点;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
120502 [情报学];
摘要
确定一定数量的高频词是识别研究热点的基础性工作,但是目前对于如何确定高低词频的分界点还缺乏客观的、行之有效的方法。本研究以2002~2011年收录入Web of Science SCI中934篇科学计量相关文献为语料,分析了齐普夫定律中的常数变化规律,进而基于统计分析创建了一种确定语料中高低词频分界点的新方法。通过比较分析发现,相对于已有的方法,本方法在识别高频词方面具有数量和稳定性两方面的双重优势。应用该方法识别科学计量学的研究热点,发现10年来科学计量研究领域已形成一系列成熟、稳定的研究议题,如引文分析、期刊影响因子、产出评价等。同时这一领域也处于不断发展之中,引文分析方法的成熟和h指数等新型研究议题的兴起使这一领域的研究正在走向深化。
引用
收藏
页码:1196 / 1203
页数:8
相关论文
共 22 条
[1]
g指数在共词分析主题词选取中的应用研究 [J].
杨爱青 ;
马秀峰 ;
张风燕 ;
薛卫双 .
情报杂志, 2012, 31 (02) :52-55+74
[2]
h指数在学科研究热点分析中的应用——以图情学为例 [J].
肖可 .
情报杂志, 2011, 30 (03) :69-73
[3]
信息计量学三大基本定律在中国的研究与发展 [J].
朱琳 ;
张宇 .
情报科学, 2011, 29 (02) :216-221
[4]
2000-2009年国内高校图书馆与公共图书馆研究热点概观——基于期刊论文关键词词频统计及共现分析 [J].
余丰民 ;
董珍时 ;
汤江明 .
图书情报工作, 2010, (19) :32-36
[5]
期刊文献计量与知识图谱对《情报科学》的解读 [J].
姜春林 ;
李江波 ;
杜维滨 .
情报科学, 2009, 27 (02) :166-174
[6]
基于主题词频和g指数的研究热点分析方法 [J].
赵星 ;
高小强 ;
郭吉安 ;
陶乃航 .
图书情报工作, 2009, (02) :59-61+7
[7]
中文歌词的统计特征及其检索应用 [J].
郑亚斌 ;
刘知远 ;
孙茂松 .
中文信息学报, 2007, (05) :61-67
[8]
基于关键词的情报学研究主题分析 [J].
魏瑞斌 .
情报科学 , 2006, (09) :1400-1404+1434
[9]
布-齐-洛三种分布的相似性证明[J] 徐兴余 情报理论与实践 2002, 04
[10]
Zipf定律与汉字字频分布[J] 游荣彦 中文信息学报 2000, 03