共 16 条
词频分析法中高频词阈值界定方法适用性的实证分析
被引:173
作者:
刘奕杉
王玉琳
李明鑫
机构:
[1] 东北师范大学信息科学与技术学院
来源:
关键词:
高频词;
文献计量学;
词频分析;
D O I:
暂无
中图分类号:
G353.1 [情报资料的分析和研究];
学科分类号:
摘要:
词频分析法是文献计量学的重要分析方法之一,而确定高频词阈值是进行词频分析的必要前提,高频词阈值的选取不仅决定词频分析法的分析结果,而且对整个分析研究都有着极其重要的影响。本文首先以近三年国内运用词频分析法展开研究的文献为调研基础,发现目前学界常用的高频词阈值选取方法主要有自定义选取法、高低频词界定公式选取法、普赖斯公式选取法及混合选取法四类;其次,以个人知识管理领域的文献为研究对象,对前三类高频词阈值选取方法分别进行取值计算并做领域热点聚类分析,对比验证聚类结果,同时以此结果为基础讨论高频词阈值选择对分析结果的影响及其合理性;最后,指出我国学界在高频词阈值选取方面存在主观性强、方法原理不明、改进方法适用性不明,高低频词界定公式和普赖斯公式适用性尚待研究等问题。
引用
收藏
页码:42 / 49
页数:8
相关论文