GMAP:一种基于AP聚类的共词分析方法

被引:10
作者
郭崇慧 [1 ,2 ]
曹梦月 [1 ]
机构
[1] 大连理工大学系统工程研究所
[2] 软件架构国家重点实验室(东软集团)
关键词
共词分析; g指数; 互信息; AP聚类;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
摘要
文献计量学领域中的共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题,导致了领域主题发现容易存在偏差。本文针对传统共词分析方法存在的缺陷提出了一种新的共词分析方法——GMAP共词分析方法,即将g指数、互信息概念以及AP聚类算法融入共词分析方法中。首先,使用g指数确定高频关键词的个数;其次,使用互信息概念对共现矩阵进行包容化处理;最后,使用AP算法进行聚类得出领域主题。为了验证GMAP的可行性和有效性,对中国古村落(传统村落)领域文献进行数值实验,结果显示GMAP共词分析法优于传统共词分析方法,为改进共词分析方法提供了一个新的研究思路。
引用
收藏
页码:1192 / 1200
页数:9
相关论文
共 15 条
[1]  
共词聚类分析法中的主要问题与对策[J]. 李佳.  报学报. 2010 (04)
[2]   基于近邻传播算法的半监督聚类 [J].
肖宇 ;
于剑 .
软件学报, 2008, (11) :2803-2813
[3]  
共现聚类分析的新方法:最大频繁项集挖掘[J]. 徐硕,乔晓东,朱礼军,张运良,薛春香.  报学报. 2012 (02)
[4]  
Co-word analysis as a tool for describing the network of interactions between basic and technological research: The case of polymer chemsitry[J] . M. Callon,J. P. Courtial,F. Laville. &nbspScientometrics . 1991 (1)
[5]   Research patterns and trends of Recommendation System in China using co-word analysis [J].
Hu, Jiming ;
Zhang, Yin .
INFORMATION PROCESSING & MANAGEMENT, 2015, 51 (04) :329-339
[6]   基于PubMed的共词聚类分析方法 [J].
冒纯丽 ;
曹春萍 .
电子科技, 2016, (02) :53-57
[7]   g指数在共词分析主题词选取中的应用研究 [J].
杨爱青 ;
马秀峰 ;
张风燕 ;
薛卫双 .
情报杂志, 2012, 31 (02) :52-55+74
[8]  
Reception of integrative and complementary medicine (ICM) in scientific journals: a citation and co-word analysis[J] . Jenny-Ann Brodin Danell. &nbspScientometrics . 2014 (2)
[9]  
Research trends in gender differences in higher education and science: a co-word analysis[J] . Tahereh Dehdarirad,Anna Villarroya,Maite Barrios. &nbspScientometrics . 2014 (1)
[10]  
Dynamic topic detection and tracking: A comparison of HDP , C‐word, and cocitation methods[J] . Wanying Ding,Chaomei Chen. &nbspJ Assn Inf Sci Tec . 2014 (10)