科技论文关键词特征及其对共词分析的影响

被引:69
作者
胡昌平
陈果
机构
[1] 武汉大学信息资源研究中心
关键词
共词分析; 关键词特征; 词频分布; 情报学;
D O I
暂无
中图分类号
G350 [情报学];
学科分类号
1205 ;
摘要
针对传统共词分析中高频词共现矩阵的构建方法提出了一些疑问,包括:抽取高频词作为分析对象的可靠性、高频词矩阵对领域内重要共现关系的保留程度、关键词的语义类型特征和关键词缺失可能带来的影响。通过实证数据揭示了科技论文的关键词词频、共现关系、语义类型的分布特征,并分析了它们对共词分析方法的影响,包括:基于关键词的共词分析只能分析热门知识节点,共词网络实质上是建立在不稳定的单次关联基础之上,而高频词矩阵则会丢失大量重要的共现关系,这些问题是由关键词的语义类型特征决定的,该特征是实现词语间差异化乃至语义化处理的重要切入点。另外,本文在对比关键词增补前后的共词矩阵后发现,增补关键词实质上无法优化高频词矩阵对所分析领域的代表性。在结尾部分,提出了两种可尝试的思路:一是结合关键词频次和共现关系强度抽取分析对象;二是以关键词语义类型为维度构建多维共现矩阵以更好地挖掘多种语义关联。
引用
收藏
页码:23 / 32
页数:10
相关论文
共 18 条
[1]  
用共关键词网络揭示领域知识结构的实验研究[J]. 叶鹰,张力,赵星,Ronald Rousseau.情报学报. 2012 (12)
[2]   科技论文关键词的战略图分析 [J].
韩红旗 ;
安小米 .
情报理论与实践, 2012, (09) :86-90
[3]   文本分类中的特征降维方法研究 [J].
张玉芳 ;
万斌候 ;
熊忠阳 .
计算机应用研究, 2012, 29 (07) :2541-2543
[4]  
共现聚类分析的新方法:最大频繁项集挖掘[J]. 徐硕,乔晓东,朱礼军,张运良,薛春香.情报学报. 2012 (02)
[5]   g指数在共词分析主题词选取中的应用研究 [J].
杨爱青 ;
马秀峰 ;
张风燕 ;
薛卫双 .
情报杂志, 2012, 31 (02) :52-55+74
[6]   加权共词分析法研究 [J].
杨彦荣 ;
张阳 .
情报理论与实践, 2011, (04) :61-63
[8]   一种基于关键词加权的共词分析方法 [J].
李纲 ;
李轶 .
情报科学, 2011, 29 (03) :321-324+332
[9]   基于Mesh词表和共词分析的疾病本体半自动构建方法研究 [J].
刘菊红 ;
于建荣 ;
缪有刚 .
现代情报, 2009, (03) :208-211
[10]   基于文献计量的共词分析研究进展 [J].
廖胜姣 ;
肖仙桃 .
情报科学 , 2008, (06) :855-859