共词分析过程中的若干问题研究

被引:107
作者
李纲 [1 ]
巴志超 [2 ]
机构
[1] 武汉大学信息资源研究中心
[2] 不详
关键词
共词分析; 词源选择; 术语规范化; 高频词选定; 语义关联; 多元统计分析;
D O I
10.13530/j.cnki.jlis.170006
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
摘要
为完善和优化共词分析方法,本文从共词分析过程中概念术语的词源选择、高频词的选定、术语相关性计算以及多元统计分析四个方面系统地总结共词分析存在的局限性。在词源选择方面,论述不同类型的文献分析单元、术语的规范化以及术语表征差异性对共词分析的影响;在高频词选定方面,分析国内外相关研究在设定高频词阈值、考虑术语语义类型特征以及低频关键词处理等问题时存在的不足,并提出相应的解决方法;在术语相关性计算方面,认为术语之间不仅存在着直接的频次共现,还存在间接的语义相关,总结现有的术语语义相关性度量方法,并对其相关特征进行分析;在多元统计分析方面,对共词分析中常采用的统计分析方法和应用策略进行探讨。本文基于严谨、客观的态度对共词分析的优缺点做出评价,有利于该方法的不断完善和发展,同时也为继续从事共词分析研究的人员提供理论借鉴和实践参考。
引用
收藏
页码:93 / 113
页数:21
相关论文
共 49 条
[1]   共词分析中术语收集阶段的若干问题研究 [J].
傅柱 ;
王曰芬 .
情报学报, 2016, 35 (07) :704-713
[2]   医学文献语义共词知识网的构建:方法与实证 [J].
张晗 ;
赵玉虹 .
图书情报工作, 2016, (11) :135-142
[3]   基于关联规则挖掘竞争情报研究前沿分析 [J].
李牧南 .
情报杂志, 2016, 35 (03) :54-60
[4]   共现分析中的关键词选择与语义度量方法研究 [J].
巴志超 ;
李纲 ;
朱世伟 .
情报学报, 2016, (02) :197-207
[5]   融入内容信息的作者共被引分析——以学科服务研究主题为例 [J].
李秀霞 ;
邵作运 .
图书情报工作, 2016, 60 (01) :98-104+141
[6]   基于图挖掘的文本主题识别方法研究综述 [J].
郭红梅 ;
张智雄 .
中国图书馆学报, 2015, 41 (06) :97-108
[7]   一种基于加权LDA模型和多粒度的文本特征选择方法 [J].
李湘东 ;
巴志超 ;
黄莉 .
现代图书情报技术, 2015, (05) :42-49
[8]   基于共词分析法的学科主题演化研究进展与分析 [J].
唐果媛 ;
张薇 .
图书情报工作, 2015, 59 (05) :128-136
[9]   多词共现分析方法的实现及其在研究热点识别中的应用 [J].
高继平 ;
丁堃 ;
潘云涛 ;
袁军鹏 .
图书情报工作, 2014, 58 (24) :80-85+98
[10]   国内外共词分析法研究的发展与分析 [J].
唐果媛 ;
张薇 .
图书情报工作, 2014, 58 (22) :138-145