共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析

被引:8
作者
钟伟金
机构
[1] 广东医学院图书馆
关键词
同义词识别; 互信息法; 概率法; 共现词;
D O I
暂无
中图分类号
G353 [情报资料的处理];
学科分类号
1205 ;
摘要
以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。
引用
收藏
页码:122 / 126
页数:5
相关论文
共 15 条
[1]   基于Mesh词表和共词分析的疾病本体半自动构建方法研究 [J].
刘菊红 ;
于建荣 ;
缪有刚 .
现代情报, 2009, (03) :208-211
[2]   共词分析法研究(一)——共词分析的过程与方式 [J].
钟伟金 ;
李佳 .
情报杂志, 2008, (05) :70-72
[3]   互信息理论及其在战略情报研究中的应用 [J].
梁潇 .
现代情报, 2007, (12) :5-8
[4]   基于互信息构建关键词—叙词对照表的研究 [J].
陈先来 ;
肖晓旦 ;
杜方冬 .
情报理论与实践 , 2006, (05) :567-569
[5]   医学关键词与叙词对照表自动构建研究 [J].
朱伟丽 ;
韩宇 ;
肖晓旦 ;
陈先来 .
现代图书情报技术 , 2006, (08) :51-54
[6]   医学期刊关键词标注与CBMdisc 叙词标引对照研究 [J].
杨凝清 ;
刘宁 .
中国科技期刊研究, 2006, (04) :590-592
[7]   用于中文信息自动分类的《中图法》知识库的构建 [J].
侯汉清 ;
薛春香 .
中国图书馆学报, 2005, (05) :82-86
[8]   用于信息检索的同义词自动识别及其进展 [J].
陆勇 ;
侯汉清 .
南京农业大学学报(社会科学版), 2004, (03) :87-93
[10]   试论图书馆从信息服务走向知识服务 [J].
田红梅 .
情报理论与实践, 2003, (04) :312-314