基于聚类分析的自然语言叙词表的自动构建

被引:11
作者
杜慧平 [1 ]
何琳 [2 ]
侯汉清 [3 ]
机构
[1] 南京农业大学信息科技学院
[2] 南京农业大学人文学院
[3] 南京农业大学信息管理系
关键词
叙词表; 自然语言; 信息检索; 自动构建; 概念空间;
D O I
暂无
中图分类号
G254.24 [叙词法与叙词表];
学科分类号
1205 ; 120501 ;
摘要
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系。手工编制词表费事费时,智力要求高,难以克服认知瓶颈。词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联。构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等。其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义。参考文献19。
引用
收藏
页码:44 / 49
页数:6
相关论文
共 2 条
[1]   基于概念空间方法的信息检索技术研究 [J].
朱晓华 .
大学图书馆学报, 2003, (02) :47-53
[2]   汉语叙词表语义场构造分析 [J].
周荣莲 .
图书情报工作, 2000, (08) :41-45