共 2 条
基于聚类分析的自然语言叙词表的自动构建
被引:11
作者:
杜慧平
[1
]
何琳
[2
]
侯汉清
[3
]
机构:
[1] 南京农业大学信息科技学院
[2] 南京农业大学人文学院
[3] 南京农业大学信息管理系
来源:
关键词:
叙词表;
自然语言;
信息检索;
自动构建;
概念空间;
D O I:
暂无
中图分类号:
G254.24 [叙词法与叙词表];
学科分类号:
1205 ;
120501 ;
摘要:
叙词表为信息标引和检索提供恰当的词汇选择及概念语义关系。手工编制词表费事费时,智力要求高,难以克服认知瓶颈。词表自动构建另辟蹊径,通过统计挖掘语料库中潜在的词汇语义关联。构建方法主要有合并现有词表、用户生成词表、通过语法分析自动构建词表、通过同现分析自动构建词表等。其中通过同现分析构建自然语言词表方法分为词汇收集、关联度计算、聚类分析三个阶段,该方法具有良好的应用前景,对中文信息检索系统具有重要的借鉴意义。参考文献19。
引用
收藏
页码:44 / 49
页数:6
相关论文