共 3 条
汉语词汇字面相似性原理与后控制词表动态维护研究
被引:20
作者:
宋明亮
机构:
[1] 《解放军报》社资料中心
来源:
关键词:
汉语词汇分类,字面相似度,后控制词表;
D O I:
暂无
中图分类号:
G354 [情报检索];
学科分类号:
摘要:
本文在研究汉语词汇归类问题的基础上,论证了利用汉语字面相似性原理进行后控制词表动态维护的可行性和实施步骤。结论是:汉语词汇之间的字面相似度有八种可能性,根据不同的相似度可将待归类词与被匹配词之间的聚类关系分成三级:A级为根据字面相似度给出的类号一般来说是正确的;B级为根据字面相似度给出的类号不一定正确;C级为无法根据字面相似度给出类号。而后两种情况只有依赖专家知识来完成,因此,利用字面相似性原理进行后控制词表的动态维护应是一条人机结合的道路,这实际上是一种机助的词表维护方法
引用
收藏
页码:22 / 32
页数:11
相关论文