词汇间语义相关关系量化计算方法

被引:18
作者
钟茂生 [1 ,2 ]
刘慧 [1 ]
刘磊 [1 ]
机构
[1] 上海交通大学计算机科学与工程系
[2] 华东交通大学信息工程学院
关键词
计算机应用; 中文信息处理; 词汇间语义关系; 相关关系; 互信息; 二分图; 量化方法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
词汇间语义关系的定量化研究是自然语言处理任务中一个重要的基础性工作。词汇间语义关系总体上分为等同关系、上下位关系、相关关系,现有的语义关系定量化工作主要集中于词汇间语义的等同关系(相似性)量化研究。该文研究和提出了量化词汇间语义相关关系的基本思路和新方法,即构造词汇相关关系二分图来求解和量化词汇间间接相关关系,该方法能够解决在统计语料中没有出现的词汇对的相关关系量化求解问题。实验结果表明,该文提出的方法比单纯用互信息来计算和量化词汇间语义相关关系更为可行。同时,对于一个特定词汇而言,该文的方法能够得到一个相关关系量化的相对合理的趋势性结果。
引用
收藏
页码:115 / 122
页数:8
相关论文
共 4 条
[1]   基于知识图的汉语词语间语义相似度计算 [J].
张晓孪 ;
张蕾 ;
王西锋 .
计算机工程与应用 , 2007, (08) :160-163
[2]   基于Corpus库的词语相似度计算方法 [J].
章志凌 ;
虞立群 ;
陈奕秋 ;
罗海飞 ;
邵晓敏 .
计算机应用, 2006, (03) :638-640+644
[3]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[4]  
信息组织的主题语言[M]. 武汉大学出版社 , 张燕飞编著, 2005