基于《知网》的词语相似度计算研究

被引:11
作者
袁晓峰
机构
[1] 盐城师范学院信息科学与技术学院
关键词
知网; 义原; 相似度; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
词语之间相似度的计算通常有基于统计和基于世界知识2种方法.中文词语相似度的计算,可以通过计算义原的相似度进而计算词语的相似度,在此基础之上深入分析《知网》的义原层次体系,提出了一种将义原在层次体系树上的深度和区域密度2个因素添加到义原相似度计算中的方法.通过实验发现,考虑义原在层次体系树上的深度和区域密度得到的结果比不考虑这2个因素得到结果更符合实际.
引用
收藏
页码:339 / 341
页数:3
相关论文
共 1 条
[1]
汉英双语语料库自动对齐研究 [D]. 
王斌 .
中国科学院研究生院(计算技术研究所),
1999