基于混合策略的中文查询串相似度计算

被引:3
作者
章成敏
鞠海燕
不详
机构
[1] 中国药科大学图书馆
[2] 南京农业大学工学院 南京
[3] 南京
关键词
查询串相似度; 语义相似度; 字面相似度; 语用相似度;
D O I
暂无
中图分类号
G354 [情报检索];
学科分类号
摘要
综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。
引用
收藏
页码:103 / 105+107
页数:4
相关论文
共 2 条
[1]  
同义词词林[M]. - 上海辞书出版社 , 梅家驹, 1983
[2]   Semantic computation in a Chinese question-answering system [J].
Li, SJ ;
Zhang, J ;
Huang, X ;
Bai, S ;
Liu, Q .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2002, 17 (06) :933-939