一种结合同义词典和词对共现距离的查询扩展方法

被引:5
作者
霍林
王力
黄俊文
潘英花
机构
[1] 广西大学计算机与电子信息学院
关键词
查询扩展; 同义词词典; 概率统计; 语料库;
D O I
10.13624/j.cnki.issn.1001-7445.2010.02.030
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
为了在检索过程中全面表达查询意愿,提出一种结合同义词典和词对共现距离的查询扩展方法。横向利用同义词典方法进行扩展,发挥它的简单、高效优势;纵向利用可观察的语言事实统计上下文词对的共现距离,从而对词汇语义相关性进行精确和有效的度量,用简洁、相关的词来扩展查询词。实验表明,该方法在实际搜索引擎中有较好效果。
引用
收藏
页码:303 / 309
页数:7
相关论文
共 8 条
[1]   语义查询扩展中词语-概念相关度的计算 [J].
田萱 ;
杜小勇 ;
李海华 .
软件学报, 2008, (08) :2043-2053
[2]   一种基于语义单元的查询扩展方法 [J].
李莉 ;
高庆狮 .
计算机科学, 2008, (02) :201-204
[3]   基于Corpus库的词语相似度计算方法 [J].
章志凌 ;
虞立群 ;
陈奕秋 ;
罗海飞 ;
邵晓敏 .
计算机应用, 2006, (03) :638-640+644
[4]   基于用户日志的查询扩展统计模型 [J].
崔航 ;
文继荣 ;
李敏强 .
软件学报, 2003, (09) :1593-1599
[5]   唐宋诗中词汇语义相似度的统计分析及应用 [J].
胡俊峰 ;
俞士汶 .
中文信息学报, 2002, (04) :39-44
[6]   汉英双语库自动分段对齐研究 [J].
王斌 ;
刘群 ;
张祥 .
软件学报, 2000, (11) :1547-1553
[7]  
同义词词林[M]. 上海辞书出版社 , 梅家驹等编, 1996
[8]  
Similarity-Based Models of Word Cooccurrence Probabilities[J] . Ido Dagan,Lillian Lee,Fernando C. N. Pereira.Machine Learning . 1999 (1)