基于改进潜在语义分析的跨语言检索

被引:13
作者
宁健
林鸿飞
机构
[1] 大连理工大学计算机科学与技术学院
关键词
计算机应用; 中文信息处理; 改进潜在语义分析; 语义空间; 跨语言检索; SVD; NMF;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索,取得了较好的实验效果
引用
收藏
页码:105 / 111
页数:7
相关论文
共 4 条
[1]   基于锚信息的生物医学文献双语摘要句子对齐 [J].
陈相 ;
林鸿飞 .
中文信息学报, 2009, (01) :58-62+78
[2]  
A Hybrid Technique for English-Chinese Cross Language Information Retrieval[J] . Dong Zhou,Mark Truran,Tim Brailsford,Helen Ashman.ACM Transactions on Asian Language Information Processing (TALIP) . 2008 (2)
[3]   Using latent semantic indexing for multilanguage information retrieval [J].
Berry, MW ;
Young, PG .
COMPUTERS AND THE HUMANITIES, 1995, 29 (06) :413-429
[4]  
Extending query translation to cross-language query expansion with markov chain models .2 Guihong Cao,Jianfeng Gao. Proceedings of the sixteenth ACM conference on Conference on information and knowledge management . 2007