面向文本检索的语义计算

被引:25
作者
赵军
金千里
徐波
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室
基金
北京市自然科学基金;
关键词
文本检索; 自然语言处理; 语义计算; 语义树; 语义张量; TREC评测;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检索的两个关键技术(“标引”和“相似度计算”)中引入语义计算技术,用浅层语义来指导检索过程,提高检索准确率.针对“标引”技术,提出了语义树模型;针对“相似度计算”,基于语义张量的概念,结合自然语言处理的一些技术,提出三个可计算的窗口模型来近似语义张量的核心思想.以上工作在一定程度上实现了语义计算的功能.利用TREC数据集进行的评测表明,采用了语义计算技术后,文本检索的准确率可以提高10%左右.
引用
收藏
页码:2068 / 2078
页数:11
相关论文
共 2 条
[1]  
语言计算与基于内容的文本处理.[M].孙茂松;陈群秀主编;.清华大学出版社.2003,
[2]  
弱指导的统计隐含语义分析及其在跨语言信息检索中的应用.[A].金千里;赵军;徐波;.全国第七届计算语言学联合学术会议.2003,