面向文本检索的语义计算

被引：25

作者：

赵军

金千里

徐波

机构：

[1] 中国科学院自动化研究所模式识别国家重点实验室

来源：

计算机学报 | 2005年 / 12期

基金：

北京市自然科学基金;

关键词：

文本检索; 自然语言处理; 语义计算; 语义树; 语义张量; TREC评测;

D O I：

暂无

中图分类号：

TP391.3 [检索机];

学科分类号：

081203 ; 0835 ;

摘要：

随着信息社会尤其是互联网的发展,人们对文本检索的要求越来越高.作为对传统关键词匹配技术的改进,智能检索研究已经成为热点,并将是支撑下一代互联网的核心技术之一.将语义计算技术应用于文本检索,是智能检索的重要方向.文中在文本检索的两个关键技术(“标引”和“相似度计算”)中引入语义计算技术,用浅层语义来指导检索过程,提高检索准确率.针对“标引”技术,提出了语义树模型;针对“相似度计算”,基于语义张量的概念,结合自然语言处理的一些技术,提出三个可计算的窗口模型来近似语义张量的核心思想.以上工作在一定程度上实现了语义计算的功能.利用TREC数据集进行的评测表明,采用了语义计算技术后,文本检索的准确率可以提高10%左右.

引用

页码：2068 / 2078

页数：11