词性标注对信息检索系统性能的影响

被引:9
作者
苏祺
昝红英
胡景贺
项锟
机构
[1] 北京大学计算语言学研究所
关键词
人工智能; 自然语言处理; 信息检索; 向量空间模型; 词性标注; SMART;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
在信息检索中引入NLP技术是信息检索发展的主要趋势 ,本文将NLP中较为成熟的词性标注技术加入信息检索 ,采用大规模TREC数据集 ,试图发现词性标注对检索系统性能的影响。笔者在SMART检索系统上使用不同标注集、不同索引项权重进行了检索实验。实验表明 ,在信息检索中加入词性标注信息可能会对某些特定Topic和Document的检索效果有所改进 ,但词性标注的影响能力弱于索引项权重选择的影响能力。词性标注对检索性能的影响涉及到Topic和Document中的具体用词 ,普遍规律有待进一步研究。
引用
收藏
页码:58 / 65
页数:8
相关论文
empty
未找到相关数据