学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
词性标注对信息检索系统性能的影响
被引:9
作者
:
论文数:
引用数:
h-index:
机构:
苏祺
昝红英
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
昝红英
胡景贺
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
胡景贺
项锟
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
项锟
机构
:
[1]
北京大学计算语言学研究所
来源
:
中文信息学报
|
2005年
/ 02期
关键词
:
人工智能;
自然语言处理;
信息检索;
向量空间模型;
词性标注;
SMART;
D O I
:
暂无
中图分类号
:
TP391.3 [检索机];
学科分类号
:
摘要
:
在信息检索中引入NLP技术是信息检索发展的主要趋势 ,本文将NLP中较为成熟的词性标注技术加入信息检索 ,采用大规模TREC数据集 ,试图发现词性标注对检索系统性能的影响。笔者在SMART检索系统上使用不同标注集、不同索引项权重进行了检索实验。实验表明 ,在信息检索中加入词性标注信息可能会对某些特定Topic和Document的检索效果有所改进 ,但词性标注的影响能力弱于索引项权重选择的影响能力。词性标注对检索性能的影响涉及到Topic和Document中的具体用词 ,普遍规律有待进一步研究。
引用
收藏
页码:58 / 65
页数:8
相关论文
未找到相关数据
未找到相关数据