基于搜索引擎的中文分词评估方法

被引:5
作者
王华栋
饶培伦
机构
[1] 清华大学工业工程系
关键词
中文分词; 搜索引擎; 信息检索; 评估方法;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
中文分词的结果是影响搜索引擎中文检索结果质量的重要因素,能否准确有效的分词对提高搜索结果的相关性和用户满意度都至关重要。本文回顾和整理了中文分词评估所依靠的理论依据,同时建立了一套完整的基于搜索引擎中文分词评估方法。这套评估方法涵盖了评估样本的提取、评估人员选取、评估标准的制定、以及评估流程的设置等各个方面。实例分析的结果表明此方法是行之有效的。在此基础上,作者进一步对实验评估的结果进行了深入讨论,并提出了提高评估效果的几条建议,包括如何考虑评估人员背景、取舍评估项目等。
引用
收藏
页码:108 / 112
页数:5
相关论文
共 8 条