学术探索
学术期刊
文章热点
数据分析
智能智评
立即登录
基于搜索引擎的中文分词评估方法
被引:5
作者
:
王华栋
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学工业工程系
王华栋
论文数:
引用数:
h-index:
机构:
饶培伦
机构
:
[1]
清华大学工业工程系
来源
:
情报科学
|
2007年
/ 01期
关键词
:
中文分词;
搜索引擎;
信息检索;
评估方法;
D O I
:
暂无
中图分类号
:
TP391.3 [检索机];
学科分类号
:
摘要
:
中文分词的结果是影响搜索引擎中文检索结果质量的重要因素,能否准确有效的分词对提高搜索结果的相关性和用户满意度都至关重要。本文回顾和整理了中文分词评估所依靠的理论依据,同时建立了一套完整的基于搜索引擎中文分词评估方法。这套评估方法涵盖了评估样本的提取、评估人员选取、评估标准的制定、以及评估流程的设置等各个方面。实例分析的结果表明此方法是行之有效的。在此基础上,作者进一步对实验评估的结果进行了深入讨论,并提出了提高评估效果的几条建议,包括如何考虑评估人员背景、取舍评估项目等。
引用
收藏
页码:108 / 112
页数:5
相关论文
共 8 条
[1]
汉语分词技术综述
龚汉明
论文数:
0
引用数:
0
h-index:
0
机构:
北京机械工业学院计算机及自动化系
龚汉明
周长胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京机械工业学院计算机及自动化系
周长胜
[J].
北京机械工业学院学报,
2004,
(03)
: 52
-
55+61
[2]
汉语分词的主要技术及其应用展望
王科
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
王科
高常波
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
高常波
翟雪峰
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
翟雪峰
罗万伯
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
罗万伯
[J].
通信技术,
2003,
(06)
: 12
-
15
[3]
汉语自动分词研究评述
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
孙茂松
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
邹嘉彦
[J].
当代语言学,
2001,
(01)
: 22
-
32+77
[4]
现代汉语自动分词评测技术研究
刘开瑛
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系
刘开瑛
[J].
语言文字应用,
1997,
(01)
[5]
书面汉语自动分词系统—CDWS
梁南元
论文数:
0
引用数:
0
h-index:
0
机构:
北京航空学院计算机系
梁南元
[J].
中文信息学报,
1987,
(02)
: 44
-
52
[6]
汉语分词对中文搜索引擎检索性能的影响[J]. 金澎,刘毅,王树梅.情报学报. 2006 (01)
[7]
GB/T 13715-1992. 信息处理用现代汉语分词规范[S]. 1992
[8]
语法讲义[M]. - 商务印书馆 , 朱德熙[著], 1982
←
1
→
共 8 条
[1]
汉语分词技术综述
龚汉明
论文数:
0
引用数:
0
h-index:
0
机构:
北京机械工业学院计算机及自动化系
龚汉明
周长胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京机械工业学院计算机及自动化系
周长胜
[J].
北京机械工业学院学报,
2004,
(03)
: 52
-
55+61
[2]
汉语分词的主要技术及其应用展望
王科
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
王科
高常波
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
高常波
翟雪峰
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
翟雪峰
罗万伯
论文数:
0
引用数:
0
h-index:
0
机构:
四川大学计算机学院
罗万伯
[J].
通信技术,
2003,
(06)
: 12
-
15
[3]
汉语自动分词研究评述
孙茂松
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
孙茂松
邹嘉彦
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学
邹嘉彦
[J].
当代语言学,
2001,
(01)
: 22
-
32+77
[4]
现代汉语自动分词评测技术研究
刘开瑛
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系
刘开瑛
[J].
语言文字应用,
1997,
(01)
[5]
书面汉语自动分词系统—CDWS
梁南元
论文数:
0
引用数:
0
h-index:
0
机构:
北京航空学院计算机系
梁南元
[J].
中文信息学报,
1987,
(02)
: 44
-
52
[6]
汉语分词对中文搜索引擎检索性能的影响[J]. 金澎,刘毅,王树梅.情报学报. 2006 (01)
[7]
GB/T 13715-1992. 信息处理用现代汉语分词规范[S]. 1992
[8]
语法讲义[M]. - 商务印书馆 , 朱德熙[著], 1982
←
1
→