文本分类性能评价研究

被引:38
作者
奉国和
机构
[1] 华南师范大学经济管理学院信息管理系
关键词
文本分类; 标准数据集; 评价指标;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本分类是信息处理的关键技术之一,分类性能评价是其重要组成部分。论文研究了文本分类评价的影响因素,并就评价中两个必需要素:标准数据集与评价指标进行了阐述分析。指出只有建立规范的评价平台,构建合理的评价指标,才能有效地对分类结果进行评价,才能更好地促进文本分类技术发展。
引用
收藏
页码:66 / 70
页数:5
相关论文
共 13 条
[1]   文本分类的性能评估指标 [J].
张启蕊 ;
董守斌 ;
张凌 .
广西师范大学学报(自然科学版), 2007, (02) :119-122
[2]   基于内容的垃圾邮件过滤技术综述 [J].
王斌 ;
潘文锋 .
中文信息学报, 2005, (05) :1-10
[3]   文本分类器性能评估指标 [J].
宋枫溪 ;
高林 .
计算机工程, 2004, (13) :107-109+127
[4]   文本分类系统的评价因素探讨 [J].
王小华 ;
张国煊 ;
陆蓓 .
杭州电子工业学院学报, 2002, (03) :11-14
[5]  
文本分类器稳定性评估研究[J]. 程泽凯,林士敏.情报学报. 2005 (01)
[6]  
文本分类及其相关技术研究[D]. 李荣陆.复旦大学. 2005
[7]  
中文文本信息处理的原理与应用[M]. - 清华大学出版社 , 苗夺谦, 2007
[8]  
中文信息处理若干重要问题[M]. - 科学出版社 , 徐波等主编, 2003
[9]   The role of manually-assigned keywords in query expansion [J].
Taghva, K ;
Borsack, J ;
Nartker, T ;
Condit, A .
INFORMATION PROCESSING & MANAGEMENT, 2004, 40 (03) :441-458
[10]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47