共 1 条
文本分类中结合评估函数的TEF-WA权值调整技术
被引:25
作者:
唐焕玲
孙建涛
陆玉昌
机构:
[1] 烟台职业学院计算机与信息工程系
[2] 清华大学计算机科学与技术系
[3] 清华大学计算机科学与技术系 烟台
[4] 清华大学计算机科学与技术系 北京
[5] 北京
[6] 北京
来源:
基金:
国家自然科学基金重大项目;
关键词:
向量空间模型(VSM);
特征选择;
权重调整;
特征评估函数;
文本分类;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
文本自动分类面临的难题之一是如何从高维的特征空间中选取对文本分类有效的特征,以适应文本分类算法并提高分类精度.针对这一问题,在分析比较特征选择和权值调整对文本分类精度和效率的影响后,提出了一种结合评估函数的TEF-WA权重调整技术,设计了一种新的权重函数,将特征评估函数蕴含到权值函数,按照特征对文本分类的辨别能力调整其在分类器中的贡献.实验结果证明了TEF-WA权值调整技术在提高分类精度和降低算法的时间复杂度方面都是有效的.
引用
收藏
页码:47 / 53
页数:7
相关论文